数据分析的框架和常用方法

研究方法 2020-03-16  星期一 软妹 3567字 数据分析

第一部分:數據分析框架

為了分析問題的聚焦,我們具體拿互聯網電商來舉例子說明,至於其他的比如互聯網金融、教育、社交等等,可以依此借鑒。

(1)從互聯網實體角度分析。我們可以從以下7個角度構建互聯網數據分析體系。

買家:基本特徵分析、交易行為分析、流量行為分析、售後滿意分析等

賣家:基本特徵分析、經營效果分析、流量曝光分析、售後滿意分析、產品分析等

產品:基本特徵分析、交易行為分析、流量曝光分析、售後滿意分析等

行業:基本特徵分析、經營分析、曝光分析、售後分析、產品分析、買賣家分析等

設備:行動端分析、PC端分析、訪問對象分析、cookie分析、session分析等

日誌:訪問對象URL分析、cookie分析、session分析等

事件:登錄、流量、點擊、曝光、下單、交易、支付、物流、評價、糾紛、仲裁等分析

這個實體分析方法,可以稱得上是萬能的數據分析框架,適用於所有的互聯網企業。我曾工作過的阿里巴巴、騰訊、隨手記等企業,我個人都是按照這個套路去構建互聯網的分析體系。

(2)從用戶的關鍵路徑進行分析。

關鍵路徑分析方法是一個行之有效的常用分析方法,也是做數據化運營的常用工具。關鍵路徑分析讓我們聚焦於核心環節,排除雜音,定位出業務的核心問題,快速的加以解決。在應用關鍵路徑分析時候,我們往往先把可能的結果、以及最關心的結果梳理出來,以結果為導向追溯行為的根本,當然,也可以從行為的初始出發,梳理出所有可能的行為路徑,找出關鍵行為,導向我們最終設計好的結果中去。下面我們舉例子說明下:

在電商網站中,我們假設我們運營目標是讓用戶購買網站上的商品(在這裡,我要插說幾句,我們的目標有時候不只是購買,在精細化運營中,往往會根據用戶的生命周期,確定關鍵路徑的目標,比如對於一個進入期的新買家,我們通常會發一些購物攻略加以指導,針對流失期的買家,關鍵路徑的結果我們可能導向申領我們的優惠劵之類,等等。關於這一部分數據化精細化運營方面,在大數據應用系列的數據化運營小講,我們會詳細加以分享,敬請關注)。剛才談到,我們假設我們運營目標是讓用戶購買網站上的商品,那麼我們可以把關鍵路徑,也即,用戶的購買路徑梳理出來:

a.用戶登錄/註冊》搜索關鍵詞》查看商品詳情》加入購物車》點擊下單》確認付款》確認收貨

b.用戶搜索關鍵詞》類目和店鋪》賣家交流》點擊下單》確認付款》確認收貨

通過這種關鍵路徑,我們還常常進行漏斗分析,從而進行流量的轉化分析,找出影響到達最終結果的關鍵環節。

(3)從KPI拆解角度分析。

KPI拆解分析方法也是比較常見的互聯網分析方法。核心思想是先定一個總體目標,比如今年營收12億,那麼可以把這個指標拆解到各個業務線去,業務線再進行拆分,比如分解為12個月,每個月需要達成營收額,接著,就是達成該營收額,根據流量的轉化情況,估算出需要多少的流量,目前平台已有多少流量,需要外拓引流多少流量才能達成目標,這就可以層層的拆解指標,最終或落地到產品團隊或部分到運營團隊去承擔KPI任務。

第二部分:數據分析常用分析方法

常用的數據分析方法有:PEST分析方法、5W2H分析法、4P營銷分析法、邏輯樹分析法、指標拆分法、對比分析法、漏斗分析法、用戶行為分析法、用戶生命周期分析法、金字塔分析法等等,下面我們逐個的簡單說明下

(1)PEST分析方法

這個方法主要應用於行業研究中。從政治(Political)、經濟(Economic)、社會(Social)、技術(Technical),簡稱PEST角度對一個行業進行比較分析。下面我們舉一個例子:我們小講開始就談到數據分析行業前景,那麼我們在此利用PEST分析下大數據行業前景如何?

(2)5W2H分析法

這個方法主要應用於用戶行為研究和專項問題分析,從時間、地點、人物、事情、原因、方式、價格等7個方面對一個問題進行刻畫研究。請看如下案例二:

(3)4P營銷理論

這個方法主要應用於公司整體經營狀況分析,是比較經典的營銷分析方法。該方法從產品、價格、渠道、促銷等四方面對企業經營狀況進行全面分析。請看如下案例三:


(4)邏輯樹分析法

這個方法也稱作問題樹分析方法,主要應用於針對業務存在的問題進行專題分析,是數據分析方法中非常常見的一種分析方法。請看案例四:

(5)指標拆分法

這個方法也是經常適用的方法,特別是為了達成業務目標,我們往往都會先定一個總的目標,然後再初步的拆解指標。下面我們講講案例五:

(6)對比分析法

對比分析法是非常常用的基礎分析方法,雖然方法特別簡單,但幾乎所有的分析報告中,都會採取對比分析方法。比如去年同期相比、上個月環比、目標和實際達成相比、各個部門和業務線相比、行業內競品比較、行銷效果對比,等等。這裡需要注意的是我們不管是橫向比較還是縱向比較,比較的雙方一定要有可比性,並且在同一個維度、粒度上去比較,要不是毫無意義的。

(7)漏斗分析法

漏斗分析方法經常應用於產品的轉化分析。舉個電商的例子:用戶登錄網站1千萬,瀏覽商品詳情頁200萬,加入購物車80萬,下單支付50萬,支付成功40萬。每一步都是轉化率的問題。針對關鍵路徑進行漏斗分析能夠幫助我們快速的定位到問題所在。從而能夠及時做出決策。

(8)用戶行為理論

也稱用戶的活動周期理論。該分析方法,往往用於對用戶的基礎研究中。用戶行為過程分為認知、熟悉、試用、使用和忠誠5個步驟。

(9)用戶生命周期理論

該分析方法,也往往用於用戶基礎研究中,在互聯網領域應用廣泛。用戶的生命周期分為進入期、成長期、成熟期、衰退期、流失期。每一個階段用戶的行為特徵是不一樣的,其價值是不一樣的,需要精細化的運營。不可急功近利。

(10)金字塔理論

金字塔這個分析方法正好和漏斗分析方法相反,它是基數大,上層小。最初是英國歷史學家、政治學家諾斯科特·帕金森(C.Northcote Parkinson)在《帕金森定律》(Parkinson’s Law)一書中,論述在行政管理中,行政機構會像金字塔一樣不斷增多,行政人員不斷膨脹,每個人都很忙,但組織效率越來越低下。這條定律又被稱為「金字塔上升」現象。後來,人們將這一理論延伸應用,不再只限於本意。大凡是基數大,上層小,符合金字塔特徵的研究分析都可以套用到該理論中。所以,金字塔這幅圖也常常見於各分析報告中。比如,分析用戶群體特徵(馬斯洛需求層次模型、用戶價值模型等等)

綜上所述種種數據分析方法,如果在一份分析報告中,能夠把這些分析方法都靈活反覆體現和應用,那麼,這個分析報告一定會比較豐滿的。

第三部分:數據分析的流程

數據分析的流程主要分為六步驟,遵循這種方法,一個完整的數據分析項目就出來了。

(1)明確分析目的:我們接到一個分析任務,首先要弄清楚我們分析的對象是什麼,要達成怎樣的目的,不能陷於為了分析而分析。然後,要熟悉行業和業務,透徹的理解分析的目的,構建起分析的角度和體系。

(2)進行數據準備:我們有哪些數據,通過什麼途徑可以獲取到需要的數據,往往涉及到內部數據和外部數據,內部數據常常是我們的業務庫或者基礎數據團隊建立起來的數據倉庫系統,外部數據方面,現在各行各業都有大數據交易源,還有大量的公開市場數據。

(3)進行數據加工處理:主要通過數據清洗工作,對重複值進行去重處理、對異常值錯誤值進行修正或剔除、對缺失值進行填充修正或刪除。如果軟體環境為支持大數據量情況下,還需要對數據進行抽樣處理。經過這些預處理後,最重要的就是進行數據的計算統計、合并轉換,讓數據符合目標分析過程。

(4)進行數據分析挖掘:絕大部分的分析目標達成都可以剛才介紹的分析方法外加常見統計分析等達到。主要的分析:整體和組成分析、走勢趨勢分析、均值方差分析、排序TOP分析、同比環比縱橫比較分析、頻度頻率分析、相關關係分析、數量和比例的雙坐標分析、邏輯結構分析、金字塔分析、漏斗圖分析、矩陣圖分析、指標拆解分析、PEST分析、5W2H分析法、4P營銷分析等等。還有一部分分析需要到更高級的數據分析方法才能得到結論。

(5)進行數據結果圖表展現:數據分析的目的就是要解決問題的,往往數據分析師不是需求的發起人,那麼這就需要數據分析師把分析的數據和結論展現給需求方。最佳的方式就是通過圖表,有理有據形象的重點突出且專業的表達出來。根據第(4)步驟的分析,我們可以選取恰當的圖標。比如常用的有:折線圖、柱形圖、條形圖、餅圖、冒泡圖、散點圖、矩陣圖、雷達圖、雙坐標圖、瀑布圖、帕累托圖、金字塔圖、漏斗圖等等。

(6)寫出分析報告:數據分析最終的結論全部體現在分析報告中,一個分析師水平如何,只要看他寫過的一份分析報告就可以完全清楚了。綜合靈活應用這麼多的分析方法和各種各樣的展示圖表,分析報告一定會顯得非常豐滿。