首頁>資訊 >
大合集:數(shù)據(jù)分析9大基礎(chǔ)方法匯總 2021-11-01 15:23:27  來源:36氪

‘你做數(shù)據(jù)分析有啥方法論?’無論是工作還是面試,此問題一出,都會難倒一片同學(xué)。媽耶,每天照單跑數(shù)就知道,但方法論是個(gè)什么鬼!今天介紹給大家基礎(chǔ)的九種方法,先開個(gè)頭哦。

01什么是基礎(chǔ)方法

從本質(zhì)上看,幾乎所有工作都和數(shù)據(jù)有關(guān)系,都或多或少需要一些數(shù)據(jù)分析方法。但數(shù)據(jù)本身是有門檻的,很多人上學(xué)的時(shí)候就怕數(shù)學(xué)課,更不要說復(fù)雜的理論了。

因此,所謂基礎(chǔ)數(shù)據(jù)分析方法,應(yīng)該是:

1、不涉及高等數(shù)學(xué)、統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)、算法原理

2、不涉及復(fù)雜的業(yè)務(wù)邏輯、因果推斷邏輯

3、不局限于特定的業(yè)務(wù)場景,有普適性

總之,人人能用的,才是基礎(chǔ)方法。

基于這個(gè)理念,我請我的運(yùn)營小妹小熊妹,為大家整理了九種基礎(chǔ)分析方法,簡單又好用。

02從一個(gè)指標(biāo)開始

▌周期性分析法

最基礎(chǔ)的分析方法,可以從一個(gè)指標(biāo)開始,這就是“周期性分析法”。所謂“周期性分析法”,操作上非常簡單,就是把一個(gè)指標(biāo)的觀察時(shí)間拉長,看它是否有周期變化規(guī)律。

這種方法分析簡單,但是非常實(shí)用。因?yàn)樾率纸?jīng)常因?yàn)椴欢粗芷谧兓?,引發(fā)笑話。

諸如:

“我發(fā)現(xiàn)昨天指標(biāo)大跌”——昨天是周末,本來就該跌(自然周期變化)

“我發(fā)現(xiàn)A產(chǎn)品賣得很好”——A產(chǎn)品剛上市,它就該賣得好(產(chǎn)品生命周期)

很多時(shí)候,我們看的指標(biāo)是總體指標(biāo),而總體指標(biāo)是由若干部分組成的,比如:

總公司-分公司A、分公司B、分公司C

總銷售-商品A、商品B、商品C

因此看到一個(gè)總體指標(biāo)以后,可以根據(jù)它的組成部分,對總體做拆解,了解各部分組成,是為結(jié)構(gòu)分析法(分析總體的內(nèi)部結(jié)構(gòu))。

▌結(jié)構(gòu)分析法

結(jié)構(gòu)分析法在很多時(shí)候都好用,比如問:“為什么業(yè)績下滑呀!”答:“因?yàn)閄X區(qū)域沒有做好!”通過看結(jié)構(gòu),能很快找到責(zé)任人。

▌分層分析法

除了單純地看結(jié)構(gòu),人們也喜歡做排名,區(qū)分個(gè)高中低,這就是分層分析法。

很多同學(xué)會把分層和結(jié)構(gòu)搞混,大家只要記得以下兩句:

結(jié)構(gòu)是客觀存在的,問清楚即可

分層是主觀的,要定個(gè)高低出來

這三種方法,是基礎(chǔ)中的基礎(chǔ)。一來,它們都是在分析一個(gè)指標(biāo),二來,它們都是基于事實(shí)陳述,不需要啥計(jì)算。當(dāng)我們初到一個(gè)公司,初接觸一個(gè)新數(shù)據(jù),都可以用這三種方法,建立基礎(chǔ)認(rèn)知。

03從一個(gè)指標(biāo)到2個(gè)指標(biāo)

▌矩陣分析法

當(dāng)指標(biāo)從一個(gè)增加到2個(gè)的時(shí)候,最好的方法就是矩陣分析法。矩陣分析法,通過兩個(gè)指標(biāo)的交叉,構(gòu)造分析矩陣,利用平均值切出四個(gè)象限,從而發(fā)現(xiàn)問題(如下圖)。

矩陣分析法的最大優(yōu)勢,在于:直觀易懂??梢院苋菀讖膬蓚€(gè)指標(biāo)的交叉對比中發(fā)現(xiàn)問題。特別是當(dāng)這兩個(gè)指標(biāo)是投入/成本指標(biāo)的時(shí)候,成本高+收入低,成本低+收入與高兩個(gè)類別,能直接為業(yè)務(wù)指示出改進(jìn)方向,因此極大避免了:“不知道如何評價(jià)好壞”的問題。

很多咨詢公司都喜歡用這種方法,類似KANO模型或者波士頓矩陣,本質(zhì)就是找到了兩個(gè)很好的評價(jià)指標(biāo),通過兩指標(biāo)交叉構(gòu)造矩陣,對業(yè)務(wù)分類。分類的區(qū)分效果很好,就廣為流傳了。

04從2個(gè)指標(biāo)到多個(gè)指標(biāo)

當(dāng)分析指標(biāo)變得更多的時(shí)候,最重要的工作,就是弄清楚:到底這些指標(biāo)是什么關(guān)系。典型的關(guān)系有兩種。

第一種:并列關(guān)系。

幾個(gè)指標(biāo)相互獨(dú)立,且是上一級指標(biāo)的組成部分。

比如我們常說的:業(yè)績=客戶數(shù)*消費(fèi)率*客單價(jià)

在這個(gè)公式里

1、一級指標(biāo):業(yè)績

2、二級指標(biāo):客戶數(shù)、消費(fèi)率、客單價(jià)

3、客戶數(shù)、消費(fèi)率、客單價(jià)相互獨(dú)立

此時(shí),客戶數(shù)、消費(fèi)率、客單價(jià)就是并列的三個(gè)指標(biāo),并且都是業(yè)績的子指標(biāo)。

第二種:串行關(guān)系。

幾個(gè)指標(biāo)相互關(guān)聯(lián),有前后順序關(guān)系。

比如我們常說的:新注冊用戶數(shù)=廣告瀏覽人數(shù)*落地頁轉(zhuǎn)化率*注冊頁轉(zhuǎn)化率。

1、一級指標(biāo):新注冊用戶數(shù)

2、二級指標(biāo):廣告瀏覽人數(shù)、落地頁轉(zhuǎn)化率、注冊頁轉(zhuǎn)化率

3、用戶要先看到廣告,再點(diǎn)擊廣告進(jìn)入落地頁,再完成注冊

此時(shí),廣告頁、落地頁、注冊頁的指標(biāo)相互關(guān)聯(lián),用戶要一步步走。

這兩種關(guān)系,分別對應(yīng)兩種基礎(chǔ)分析方法:

并列關(guān)系:指標(biāo)拆解法,通過拆解一個(gè)一級指標(biāo),從二級指標(biāo)里發(fā)現(xiàn)問題。

漏斗分析法:通過觀察一串流程,了解其流程轉(zhuǎn)化率,發(fā)現(xiàn)轉(zhuǎn)化率短點(diǎn)。

▌指標(biāo)拆解法

指標(biāo)拆解法,一般在經(jīng)營分析中使用較多。舉個(gè)簡單的例子,一個(gè)小程序商城,上月銷售業(yè)績150萬,本月120萬。如果只看結(jié)果,除了少了30萬以外啥也不知道。但是進(jìn)行指標(biāo)拆解以后,就能發(fā)現(xiàn)很多東西(如下圖)

拆解以后可以明顯看出:本月雖然注冊用戶人數(shù)增加了,但是消費(fèi)率大幅度降低,所以收入少了。后續(xù)可以進(jìn)一步思考:如何提高消費(fèi)率。

▌漏斗分析法

漏斗分析法,則在互聯(lián)網(wǎng)產(chǎn)品/推廣/運(yùn)營分析中使用較多,因?yàn)榛ヂ?lián)網(wǎng)產(chǎn)品能記錄較多用戶數(shù)據(jù),因此可以呈現(xiàn)整個(gè)用戶轉(zhuǎn)化流程,從而進(jìn)行分析。

舉個(gè)簡單例子,在網(wǎng)上看到一個(gè)商品廣告,我們很感興趣,點(diǎn)擊進(jìn)入購買。需要經(jīng)歷廣告頁→詳情頁→購物車→支付幾個(gè)步驟,每多一個(gè)步驟,就會有一些用戶流失,如同漏斗一樣。

此時(shí)可以用一個(gè)轉(zhuǎn)化漏斗,形象地表示這種關(guān)系(如下圖)。

有了轉(zhuǎn)化漏斗以后,就能進(jìn)一步基于漏斗分析,從而指導(dǎo)業(yè)務(wù)改善:

1、哪個(gè)環(huán)節(jié)漏掉的用戶最多,需要改善?

2、不同的商品,漏斗形態(tài)如何,哪個(gè)更適合推廣?

3、新的產(chǎn)品改版后,是否減少了漏掉的用戶數(shù)量?

▌相關(guān)分析法

當(dāng)然,還有一些指標(biāo),可能不是直接的并行/串行關(guān)系,但是在工作中,也很想知道他們有沒有關(guān)系,比如:

1、廣告投入與銷售業(yè)績

2、下雨刮風(fēng)和門店人流

3、用戶點(diǎn)擊和消費(fèi)行為

此時(shí),需要掌握相關(guān)分析法。注意:指標(biāo)之間可能天生存在相關(guān)關(guān)系。

常見的天生相關(guān),有三種形態(tài):

1、在結(jié)構(gòu)分析法中,整體指標(biāo)與部分指標(biāo)之間關(guān)系

2、在指標(biāo)拆解法中,主指標(biāo)與子指標(biāo)之間的關(guān)系

3、在漏斗分析法中,前后步驟指標(biāo)之間的關(guān)系

這三種情況,稱為:直接相關(guān)。直接相關(guān)不需要數(shù)據(jù)計(jì)算,通過指標(biāo)梳理就能看清楚關(guān)系。相關(guān)分析法,更多是利用散點(diǎn)圖/相關(guān)系數(shù),找到潛在的相關(guān)關(guān)系(如下圖)。

但是要注意:相關(guān)不等于因果,到底如何解讀相關(guān)系數(shù),需要結(jié)合具體業(yè)務(wù)含義,不能胡亂下結(jié)論哦

05從指標(biāo)到業(yè)務(wù)邏輯

▌標(biāo)簽分析法

以上所有方法,都是基于數(shù)據(jù)指標(biāo)計(jì)算,但實(shí)際業(yè)務(wù)中,很多關(guān)系并不能直接用數(shù)據(jù)指標(biāo)表示。

比如:

●是不是社區(qū)店比步行街店,生意更好?

●是不是私域流量比公域流量,轉(zhuǎn)化更佳?

●是不是刮風(fēng)下雨比晴空萬里,銷售更好?

社區(qū)店/私域流量/刮風(fēng)下雨,很難用一個(gè)數(shù)據(jù)指標(biāo)來衡量。但這些因素,又確實(shí)會對企業(yè)經(jīng)營產(chǎn)生影響,該怎么分析呢?這就需要采用:標(biāo)簽分析法。

舉個(gè)簡單的例子,南方某省,8月份經(jīng)常下暴雨。大家都覺得:下雨會影響門店業(yè)績。那么怎么分析呢?按照五步法,可以針對該省份門店,做分析如下圖:

那么可以得出結(jié)論:下雨對業(yè)績影響不大,這就做完了。

注意,上邊的小例子里,標(biāo)簽做的很粗糙,只有簡單粗暴的下雨/沒下雨兩類。除了下雨以外,還可能有臺風(fēng)、冰雹、高溫等等情況。因此,做標(biāo)簽的精細(xì)程度,決定了標(biāo)簽分析的準(zhǔn)確度。而能否選取到合適的標(biāo)簽,則考驗(yàn)的是分析人員對業(yè)務(wù)的理解程度。

到這里,一共介紹了八種基礎(chǔ)方法。在實(shí)際工作中,一般都是多種方法綜合使用的。因?yàn)闃I(yè)務(wù)提的問題會很復(fù)雜,很有可能涉及多個(gè)指標(biāo),多個(gè)標(biāo)簽。此時(shí)千頭萬緒,要理清思路,就得祭出第九種方法:MECE法。

▌MECE法

MECE是(Mutually Exclusive Collectively Exhaustive)的縮寫,指的是“相互獨(dú)立,完全窮盡”的分類原則。通過MECE方法對問題進(jìn)行分類,能做到清晰準(zhǔn)確,從而容易找到答案。

MECE法是基礎(chǔ)分析和高級分析的分水嶺,也是從基礎(chǔ)提升到高級的通道。所有復(fù)雜的問題,都需要經(jīng)過認(rèn)真的梳理和分解,才能成為一個(gè)個(gè)能解決的小問題。所謂的業(yè)務(wù)分析模型,其實(shí)就是對業(yè)務(wù)問題的MECE分解。

看到這里,肯定很多小伙伴想看這九大方法的操作細(xì)節(jié),可以關(guān)注小熊妹,每一種方法,小熊妹都單獨(dú)寫了一篇詳細(xì)的操作文章。接下來小熊妹會把九大分析方法整理成PDF供大家下載使用。

當(dāng)然,肯定也有同學(xué)好奇:掌握了這九種方法以后,還可以怎么深入呢?

一般有三條深入路線,可以進(jìn)行深入分析。

06掌握了基礎(chǔ)方法以后

▌路線一:業(yè)務(wù)分析模型。

業(yè)務(wù)模型,用來解決:定義模糊、數(shù)據(jù)貧瘠、需指導(dǎo)業(yè)務(wù)的問題。

比如業(yè)務(wù)在糾結(jié):

1、到底做什么用戶更好?

2、到底怎樣才能激勵銷售?

3、到底活動起了多大作用?

這些問題聽起來簡單,其實(shí)定義非常模糊,什么算好?怎么叫起作用?不發(fā)錢的激勵真的有用?各種問題錯(cuò)綜復(fù)雜,且很有可能摻雜了業(yè)務(wù)部門自己的小心思。因此,需要細(xì)細(xì)的梳理業(yè)務(wù)邏輯,推導(dǎo)出可行的解題邏輯。

▌路線二:算法分析模型。

算法模型,用來解決:定義清晰、數(shù)據(jù)豐富、計(jì)算過程復(fù)雜的問題。

比如,高價(jià)值用戶識別問題,業(yè)務(wù)上已經(jīng)定義清楚了:

1、用什么指標(biāo)衡量用戶價(jià)值

2、用什么標(biāo)準(zhǔn)評價(jià)價(jià)值“高”

3、采集了豐富的數(shù)據(jù)(性別、年齡、興趣、關(guān)聯(lián)商品、互動、評論……)

4、有一批人工標(biāo)注過的“高價(jià)值”用戶做正樣本

此時(shí),可以用各種算法來建模了。建模的目的,不是為了增加分析深度,而是提高從分析到業(yè)務(wù)應(yīng)用的效率。有了相對準(zhǔn)確的模型判斷,業(yè)務(wù)可以通過CDP+MA,自動觸發(fā)營銷規(guī)則,不需要每次都寫ppt寫很久。算法模型需要一些

▌路線三:統(tǒng)計(jì)推斷。

統(tǒng)計(jì)推斷方法,用來解決:定義清晰、沒有數(shù)據(jù)、需測試收集數(shù)據(jù)的問題。

比如:要上一個(gè)新版本產(chǎn)品,業(yè)務(wù)已經(jīng)定義了:新版本要提升用戶的人均在線時(shí)長(均值問題),現(xiàn)在要做測試,從兩個(gè)預(yù)備版本里選一個(gè)。此時(shí)要用:雙總體均值比較假設(shè)檢驗(yàn)的方法。

當(dāng)然,實(shí)際問題會更復(fù)雜,考慮各種控制變量、假設(shè)前提,還要考慮系統(tǒng)開發(fā)、數(shù)據(jù)采集方案,不單單靠分析師解決。

以上就是數(shù)據(jù)掌握了基礎(chǔ)方法以后,深入學(xué)習(xí)的三個(gè)路線。

本文來自微信公眾號“接地氣學(xué)堂”(ID:gh_ff21afe83da7),作者:接地氣的陳老師,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 基礎(chǔ) 方法 數(shù)據(jù)

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片