開始學習數(shù)據(jù)分析,可能會一股腦沉迷于工具的學習使用,或是只有統(tǒng)計的數(shù)據(jù)分析,做了很多圖表,卻不能發(fā)現(xiàn)其中的業(yè)務問題;又或是沒有數(shù)據(jù)分析意識,經(jīng)常會說我覺得,我認為,得不出什么建設性的結論。
不知道你在進階過程中是否也有這樣的癥狀?為了解決這樣的問題,我們就要去學習分析方法,結合業(yè)務更好地提出問題進行分析,而不是讓數(shù)據(jù)分析只是提數(shù)。
一. 分析方法知多少
1.什么是分析方法?
分析方法就是將零散的想法整理成有條理的思路。好比蓋房子需要事先有設計圖,這里的分析方法就好比設計圖作用,蓋房子需要有挖土機等工具,數(shù)據(jù)分析中需要Excel,SQL,Python等工具,道理是一樣的。
2.分析方法的作用?
分析方法幫助我們面對問題有分析的思路,面對一堆數(shù)據(jù)如何展開去分析以及面試中的業(yè)務問題如何去回答。
3.常用的分析方法?
根據(jù)場景和分析目的不同選擇不同的分析方法:
帕累托分析
又稱為二八法則,即百分之八十的問題是百分之二十的原因造成的。在項目管理中主要用于找出核心問題。核心問題發(fā)現(xiàn)、核心價值發(fā)現(xiàn)
舉個栗子,根據(jù)帕累托分析找出轎車銷量比較好的核心品牌。
從上面圖表我們可以看出在這些轎車品牌中,排名前4的占據(jù)了50%左右的銷售市場,排名前10的品牌占據(jù)了80%左右的銷售市場,這也正是我們要找尋的轎車品牌的核心品牌。當然,對于這張圖既然給出了梯度分級,其實可以進一步根據(jù)兩個分界點對各品牌進行分層(運用RFM模型)。
那么如何繪制帕累托圖呢?
首先,我們可以先觀察一下上圖表的一些主要特點:
柱形圖的數(shù)據(jù)按數(shù)值的降序排列,折線圖上的數(shù) 據(jù)有累積百分比數(shù)據(jù),并在次坐標軸顯示;
折線圖的起點數(shù)值為0%,并且位于柱形圖第一 個柱子的最左下角;
由于起點為0%,圖表中百分比數(shù)據(jù)會比原始數(shù)據(jù)多一個,所以在準備數(shù)據(jù)時需要多準備一個0%
折線圖的第二個點位于柱形圖第一個柱子的最右上角 ;
折線圖最后一個點數(shù)值為100%,位于整張圖形 的最右上角。
我總結了在Excel中繪制帕累托圖的方法:
1. 首先你得確保你的數(shù)據(jù)表中統(tǒng)計值是降序排列,添加累計值列(利用sum函數(shù)),累計占比列,另外折線圖中點比柱狀圖多一個,所以要多準備一個點數(shù)據(jù)0%,放在累計占比列的最前面。我們需要用到的列為兩列:統(tǒng)計列和累計占比列。
2. 選中表區(qū)域-選擇圖表類型-選擇“組合”-對統(tǒng)計值選用柱狀圖,累計占比選用折線圖-并將折線圖類型勾選次坐標軸;
3. 對圖表做初步調整:選中折線圖-調整圖表右側縱坐標范圍調整為到100%;選中柱子-將柱子間隙寬度設置為0,并選中柱子-添加邊框(用于清晰區(qū)別顯示,通常選擇白色)
4. 初始累計占比需顯示0,需進行以下調整:選中折線圖-選擇數(shù)據(jù)-去查看每個類別的表數(shù)據(jù)范圍-進行修改系列名稱(當前列名)和系列值(對應表數(shù)據(jù))
5. 發(fā)現(xiàn)折線初始位置不在0處,需要前移半步,進行以下調整:選中圖標-點擊“+”-在坐標軸選項勾選次要橫坐標
6. 選中次坐標軸-改坐標位置-選擇在坐標軸上,再修改上方的標簽位置為無;
7. 根據(jù)數(shù)據(jù)表中計算的累計值列的最大值,修改縱坐標范圍(調整最大最小值)
8. 選中折線圖-勾選數(shù)據(jù)標簽-查找80%大致位置,記下位置-去除標簽-單獨點擊剛剛記下的點-添加數(shù)據(jù)標簽
9. 突出顯示這80%的柱圖區(qū),填充其為別的顏色以示區(qū)別。
需要脫位
RFM模型
模型的名稱定義可以根據(jù)具體的行業(yè)、場景進行命名。
RFM模型是衡量用戶價值和用戶創(chuàng)利能力的經(jīng)典工具,依托于三個要素。分別如下所示:
R(Recency)最近一次消費時間:表示用戶最近一次消費距離現(xiàn)在的時間。消費時間越近的客戶價值越大。1年前消費過的用戶肯定沒有1周前消費過的用戶價值大。
F(Frequency)消費頻率:消費頻率是指用戶在統(tǒng)計周期內(nèi)購買商品的次數(shù),經(jīng)常購買的用戶也就是熟客,價值肯定比偶爾來一次的客戶價值大。
M(Monetary)消費金額:消費金額是指用戶在統(tǒng)計周期內(nèi)消費的總金額,體現(xiàn)了消費者為企業(yè)創(chuàng)利的多少,自然是消費越多的用戶價值越大。