用Tableau做銷量預(yù)測模型
前言:
這個(gè)預(yù)測模型比較簡單,其實(shí)就是統(tǒng)計(jì)學(xué),基本大家上學(xué)期間都會(huì)學(xué)到,不過畢業(yè)好多年可能也忘了,不妨來復(fù)習(xí)復(fù)習(xí),而且工作中可以實(shí)際應(yīng)用的地方還挺多的。
根據(jù)歷史月度銷量預(yù)測2021-09、10、11、12月的銷量數(shù)據(jù)

先看下散點(diǎn)圖,大致瀏覽下是否存在極值(若有,則排除掉)以及兩個(gè)變量之間是否存在關(guān)聯(lián)趨勢

擬合注意事項(xiàng):
用Excel擬合的時(shí)候盡量將各個(gè)趨勢線均嘗試下,選擇R2較為接近1的方式。R2越接近1,代表擬合效果越好。
嘗試下來,發(fā)現(xiàn)多項(xiàng)式擬合效果較好,且“順序”越往上增加,R2越接近1。但本數(shù)據(jù)源不多,且多項(xiàng)式擬合多采取二項(xiàng)式或三項(xiàng)式即可滿足需求,所以為避免過擬合,取3即可。

擬合出的結(jié)果如下,多項(xiàng)式公式如圖中所示:

給數(shù)據(jù)源增加一列輔助列,
將21、22、23、24分別帶入y = -0.5908x^3 + 19.576x^2 - 73.697x + 2128.3
則得到2021-09、10、11、12月的預(yù)測銷量

數(shù)據(jù)源如下

操作步驟:
?步驟1:先將月份拉列,銷量拉行,制作出折線圖。數(shù)據(jù)源中“月份”是文本格式,需改成日期格式

?步驟2:點(diǎn)擊列上的“月份”,改成離散

?步驟3:點(diǎn)擊折線圖選擇“顯示趨勢線”

點(diǎn)擊折線圖表,選擇“編輯所有趨勢線”,可以看到該預(yù)測模型為“線性”預(yù)測。

點(diǎn)擊折線圖表,選擇“描述趨勢模型”,可以看到該“線性”預(yù)測的R平方值

?步驟4:按照步驟3的方法,選擇“編輯所有趨勢線”依次選擇“線性”、“指數(shù)”、“多項(xiàng)式”2度、“多項(xiàng)式”3度,并查看對應(yīng)的R平方值,選擇其中R平方值最靠近1 的模型來作為最終的預(yù)測模型。
可以看到:
“線性”預(yù)測R方為

“指數(shù)”預(yù)測R方為

2度“多項(xiàng)式”預(yù)測R方為

3度“多項(xiàng)式”預(yù)測R方為

綜合對比得出:3度“多項(xiàng)式”預(yù)測模型R方更接近1,因此最終采取該預(yù)測模型。
?步驟5:鼠標(biāo)移動(dòng)到趨勢線上,可以看到擬合公式如下,如案例一中給數(shù)據(jù)源添加一列輔助列,并將需要預(yù)測的月份的輔助列的數(shù)字代入公式中,即可得到預(yù)測銷量。

另外說明:Tableau自帶預(yù)測功能,但是在本案例中不采用,原因如下:
將月份上的“精確日期”去掉,格式選擇月份,點(diǎn)擊折線圖選擇“顯示預(yù)測”

結(jié)果如下圖

再點(diǎn)擊圖表選擇“預(yù)測描述”,可以發(fā)現(xiàn)該自動(dòng)預(yù)測模型用的是“指數(shù)平滑法”,然而在上述步驟的擬合中發(fā)現(xiàn)指數(shù)相關(guān)預(yù)測方法的R方并不是最優(yōu)。

數(shù)據(jù)源如下:

先畫出普通折線圖,看下是否呈現(xiàn)明顯季節(jié)性。
下圖展示出該銷量數(shù)據(jù)確實(shí)呈現(xiàn)季節(jié)性,其中第2季度為旺季。則要針對該數(shù)據(jù)進(jìn)行去季節(jié)化處理。

將數(shù)據(jù)源通過數(shù)據(jù)透視表處理成下圖所示:

計(jì)算每個(gè)季度的年度均值,如下圖“年平均值”;
計(jì)算15個(gè)樣本的總體平均值,如下圖“總平均值”;
用“年平均值”/“總平均值”計(jì)算出“季節(jié)性指數(shù)”

來看一張總結(jié)之后的表格
①將計(jì)算出的“季節(jié)指數(shù)”重復(fù)添加進(jìn)下圖中的“季節(jié)指數(shù)”列
②去季節(jié)化=銷量/季節(jié)指數(shù)
③根據(jù)“輔助列”和“去季節(jié)化”后的銷量擬合出線性預(yù)測公式
y=-2.4907x+2532
之所以擬合線性公式是因?yàn)樵诘冖诓街幸呀?jīng)將季節(jié)性因素排除掉了

④將輔助列代入公式,計(jì)算出“線性預(yù)測”列
⑤將“線性預(yù)測”列乘以“季節(jié)指數(shù)”計(jì)算出“季節(jié)性調(diào)整”列,此列即為最終的預(yù)測銷量
⑥將“線性預(yù)測”列減去“銷量”列計(jì)算誤差,再除以“銷量”列計(jì)算誤差率。
⑦用STDEV()函數(shù)選中銷量一列,計(jì)算出總體標(biāo)準(zhǔn)偏差;
? ? 顯著性水平參數(shù)寫為0.05,即置信度是95%;
? ? 樣本量寫15;
? ? 用CONFIDENCE()函數(shù)計(jì)算出置信區(qū)間的可浮動(dòng)值,結(jié)果如下截圖。
? ? 即,有95%的可能性預(yù)測值比處于真實(shí)值的上下195.92范圍內(nèi)。
? ? 可以看到誤差都在正常的置信區(qū)間內(nèi)。

⑧將16(輔助列)代入公式,可預(yù)測2021Q4的銷量。



點(diǎn)擊“閱讀原文”可了解更多知識星球
