雀巢奶粉、克寧奶粉、紅牛奶粉、安怡奶粉、豐力富奶粉、桂格奶粉哪一款奶粉更重要?
如果觀察家覺得字體太小不易閱讀,不妨可以聽聽看
觀察家知道台灣許多上市的公司每個月都會提供財務報告,除了市場消息外,有觀察家詢問角度數據:「是否有機會可以逆向了解影響上市公司營收好壞的主要原因是什麼?」透過額外收集到的訊息資料,進一步預測上市公司未來的表現狀況。然而,觀察家很難知道財務收入的詳細成分,觀察家採取的策略會以該上市公司主力商品的銷售狀況,作為預策公司未來營收表現的判定指標,但影響公司財務報告金額的因素又特別多,上市公司也不會透露所有合作客戶的資料,單靠一項主力商品進行預測準確性不高,造成第三方的觀察家掌握訊息不足,得到可信度更高的預測與推估十分困難。在先前的文章中,觀察家知道使用部分的資料預測整體的通路營收可能造成很大的誤差,如果觀察家收集的資料越趨近於完整的資料,則預測的結果是否會更接近真實的數據呢?能夠掌握最多完整的數據資料的地方,通常是公司內部的經營者,外部數據的推估與預測如之前文章所述,有較高機率產生推估誤差。今天角度數據透過某線上販售奶粉通路的數據資料,利用前 30 天的資料預測第 31 天營收的各種狀況,企圖解釋哪一款奶粉對通路而言更重要?某線上奶粉通路並沒有販售台灣所有品牌的奶粉,因為經營者初次經營線上銷售平台,所以僅販售台灣市面上比較知名的 6 款奶粉品牌,經營者選擇的奶粉品牌包含:雀巢奶粉、克寧奶粉、紅牛奶粉、安怡奶粉、豐力富奶粉與桂格奶粉,該經營者每天的收入就是由這 6 款奶粉品牌組成。
影響線上通路第 31 天營收的因素很多,觀察家除了可以根據前一天的營收金額進行預測外,還可以根據前一天的天氣、溫度、星期等因素,也許第 30 天下雨機率較高則第 31 天營收金額增加的機率就會提高,也許第 30 天是星期五則第 31 天營收金額增加的機率就會提高,也許第 30 天台北的消費力下降則第 31 天營收金額增加的機率就會提高,也許第 30 天是周年慶的前夕則第 31 天營收金額增加的機率就會提高,也許第 30 天下午 3 點到 5 點的營收增加則第 31 天營收金額增加的機率就會提高,如果觀察家希望使用更多的因素找出影響線上通路第 31 天營收的原因,可以嘗試建立一套系統並收集這些數據資料,做為未來決策的參考依據。麥當勞有一套系統可以計算得來速一台車的平均等待時間,有一套公式可以分析一份套餐平均的烹調時間,有一套邏輯可以維繫與客戶間的關係,現在許多的訊息是透過系統、公式與邏輯推算給予建議,許多大型企業不是憑著直覺與第六感進行猜測。角度數據認為從消費數據中,可以觀察出某些關聯性,從圖表的高低變化可以看到一些蛛絲馬跡,透過系統可以提供店家決策的參考訊息,但是觀察家希望這些蛛絲馬跡,希望在做決策的時候有參考的依據,需要在平時就做好準備,提前佈署收集可能會用到的數據資料,數位轉型的第一步就是將未來可能會用到的數據資料數位化,提高公司資產的使用率,古人常常有書到用時方恨少之感慨,現今的觀察家不時有制定決策數據少之遺憾。
雖然影響線上通路第 31 天營收的因素很多,由於這篇文章僅僅幫助觀察家建立數據分析使用的概念,角度數據無法在此一一分析各種因素對通路第 31 天營收的影響,所以只根據連續 30 天的營收金額,預測與分析第 31 天營收金額的多寡。如果觀察家僅僅選擇一款奶粉品牌做為衡量,當觀察家利用一款奶粉品牌以第 30 天的銷售金額作為參數提供給系統時,系統預測第 31 天的營收金額與實際第 31 天營收金額的誤差,結果是豐力富奶粉的誤差最小,其次是紅牛奶粉,誤差大小的評估是以第 30 天推估出來的營收金額為基準,與實際 31 天營收金額增減的幅度,將增減的幅度取絕對值其數值最小者,表示有更好的預測結果。使用豐力富奶粉估算第 31 天的營收,會低估線上奶粉通路的營收金額,誤差率為 -13.45%,如果線上奶粉通路第 31 天的營收金額是 100 萬元,則豐力富奶粉估算第 31 天的營收金額是 100 減去 13.45 等於 86.55 萬元。使用紅牛奶粉估算第 31 天的營收,也會低估線上奶粉通路的營收金額,誤差率為 -14.72%,可是觀察家使用雀巢奶粉與桂格奶粉卻會造成高估的現象,顯然採用一款奶粉進行預測有些奶粉的預測會高估第 31 天的營收金額,而有一些奶粉的預測會低估第 31 天的營收金額,挑選更多的奶粉讓估算的金額有機會讓高估的金額向下調整,低估的金額向上調整,使預測的數值更接近第 31 天的營收金額。
當觀察家挑選兩款奶粉品牌的營收做為線上通路第 31 天的營收金額預測時,觀察家發現在其他參數都不調整的情況下,使用克寧奶粉與桂格奶粉過去 30 天的營收資料建立出來的模型,預測出來的誤差值最小,其誤差值為 -3.78%,挑選到這兩款奶粉品牌正好是使用一個奶粉品牌進行預測時,高估金額最大的奶粉與低估金額最大的奶粉兩款商品的商品組合。當觀察家使用兩款商品進行營收金額預估時,誤差值最大的商品組合,會出現在兩款商品預測的結果都是被高估或者是兩款商品預測的結果都是被低估的條件下,這樣的商品組合讓預測值的誤差變得更大。從數據圖表中,觀察家發現當選擇雀巢奶粉與桂格奶粉時,預測出錯的錯誤率非但沒有下降,反而比使用單一款商品進行預測還要糟糕,其誤差率高達 46.23%,造成觀察家雖然花更多時間收集更多的資料,使用的更多數據資料卻沒有得到更好的預測效果,也許經營者看到這樣的評估結果,可能會認為依靠數據資料作為決策的依據,沒有太大的作用,因為評估的誤差值與實際差距很大,而真正的原因有可能是因為先入為主的觀點或其他因素,選用了不適當的數據特徵,造成評估的誤差與實際資料差距甚遠。現實的狀況比這個範例更加複雜,觀察家不確定要選擇多少的因素會得到做好的效果,使用越多的因素造成資料的維度變大,可能需要花費較多的資源才能找到答案,多數的經營者並不希望花費太高的代價進行決策,希望能夠使用關鍵因素進行評估,因此,使用越少的資料可以得到越正確的結果,成為預測評估的首要目標。
當觀察家挑選兩項商品特徵時,預測的錯誤率已經下降到 -3.78%,也許使用三項商品進行預測已經可以充分掌握商品的營收曲線,當觀察家挑選雀巢奶粉、紅牛奶粉與安怡奶粉的 30 天歷史資料進行模型預測時,第 31 天收入的誤差率已經下降到 -0.31%,三款商品的組合因素比兩款商品更加複雜,但相信應該與兩款商品組合誤差率的高低變化有關,藉由系統自動化的運算觀察家可以加上觀察資料視窗移動的技巧,去預測未來可能的營收。此外,觀察家如果認為人手不足,或者希望縮小經營規模,也許該線上通路必須保留雀巢奶粉、紅牛奶粉與安怡奶粉這三款奶粉,利用這三款商品的收入狀況預測未來的營收,作為線上通路決定販售商品種類的依據。
當觀察家挑選雀巢奶粉、 克寧奶粉、 紅牛奶粉與豐力富奶粉的 30 天歷史資料建立模型預測時,第 31 天收入的誤差率下降到 -0.27%,表示該線上通路第 31 天實際營收為 10000 元,預測出來的數據為數值為 9973 元,這個營收預測是目前為止最接近通路第 31 天的營收,也許觀察家會認為使用五個或者全部的商品會使評估預測的數值更正確,但實際的狀況是,當觀察家使用同樣的方法進行模型的建立與預測,選用五種商品預測結果較佳的商品組合是雀巢奶粉、克寧奶粉、 安怡奶粉、 豐力富奶粉、 桂格奶粉,可是誤差值卻上升到 -3.66%,雖然挑選越多的特徵有機會讓資料正確率提高,可是實驗數據顯示提供更多維度的線索不一定能夠讓預估值無限逼近實際的結果,當觀察家掌握更多的資訊,也可能讓預測的錯誤率上升。
預測與決策這兩件事情在生活中不斷的發生,如果事情的發生都沒有任何蛛絲馬跡,沒有任何徵兆與關聯,觀察家可以使用機率的邏輯進行解釋,好比觀察家公正的拋一枚硬幣,該硬幣出現正面與反面的機率沒有人為干預,出現的正面機率經過大量統計的結果是二分之一,假設觀察家想要作弊提高正面出現的機率,一定會留下線索,或許硬幣落下碰觸到桌面的聲音發生異常,或許觀察家拋出硬幣一瞬間的動作不自然,或許觀察家不願意其他人檢查他手中的硬幣,這些不尋常的徵兆可能影響事情發生的機率。角度數據經常透過系統進行資料的預估,透過通路的來店人數預估品牌的市佔比率,透過商品名稱關鍵字的分布,預估消費者對商品的喜好程度,從消費的購物週期預測何時消費者需求的機率較高,行銷業務利用這些數據資料,可以更容易打動消費者的心。廣告的目的是在喚醒消費者潛在的需求,對於沒有貸款需求的消費者,看到借錢廣告不會採取行動,對於雙眼視力正常的消費者,接收到隱形眼鏡的廣告不會產生共鳴,可是對於剛剛從電商網站買入 iphone 16 的消費者而言,剛剛從電商網站買入 iphone 16 這項重要的因素,讓手機的保護套、螢幕的抗刮膜,甚至是短期的手機意外保險,都有可能成為觸發消費者內心深處的需求產生消費。消費者購買一片披薩的需求究竟是為了溫飽呢?還是為了結交朋友呢?同一件商品在千變萬化的理由下都有消費者會購買,在各式各樣的場合,每件商品的價值不會相同,消費者購買的原因與理由也都不一樣,也許猜到消費動機或出現在符合需求那一時刻的廣告,才可能成為激發消費者的有效廣告。
資料來源:角度數據 2024 年消費者消費交易資料庫
Comments