消費數據不是只能用來看排名
新冠疫情過後,許多服務業長期面臨缺工的問題,店家不得不將人力資源做最有效率的安排,以台灣龍頭麥當勞為例,麥當勞的服務人員除了要為排隊在收銀機面前的客戶確認餐點外,也要接受店內來自於自助點餐機的下單,旁邊車道得來速趕時間消費者的點餐,偶而還要接受店內消費客人的送餐服務,不時還會有大型活動的預約訂餐,而麥當勞自有外送平台「歡樂送」的店外送餐服務,再加上兩大外送平台即時訂餐收進來的訂單,麥當勞進單的速度與數量可能不是 2~3 個服務人員就可以從容應付。相信麥當勞內部應該有一套完善的管理方法,讓店家的人力資源做有有效率的配置。連鎖企業的總部陸續成立了分析部門,從每日消費數據提供的價與量對店內資源的配置狀況進行模擬與預測,透過數據有效率的配置資料並減少食物的浪費,進而響應政府的減碳政策。
從動物的排泄物可以推測是什麼動物,也可以了解這隻動物的健康狀況,科學家利用排泄物含有的物質,透過各種分析統計與測試,可知道動物的許多狀況,這與生病的人到醫院抽血、驗尿的道理相同。排泄物的數據不是只能用來看排名比大小,或許觀察家知道各種動物排洩物的重量、大小排名,這些訊息可以幫助觀察家猜出是什麼動物,藉此推測動物的食量與體積,從排泄物數量排名多寡判斷群體大小,但在科學家眼中這些都只是數據觀察的一部份。雖然消費數據不是萬能,但從消費數據的分析,除了用來看排名、知佔比,應該還可以提供觀察家更多的訊息。
有觀察家發現角度數據分析的佔比資料與手邊掌握的資料略有差異,例如在「抽取式衛生紙與濕紙巾的消費佔比」一文中,提到濕紙巾的消費金額高於抽取式衛生紙,這項結果與台灣整體市場分布佔比有明顯的差異,觀察家很容易相信消費者對於「衛生紙」的需求量高過於「濕紙巾」,且有些家庭甚至沒有使用過「濕紙巾」這項商品,而「衛生紙」卻是日常必須。想知道濕紙巾的消費金額為什麼高於抽取式衛生紙,需要了解到統計分析的前提與切入的角度,如果觀察的通路以母嬰百貨、便利商店居多,抽樣的族群大多數是在母嬰百貨、便利商店消費,或許濕紙巾消費金額高於抽取式衛生紙的論述,對於觀察家就很容易理解。便利商店販售的商品以小份量為主,而「衛生紙」佔的空間較大,不易擺放,所以大部分的便利商店不販售「衛生紙」,在母嬰用品店與便利商店購買抽取式衛生紙的消費人數亦比較少,便利商店以小包裝的「面紙」、「濕紙巾」商品的需求比抽取式衛生紙高,基於不同的前提下,商品的排名與佔比就不會是觀察家心中所知到的答案。角度數據許多的分析、研究大部分是量身訂製,前提假設需要與觀察家長期討論,從不同的需求與應用情境找到合適的解答與切入點。消費數據的分析、研究除了看排名、知佔比外,更重要的是要幫助觀察家解決問題。
回到本文一開始提到的問題,接下來角度數據將與觀察家展示消費數據的其他應用。角度數據將以店家收銀員的角度進行觀察並加快備餐速度,降低客人的等待時間為目標,透過消費數據讓備餐人員可以預測接下來應優先備哪一款餐點,以減少客戶等待時間。下圖是某一區間內某手搖飲料店每日消費人數,透過觀察家的眼睛,您可以根據圖表大概描述一下您觀察到消費人數分布狀況,是否您店裡的消費人數的分布不一樣呢?但您一定有辦法可以獲得這些資料。因為銷售問題比較複雜,角度數據沒有想要在本篇文章中規畫出完整的預測系統,因此將數據資料做以下簡化:
假設店家僅銷售兩款飲料:「珍珠奶茶」、「珍珠鮮奶茶」,並假設備餐所需時間一樣
從消費者的購買時序找出「珍珠奶茶」、「珍珠鮮奶茶」這兩項商品的消費紀錄
移除同時間購買「珍珠奶茶」、「珍珠鮮奶茶」這兩項商品的消費紀錄
台灣大部分餐廳的運作都是採先進先出的運作模式,也就是先點餐的客人先服務,因此透過收銀員看到消費者在「珍珠奶茶」、「珍珠鮮奶茶」的購物序列,讓餐廳的備餐人員可以預先知道即將需要的餐點是什麼,進而達到加速的目的。在這個範例中,觀察家知道「觀察區間每日抽樣消費者數量」是母體資料,這些資料最好是來自於店家內部的統計資料,因為不同位置店家的客源組成成分不同,有些店家以學生族群佔大宗,有些店家則是以上班族為主,而有些店家則是以觀光客為主要的銷售對象,以上抽樣的店家是台灣北部商業區的店家,台灣北部地狹人稠商業區的店家可能含蓋學生族群、上班族與觀光客,在此不做進一步描述。從分析的結果,觀察家可以看到當前這位顧客購買「珍珠奶茶」而下一位客戶購買「珍珠奶茶」的機率是 64%,下一位客戶購買「珍珠鮮奶茶」的機率是 36%,顯然備餐人員可先準備「珍珠奶茶」減少下一位客戶等待時間。當前顧客購買「珍珠鮮奶茶」而下一位客戶購買「珍珠奶茶」的機率是 56%,下一位客戶購買「珍珠鮮奶茶」的機率是 44%,也許備餐人員可先準備「珍珠奶茶」減少下一位客戶等待時間。
是否在收銀機排隊的客人會受到前面購買者的影響呢?如果是遇到第一次購買的消費者有很高的機率會參考前一位客人的購買方式,或許常客或代買客受的前面訂單的影響較小,對於沒有會員機制的店家,也可以利用此方式估計新增的客人。據統計分析數據顯示如果第一位客人購買「珍珠奶茶」而第二位客人也購買「珍珠奶茶」則下一位客人購買「珍珠奶茶」的機率將從 56% 上升至 65%,隨著時間序列的推移購買「珍珠奶茶」的機率將逐漸變高。如果第一位客人購買「珍珠鮮奶茶」而第二位客人購買「珍珠奶茶」,則下一位客人購買「珍珠奶茶」的機率將從 56% 上升至 63%,不論先前是購買「珍珠奶茶」或「珍珠鮮奶茶」,第三位消費者購買「珍珠奶茶」都比一開始高出許多,依此趨勢推測是否有機會出現「珍珠奶茶」的機率高於 90%?第一位客人購買「珍珠鮮奶茶」而第二位客人也購買「珍珠鮮奶茶」則下一位客人購買「珍珠鮮奶茶」的機率將從 44% 上升至 46%,雖然連續購買因素讓珍珠鮮奶茶的機率提升,但連續購買「珍珠鮮奶茶」的消費者,在觀察的店家機率比「珍珠奶茶」低,對此感興趣的觀察家可以從「珍珠鮮奶茶與珍珠鮮奶茶的機率變化」圖表得到更多訊息。
不同的觀察區間,機率數值變化也會有所不同,這個禮拜的變化也會與上個禮拜有些不一樣,星期一的機率分布與星期二的分布也不會相同,以上的觀察統計資料,僅取母體資料序列的一小部分,提供觀察家初步的了解與觀察。在珍珠奶茶的觀察序列中,連續三個購買珍珠奶茶的消費者,第四位也購買珍珠奶茶機率從 65% 變成 66%,增加的機率變緩,也許在更長的觀察序列中,購買珍珠奶茶機率開始下降,是否有機會低於 50%?而購買珍珠鮮奶茶的機率是否可能高於 50%?也許這些的分析結果有助於備餐者評估珍珠奶茶與珍珠鮮奶茶庫存量佔比應該是多少比較合理。
以上是站在收銀員的角度進行分析統計,時間序列是依據收銀員進單的順序產生商品序列,這樣的商品序列除了以收銀員的角度進行觀察外,也可從其他角度進行分析。市調公司對消費者進行消費者行為分析,也可以運用商品序列去發現消費者對商品使用的改變,品牌的轉移,商品種類的變動或新的商品對消費者的影響。在角度數據之前的文章中,也曾以消費者的消費序列做過初步的觀察,當時的結論:某特定類別的商品,一但消費者的購買序列出現在網路(線上)通路,則該項商品消費者回到實體(線下)通路消費的機率趨近於 0。 雖某特定類別的商品仍在線下通路受到歡迎,可能的原因是仍有許多限下購買的消費者,不曾在線上通路購買過某特定類別的商品。
大部分的消費數據都以圖表或報告作為呈現,如同現在的 AI 文字、圖表、語音的方式呈現,觀察家可能除了看圖表與報告外,更重要是如何運用數據資料 (AI) 來解決日常問題。協助服務業解決問題,幫助廠商分析具有潛力的新商品,也許是消費數據另一項重要的應用。
資料來源:角度數據 2023 年消費者消費交易資料庫
Comments