top of page

打造符合需求的分類系統

  • 作家相片: 9DO
    9DO
  • 9月12日
  • 讀畢需時 5 分鐘
如果觀察家覺得字體太小,不妨聽聽看

角度數據經常從消費者累積龐大的數據資料中,幫助觀察家發現消費的流行趨勢,在毫不起眼的地方找到賺錢的商機,利用訊號與線索挖掘競爭對手所不知的秘密。過去角度數據曾經告訴觀察家,喜歡喝小麥口味啤酒的消費者可能喜歡搭配生魚片,喜歡喝水果口味啤酒的消費者多數喜歡吃洋芋片,經常購買生啤酒的消費者,也許多數對於牛肉商品情有獨鍾。也許這些訊號無法立刻為經營者帶來獲利,這些消息無法馬上讓觀察家發現商機,但是日積月累的情報與線索,在未來的某一天,可能成為經營者與觀察家進行決策的重要依據。人工智慧工具,會自動從網頁讀取文字進行分析,試圖從網路上公開的影片尋找答案,這件事告訴觀察家一個道理,沒有掌握數據資料,會像廚藝高超的廚師,因為沒有食材,就不能烹調出一道道的佳餚,沒有建立系統平台,會像廚藝高超的廚師,因為沒有好用的廚具,而無法有效率烹煮出一道道的美食。角度數據過去的文章,是根據一定數量的消費明細,發現的現象,是從一定數量的消費行為,統計的結果,是從一定數量的購物車,找到的規律。角度數據透過系統平台與方法,從龐大的數據資料推算關聯,從事件發生次數統計機率,觀察家所看到的排名都是由原始的數據資料經過計算產生的結果。


從同時購買的次數進行觀察,可是單從商品名稱不容易發現關聯性
從同時購買的次數進行觀察,可是單從商品名稱不容易發現關聯性

台灣的便利商店是許多消費者常去消費的地方,角度數據觀察便利商店近三萬筆交易紀錄,從超過兩千種相異的商品品項,企圖了解消費者在便利商店商品購買的商品,從同時購的角度,觀察家發現「迪士尼點數」最常與其他商品一起出現在消費者購物清單中,「迪士尼點數」算是店家強迫推銷的一項商品,消費者在購物時,沒有告訴店員想要購買「迪士尼點數」這項商品,只是在結帳的時候,消費者達到某一個特定的門檻,被額外添加進購物車的一項商品,關於「迪士尼點數」這項商品,應該只有總公司與活動企劃人員才會希望進一步了解,究竟有多少消費者獲得點數呢?究竟這樣的點數額外增加了多少消費金額呢?或許點數商品對於一般觀察家而言功用不大,在多數情況這樣的商品也容易被觀察家忽略。雖然交易紀錄有近三萬筆,而商品品項超過兩千種,但是因為觀察的對象是台灣的便利商店,而不是大型的量販店,因此消費者同時購買商品的組合數其實並不多,在便利商店通路,消費者以同時購買飲料類別的商品為主,也許與店家常常與飲料提供第二件八折的促銷有關。從圖表中,觀察家發現購買購物袋的消費者,多數屬於購買罐裝飲料的消費族群,特別是購買罐裝的咖啡與啤酒,消費者需要購物袋的機率比較高。從圖表中觀察家還可以看到另一項商品組合,就是米血糕與黑輪,米血糕、黑輪與白蘿蔔,也許商品性質比較接近,所以很容易出現在消費者的同一份購物清單中。角度數據許多的排名資料就是這樣產生,只是角度數據會將同樣性質的商品合併,從更高層級的觀察角度,進行市場觀察,但最底層依然是使用同樣的數據資料。過去角度數據為了提供高品質的數據資料,所以使用人工的方式,幫收商品名稱貼上分類標籤,去各大通路確認商品的樣貌與種類,隨著商品名稱數量快速變多,逐步建立自動化的分類,依照電商與傳統賣場常用的商品分類為商品分類,所以角度數據熟悉應將現下商品數位化的過程,有能力打造符合需求的分類系統。


在分析處理的過程中,觀察家不斷將資料抽象化,從具體的商品名稱轉成抽象的類別。
在分析處理的過程中,觀察家不斷將資料抽象化,從具體的商品名稱轉成抽象的類別。

或許觀察家認為啤酒屬於飲料,但是在競爭對手的分析平台,啤酒這項商品卻被歸納成酒類,也許觀察家認為米酒應該算是一種調味料,可是在別人的系統平台中,米酒卻被視為酒類,或許觀察家需要與市調公司或分析單位統一一下彼此的分類,才能進行接下來的觀察與研究。世界上沒有最好的分類方法,也沒有完全正確的分類系統,特別是市場上的商品命名又經常不按牌理出牌,品牌經常與三麗鷗合作,導致市場上的商品名稱快速增加,加上消費者經常聽到限量款的商品,這類商品名稱僅出現在某一段時間,流行一陣子後,就會隱姓埋名了。角度數據過去以人工的方式,根據客戶的需求進行分類,如果都沒有使用方法,透過系統加速處理,也許商品分類的速度會趕不上商品名稱產生的速度。角度數據內部確實維護一套準確度較高的商品分類,但角度數據依然經常使用新的技術,重新微調與建置新的分類平台。影片中展示角度數據使用 Google 開源的 embedding gemma 模型進行測試與微調, 重新為商品名稱進行分類,角度數據願意與觀察家一起微調系統裡的參數,讓商品的分類更符合觀察家的期待。或許觀察家不在乎角度數據的技術,只希望從角度數據大略了解市場的樣貌,可是角度數據卻希望觀察家學會角度數據的處理方法與技巧,除了資料收集的方法外,更希望觀察家可以自己擁有分析的系統平台,透過系統平台分析處理公司內部的數據資料。透過店家收營機數據資料交換或取得電子發票資料,對觀察家而言,應該都不困難,只是公司內部老闆交辦的數據資料,已經都處理不完,怎麼還會有多餘時間去處理公司外部的數據資料呢?


想要分析資料可能要先從資料分類下手,打造一套符合觀察家需求的分類系統,或許對觀察家而言,商品的分類不應該是根據商品的用途或功能進行分類,應該要根據消費者同時購的頻率進行分類,在房地產或銀行工作的觀察家,認為要根據消費者願意支付金額的多寡進行分類,分成富豪類、總裁類、鄉紳類等不同級別,從各種不同的角度進行商品分類。回到一開始角度數據從近三萬筆交易紀錄分析的那個案例,在圖表中,觀察家可以發現購買茶葉蛋的消費者同時購買無糖高纖豆漿的機率很高,究竟購買茶葉蛋的消費者是比較喜歡搭配豆漿呢?還是購買茶葉蛋的消費者更在意無糖的商品呢?也許觀察家最後所得到的結論,與觀察家所打造的分類系統有很大的關係。如果觀察家對分類這個議題感興趣,希望多了解商品分類或者想建置一個分類系統,可以根據不同的目的與用途,快速且有效率將手上的數據資料進行分類,也許角度數據可以協助觀察家,打造符合需求的分類系統。


 
 
 

留言


熱門文章
近期文章
bottom of page