【2024 最新】簡單兩招數據分析加上AI工具,幫你預測廣告投放成效
有接觸過電商、廣告投放的人應該都對「第一手資料」這個詞不陌生。不管是從廣告後台、電商後台,甚至是 GA 辛辛苦苦搜集來的滿手資訊,對後續的優化與策略都是很重要的。 舉例來說,投廣告最常關心的廣告投資報酬率(ROAS),就是由花費與業績兩個指標組成。當我們擁有廣告花費及相對應的業績時,我們不禁好奇:如何透過滿手凌亂的數字,去計算出花費與業績的甜蜜點?今天就教你如何利用這些資料,做出迴歸分析圖以及預測業績曲線。進一步判斷消費者花費在哪一區間時,會有最佳報酬;若要拉高預算,可以獲得多少業績!一. 透過迴歸分析來判斷廣告投放成效落點
資料搜集與製圖
- 在Excel表或Google sheet上填入廣告花費及業績
- 匡選這兩欄數字,並點選插入圖表(可以針對想強調的時間區間給予不同的顏色)
- 出現如下圖的分佈圖表
- 查看圖表編輯區,並勾選下方的趨勢線
- 點選下方趨勢線後,點擊對數
預算/業績分佈圖[/caption]
注意這邊可以選擇指數、多項式、對數,以最貼合整體趨勢為主。不過要小心有無違反廣告常識,例如:隨著花費上升,整體業績斜率應逐漸趨緩(CPA 有優化上限)。
[caption id="attachment_11688" align="alignnone" width="1017"]
搭配趨勢線分佈圖[/caption]
如何進一步判斷成效:
有兩種方法:- 同花費下,趨勢線上下點數
- 進一步畫出目標ROAS線,預估各業績區間 ROAS 的可能
- 趨勢線上下點數代表在固定花費下,整體表現是優於(線以上的點多)還是低於(線以下的點多)整體平均。我們能夠大致透過肉眼觀察,在某一個預算花費的情況下,有最多在「線上」的點,就能知道這個預算是目前最合適的花費水準。
- 先點選剛剛的趨勢線
- 找到標籤處(Label),並點選方程式(Equation)
- 即可找出這條趨勢線的公式
- 將花費代入 x,即可得出預計投放業績 y
- 下拉出所有投放金額預計的投放業績
- 將「業績」與「預計投放業績」相減,若「預計投放業績」是負數,則當作 0 計算。在這個步驟,我們可以用排序與篩選功能,將整個表格以花費大小排序,方便我們接下來的操作。
- 觀察花費的區間,並分成 3-5 個組合。再利用「countif」工具找出區間裡「業績>預計投放業績」的數,並算出比例(公式:=COUNTIF(區間,">0"))
- 加總「業績-預計投放業績」及平均「業績-預計投放業績」
不同花費級距下,實際與預估業績之間的關係[/caption]
- 從圖表觀察,在 $3,500 以下的區間中,有大部分的時候,我們獲得的業績都是優於趨勢線的預估的。整體而言我們已經站穩前面兩個區間。$3,501 ~ $4,000 這個區間則是我們可以努力優化的位置,透過優化廣告的方式,來讓業績>業績預估值的數量愈來愈多。
- 畫出目標 ROAS 線的動作,可以協助我們更好的判斷未來廣告目標,與目前廣告花費趨勢的關係。例如:要維持廣告 ROAS=5,我們需要將預算調高到哪個區間範圍;相對應的業績還需要再提高多少。以上都可以進一步作為未來 CPA,或是客單價的目標。
搭配 ROAS 線分析成效[/caption]
二. 透過機器學習模型來判斷廣告成效落點
在上面的範例中,我們單純將「花費」與「業績」的關係拉出來做比較,嘗試透過趨勢來預估未來業績。但當我們想將多一點變因納入考量時,透過試算表來操作就會顯得困難重重, 預估的結果也有可能失準。 進一步來看,上述迴歸範例中,我們使用一條趨勢線來作為評斷成效的標準。有沒有可能透過其他方式,來更客觀、更快速的決定這個標準,或是找出我們無法透過簡單迴歸分析觀察的趨勢呢?接下來我們就要利用機器學習,來幫助我們預估未來可能的業績。模型原理
接下來的演算模型,它擁有的特色是:我們用機器學習做算法基礎,導入廣告投放數據,讓原有的演算模型運用龐大的真實資料庫進行深度學習,並搭配 Chat-GPT 協作調整模型架構,最後能完成連續性數值的迴歸預測。在算法方面,我們以近年機器學習常勝軍 XGboost(Extreme Gradient Boosting)算法來做為基礎,來協助我們快速的完成預估。 [caption id="attachment_11692" align="alignleft" width="1024"]
匯入必備函式庫[/caption]
選擇分析的廣告指標
如同上面所提,廣告指標不只包含花費與業績。CPC、CTR 都是很基礎的廣告指標,對於廣告最終的成效,也是有一定影響力的。最終我們選定 CPC、CTR、單日花費、單日業績,作為模型訓練的四個指標。 在我們納入更多變數,來嘗試提升預測準確度時,我們也要注意愈多變數並不永遠代表更高的準確度。因此在選定指標做模型訓練時,嘗試找出最有代表性的指標,反而是前期需要花費較多心力的部分。刪除離群值資料
我們進一步抓出過度離群的資料,讓模型的預估更有代表性。在我們實作的範例中,我們將單日 ROAS>19,與單日 ROAS<1 這兩個條件的數據剔除。 [caption id="attachment_11693" align="alignnone" width="1024"]
剔除離群值[/caption]
定義特徵、目標與訓練模式
獲得乾淨的數據之後,接下來我們將 CPC、CTR、單日花費等三個指標定為特徵(X),並把單日業績定為目標(y)。接下來我們將資料集用隨機方式切分:70% 的資料作為訓練集,並拿剩餘的 30% 資料作為測試集。這邊的目的是,我們會利用測試集來「檢驗」前面我們訓練集訓練出來的模型,面對未知的數據時,表現得如何。
至於要如何評斷模型的表現,我們就要依賴如 MSE、R2 等指標,來協助我們判斷模型在這次大考,究竟考得如何。
[caption id="attachment_11694" align="alignnone" width="1024"]
加入評估指標[/caption]
