機器學習與Python行銷數據分析

-校內作品

大四時，希望能透過多方面學習，且在目前數據驅動行銷的趨勢下，加強自己觀察數據並加以分析的能力，選修了Python行銷數據分析相關的課程，從資料處理、資料視覺化、爬蟲到資料分析、建模等，在經過了一年的學習，對於如何解讀數據及Python有了基礎的認識。

一、使用RFM模型分析，並將顧客分群進行行銷洞察給予行銷方案

(此將省略前期的資料前置處理，著重在行銷洞察上)

使用Opendata - OnlineRetail.csv (某線上零售商八個月內顧客的購買紀錄)

將原始資料集進行資料前置處理後，儲存的新資料集為-OR_Processed.csv，包含InvoiceNo、InvoiceDate、CustomerID、Total_Amount、InvMonth，共約34萬筆資料。

將新資料集(OR_Processed.csv) 應用 RFM 模型做顧客區隔:

R - 計算最近購買日期(Recency) - 客戶代碼+購買日期 [R_Flag]

F - 計算購買頻率(Frequency) - 客戶代碼 + 發票號碼 [F_Flag]

M - 計算購買金額(Monetary) - 客戶代碼 + 購買金額 [M_Flag]

將RFM合併儲存另一個資料集(OnlineRetail_RFM.csv) 將進行分群，並給予行銷洞察。

接下來將使用K-means演算法對資料進行分群

[Code: 8~27行]

載入資料集後，先使用Elbow法，決定要分為幾群 :

由下圖Elbow graph來看，分成3、4、5群皆可行，

但以不超過5群為原則，此次練習分為5群。

[Code: 30~56行]

使用K-means將客戶分為5群後，匯出RFM圖，並以三角形標出各群重心點 :

行銷洞察與可行的行動方案 :

共分為5群Cluster 0~4 ，各群重心分別約為 :
Cluster 0:[5,2,4]、Cluster 1:[2,2,2]、Cluster 2:[5,2,3]、Cluster 3:[5,2,5]、Cluster 4:[3,2,3]

依照各客群重心的RFM數值，區分客群價值高低 :

Cluster 3 > Cluster 0 > Cluster 2 > Cluster 4 > Cluster 1

以下針對不同客群，制定不同行銷方案 :

- Cluster 3 : 高價值客群，有較高活躍度(R)及較高購買金額(M)，屬於新貴客、重點發展客戶。
- Cluster 0 : 中高價值客群，有高活耀度(R)及高購買金額(M)，屬於新貴客、重點發展客戶。
上面兩個客群(3&0)，可為商家帶來最多的價值，是最近一次消費時間較近、消費金額高，
但頻率不高、忠誠度不高的潛力客戶，所以企業必須嚴格檢視每一次服務體驗，是否讓客戶非常滿意，
或是可以定期寄送專屬獨家優惠，提升此客群消費的頻率，及保持與他們的聯繫。

- Cluster 2 : 中價值客群，有高活躍度(R)並有適度的購買金額(M)，屬於新客，一般發展客戶。
此客群距離上次消費時間近(R)，但購買頻率(F)及消費金額(M)都偏低，所以要提升消費頻率及金額，
可以推出一些符合此客群的優惠組合(例如:買第二件6折 or 將客戶常會一起購買的產品放在旁邊
(or優惠組合)...)，並定期更換組合。

- Cluster 4 : 中低價值客群，有適度的活耀度(R)及購買金額(M)，屬於普通客，一般發展客戶。
- Cluster 1 : 低價值客群，活耀度(R)及購買頻率(F)都偏低，屬於一次性消費客人，一般挽留客戶。
上面兩個客群(4&1)，對於RFM分數都較低的客群，我認為要調整在此客群上投入的行銷預算，若對此
客群投放廣告及寄送優惠郵件後，過了一段時間，分數還是沒有提升的話，就可以考慮將此客群從行
銷名單中刪除，或減少行銷預算。

總結 :

我覺得此商家的顧客的購物頻率(F)都偏低，顧客生命週期短，可能此商家賣的產品大多是屬於3C產品
或耐用品，所以這個商家會有較多新顧客，因此建議寄送歡迎信的優惠，或是提供產品訊息、新手適用
指南，讓他們更瞭解公司，並同時要加強在會員制度的改善、提供優惠的頻率及產品推陳出新的速度，
強化消費者對公司的忠誠度。另外可以多銷售一些或加強行銷在消耗週期短，購買頻率很高的產品，藉
此提升消費者光顧的意願。

二、機器學習 - 建立分類分析模型，找出重要的預測因⼦，供未來的⾏銷活動參考

載入套件&資料集、資料前置處理

01

資料拆分、訓練&測試資料、建模、預測&評估模型

02

模型優化 (特徵選取 & 超參數調整)

03

04

行銷洞察與

可行的行動

方案

使用Opendata - Bankdata.csv (某銀行行銷的歷史資料集)

資料集共有17個Column :

1.資料前置處理

載入必要套件&資料集
載入資料集後，檢查是否有遺漏值及重複值，接著開始處理類別資料，使用One-Hot Encoding (.get_dummies)，一次將需要處理的資料完成，並使用drop_first=True，去掉每個類別中的第一項，避免過度凝合。
準備label資料(y-客戶是否決定要定期存款)。
檢查前7項(未進行類別處理的)特徵相關性。