數(shù)據(jù)分析+數(shù)據(jù)挖掘告訴你:電商銷售額與哪些因素有關(guān)?
時(shí)間:2023-03-15 23:42:01 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-15 23:42:01 來(lái)源:電子商務(wù)
轟轟烈烈的“雙十一大戰(zhàn)”剛剛落下帷幕。作為電商行業(yè)一年一度的“大戰(zhàn)”,各家電商和品牌方都在摩拳擦掌,火力全開(kāi)。作為品牌方,想要在電商大戰(zhàn)中拔得頭籌,那么,對(duì)消費(fèi)者的洞察就必不可少。
品牌方對(duì)消費(fèi)者的購(gòu)買行為了解地越透徹,就越能有效地幫助企業(yè)更有針對(duì)性地開(kāi)展市場(chǎng)營(yíng)銷活動(dòng)。今天,我們就借助文獻(xiàn)Sakar, C.O., Polat, S.O., Katircioglu, M. et al. Neural Comput & Applic (2018) 中的一份公開(kāi)樣本數(shù)據(jù),
結(jié)合JMP軟件來(lái)對(duì)網(wǎng)購(gòu)用戶購(gòu)買行為做一些有趣的探索性數(shù)據(jù)分析。
Step.1 數(shù)據(jù)獲取
原始數(shù)據(jù)來(lái)源原始數(shù)據(jù)的獲取,可以通過(guò)以下網(wǎng)址下載csv格式原始數(shù)據(jù)到本地,并通過(guò)JMP打開(kāi):
https://archive.ics.uci.edu/ml/machine-learning-databases/00468/也可以直接利用JMP的網(wǎng)頁(yè)讀取功能,直接獲取網(wǎng)頁(yè)端數(shù)據(jù)。
(JMP操作:文件-> 從internet打開(kāi) ->網(wǎng)頁(yè))數(shù)據(jù)介紹該數(shù)據(jù)集包含12,330 名網(wǎng)購(gòu)用戶一年內(nèi)在該網(wǎng)站的購(gòu)買行為,以及對(duì)應(yīng)的17個(gè)用戶特征記錄和最終交易結(jié)果。
17個(gè)特征記錄,包括10個(gè)數(shù)值型特征,7個(gè)分類型特征。
@No.1 基本信息
管理類網(wǎng)頁(yè),管理類停留時(shí)間,信息類網(wǎng)頁(yè),信息類停留時(shí)間,產(chǎn)品類網(wǎng)頁(yè),產(chǎn)品類停留時(shí)間,表示用戶在不同類型網(wǎng)頁(yè)上的打開(kāi)數(shù)量及停留時(shí)間總和;
@No.2 跳出率
跳出率表示從某個(gè)特定路徑進(jìn)入網(wǎng)站頁(yè)面,有多少百分比的用戶什么都沒(méi)有做,就直接離開(kāi)了網(wǎng)站,它既可作為衡量整個(gè)網(wǎng)站的度量,也可作為衡量頁(yè)面的度量。
@No.3 退出率
退出率表示對(duì)某一個(gè)特定頁(yè)面而言,從這個(gè)頁(yè)面離開(kāi)網(wǎng)站占所有訪問(wèn)到這個(gè)頁(yè)面的百分比,一般作為衡量頁(yè)面的度量;
@No.4 頁(yè)面價(jià)值
頁(yè)面價(jià)值表示用戶在完成交易之前訪問(wèn)過(guò)的網(wǎng)頁(yè)的平均值;
@No.5 特殊日
特殊日表示站點(diǎn)訪問(wèn)時(shí)間與特定特殊日子的間隔;
@No.6 其他
此外還包括用戶使用的操作系統(tǒng)、瀏覽器、區(qū)域、流量類型、訪客類型,是否為周末以及一年中的月份信息。
Step.2 可視化探索性分析
跳出率的好壞(高低)關(guān)系到網(wǎng)絡(luò)營(yíng)銷的成功與否客戶僅僅查看單個(gè)頁(yè)面后退出,讓品牌方很難有機(jī)會(huì)說(shuō)服消費(fèi)者購(gòu)買產(chǎn)品,畢竟他們只瀏覽了一頁(yè)。讓我們來(lái)查看下跳出率的情況吧。(
JMP操作:分析-> 分布)
從圖上可以看出,90%客戶的跳出率低于6%,所有用戶的平均跳出率只有2%,是不是很完美?請(qǐng)先不要著急高興。它可能是不準(zhǔn)確的,或許是網(wǎng)站的分析跟蹤代碼如何集成到站點(diǎn)出現(xiàn)了技術(shù)問(wèn)題。因?yàn)楦鶕?jù)以往經(jīng)驗(yàn),“正?!碧雎试?40%-60% 之間,低于 40% 是非常罕見(jiàn)的,高于 70% 是令人擔(dān)憂的,并且是需要趕緊采取行動(dòng)的。
當(dāng)前跳出率超出預(yù)期范圍并且看起來(lái)“好得令人難以置信”,應(yīng)該是網(wǎng)站中的某個(gè)地方重復(fù)的分析代碼造成的。
用戶數(shù)值型特征的多元探索在做購(gòu)物行為分析的時(shí)候,用戶的數(shù)值型特征可能維度很多,
借助JMP的多元分析方法,可以快速發(fā)現(xiàn)各個(gè)維度之間的關(guān)系,并有可能實(shí)現(xiàn)降維操作,為后續(xù)的特征監(jiān)控減少不必要的資源浪費(fèi)(
JMP操作:分析 -> 多元方法 ->多元)。
基于當(dāng)前數(shù)據(jù),用戶在各個(gè)不同類型網(wǎng)頁(yè)上的打開(kāi)數(shù)量和停留時(shí)間成正相關(guān), 這個(gè)很好理解。跳出率和退出率因?yàn)橛?jì)算公式相似也成明顯正相關(guān),此外,沒(méi)有發(fā)現(xiàn)明顯的數(shù)值特征相關(guān)。
用戶上網(wǎng)方式對(duì)銷售的影響通過(guò)下圖卡方檢驗(yàn)的統(tǒng)計(jì)結(jié)果,我們可以捕捉到完成交易與否與客戶的操作系統(tǒng)、瀏覽器類型和流量類型之間的關(guān)系。(
JMP操作:分析->以X擬合Y)
就操作系統(tǒng)而言,不同操作系統(tǒng),用戶完成交易的比例是不一樣的。
通過(guò)圖形也能看出,
操作系統(tǒng)是“2”的時(shí)候略高,而“1”和“3”則偏低,這可能意味著網(wǎng)站頁(yè)面對(duì)這些操作系統(tǒng)的支持不夠友好,如果要提升這部分的收益轉(zhuǎn)化,則需要做出相應(yīng)的改進(jìn)。同理,對(duì)瀏覽器類型和流量類型,我們也看到了他們對(duì)用戶完成交易比例的統(tǒng)計(jì)學(xué)影響,說(shuō)明網(wǎng)站在這方面也有改進(jìn)空間。
新老客戶和工作日/周末對(duì)銷售的影響借助2.3部分卡方檢驗(yàn)的方法,我們也能快速發(fā)現(xiàn)一些新老客戶和工作日/周末對(duì)銷售的規(guī)律,但這里嘗試另一種數(shù)據(jù)表匯總的方法(
JMP操作:分析-> 消費(fèi)者研究 -> 分類)。
結(jié)合上面的圖形和數(shù)據(jù),能清楚地看到:
- 老客戶是網(wǎng)站訪問(wèn)的主力,說(shuō)明網(wǎng)站在客戶維系上做得很好;
- 但是我們也看到,不管是在平日(13.2% vs 26.1%)還是在周末(16.5% vs 21.9%),新客戶的完成交易的比例都要高于老客戶,這說(shuō)明網(wǎng)站可以在老客戶的轉(zhuǎn)化率上做出些改進(jìn)。
- 比如老客戶在購(gòu)買商品的時(shí)候可以通過(guò)介紹新客戶的方式來(lái)享受更大的折扣,這樣既調(diào)動(dòng)了老客戶的購(gòu)買熱情,也為網(wǎng)站增加了更多的新客戶。
多樣分析結(jié)果的集中展示
如果想把各種分析圖表以報(bào)表的形式集中展示, 可以通過(guò)JMP的腳本功能,就可以一鍵實(shí)現(xiàn)報(bào)表鏈接數(shù)據(jù)的實(shí)時(shí)更新,節(jié)省大量的重復(fù)性手動(dòng)操作(JMP操作:文件 -> 新建 -> 應(yīng)用程序)。
以上是一些探索性數(shù)據(jù)分析的結(jié)果。下面,我們來(lái)進(jìn)一步嘗試用
數(shù)據(jù)挖掘的方法對(duì)上面提到的用戶主要特征與交易結(jié)果建立量化的統(tǒng)計(jì)模型。
Step.3 數(shù)據(jù)預(yù)測(cè)建模
通過(guò)決策樹(shù),篩選影響銷售的關(guān)鍵特征決策樹(shù)是一種有監(jiān)督學(xué)習(xí)方法,能夠從一系列有特征和標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹(shù)狀圖的結(jié)構(gòu)來(lái)呈現(xiàn)這些規(guī)則,結(jié)果解釋方便,在各個(gè)行業(yè)和領(lǐng)域都有著廣泛的應(yīng)用(
JMP操作:分析 -> 預(yù)測(cè)建模 -> 分割)。
從圖中我們可以觀察決策樹(shù)的各個(gè)階段,從上到下顯示影響交易結(jié)果的最重要的特征。
其中最重要的是
網(wǎng)頁(yè)價(jià)值,網(wǎng)頁(yè)價(jià)值低于0.067和高于0.067的成交比率分別為3.85%和56.4%,差距明顯。后面還有些比較重要的特征參數(shù)也都一并列出,比如
跳出率,月份和產(chǎn)品相關(guān)頁(yè)面等,
這些信息都是驅(qū)動(dòng)交易結(jié)果的重要因素,現(xiàn)在可以快速被挑選展示出來(lái),從而讓品牌方有了一個(gè)更清晰的改進(jìn)優(yōu)化重點(diǎn)。優(yōu)中選優(yōu),更多數(shù)據(jù)挖掘方法的嘗試除了決策樹(shù),JMP還提供了諸如
神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、提升樹(shù)和支持向量機(jī)等多種數(shù)據(jù)挖掘的方法,并且可以輕松完成模型算法之間的比較,實(shí)現(xiàn)
優(yōu)中選優(yōu)。
通過(guò)JMP Pro 16 全新的
模型篩選來(lái)對(duì)多種數(shù)據(jù)挖掘方法一次性完成比較,在這之前,為了防止構(gòu)建的模型過(guò)擬合,
可以先按照訓(xùn)練集,測(cè)試集,驗(yàn)證集 6:2:2的比例對(duì)原始數(shù)據(jù)進(jìn)行拆分,生成驗(yàn)證列(JMP操作:分析->預(yù)測(cè)建模 ->生成驗(yàn)證列)。
如下圖所示,
一次輸入特征參數(shù)和交易結(jié)果,平臺(tái)會(huì)同時(shí)構(gòu)建多個(gè)算法模型,并自動(dòng)篩選出當(dāng)前的最佳建模方法為隨機(jī)森林,模型在測(cè)試集上的表現(xiàn),也就是對(duì)將來(lái)新數(shù)據(jù)的預(yù)測(cè)能力R方達(dá)到了0.6,預(yù)測(cè)準(zhǔn)確性達(dá)到了90.7%。精確的預(yù)測(cè)模型可以幫助品牌方盡早了解每一個(gè)用戶可能的交易結(jié)果,尤其是預(yù)測(cè)交易失敗的情況,提早做出應(yīng)對(duì)和補(bǔ)救,比如打折,比如在客戶退出頁(yè)面前彈出挽留界面等(
JMP操作:分析 -> 預(yù)測(cè)建模 ->模型篩選)。
看了今天的分析,是不是讓你在“電商大戰(zhàn)”中更有信心了呢?
對(duì)品牌方而言,提供個(gè)性化的產(chǎn)品與服務(wù),并針對(duì)個(gè)別需求做出一對(duì)一的營(yíng)銷,是網(wǎng)絡(luò)營(yíng)銷相對(duì)于傳統(tǒng)營(yíng)銷的一個(gè)巨大優(yōu)勢(shì)。
結(jié)合JMP數(shù)據(jù)分析軟件,通過(guò)對(duì)網(wǎng)購(gòu)用戶消費(fèi)行為的深入分析,可以幫助企業(yè)設(shè)計(jì)出更能滿足目標(biāo)顧客群需求的特色網(wǎng)頁(yè),并及時(shí)針對(duì)發(fā)現(xiàn)的潛在問(wèn)題,做出相應(yīng)的改進(jìn),從而為企業(yè)帶來(lái)更大的收益。最后,如果你也想在JMP中自己動(dòng)手試試看的話,可掃描二維碼下載試用:
?
關(guān)鍵詞:數(shù)據(jù),銷售,挖掘,分析