隨著互聯(lián)網(wǎng)的發(fā)展，人們越來越多地依靠網(wǎng)上購物，電商平臺的發(fā)展已然成為趨勢，特別是在本次的疫情期間電商更是得到飛速的發(fā)展。國內(nèi)電商的快速發(fā)展對傳統(tǒng)貿(mào)易帶來沖擊，加上網(wǎng)購時代的到來以及互聯(lián)網(wǎng)發(fā)展，跨境電商" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

首頁

解決方案&服務(wù)

客戶&案例

營銷資訊

關(guān)于我們

18143453325 或

在線咨詢

所在位置：首頁 > 營銷資訊 > 電子商務(wù) > 電商用戶銷售數(shù)據(jù)分析

電商用戶銷售數(shù)據(jù)分析

時間：2023-03-15 23:04:02 | 來源：電子商務(wù)

時間：2023-03-15 23:04:02 來源：電子商務(wù)

項(xiàng)目背景

隨著互聯(lián)網(wǎng)的發(fā)展，人們越來越多地依靠網(wǎng)上購物，電商平臺的發(fā)展已然成為趨勢，特別是在本次的疫情期間電商更是得到飛速的發(fā)展。國內(nèi)電商的快速發(fā)展對傳統(tǒng)貿(mào)易帶來沖擊，加上網(wǎng)購時代的到來以及互聯(lián)網(wǎng)發(fā)展，跨境電商也隨之興起。

一、項(xiàng)目介紹

數(shù)據(jù)集來自UCI加州大學(xué)歐文分校機(jī)器學(xué)習(xí)庫，該數(shù)據(jù)集包含2010年12月12日至2011年12月9日之間在英國注冊的非商店在線零售的所有交易。該公司主要銷售獨(dú)特的全時禮品。公司的許多客戶都是批發(fā)商。對該數(shù)據(jù)進(jìn)行數(shù)據(jù)分析，了解用戶消費(fèi)行為。

工具：jupyter notebook

數(shù)據(jù)源：

二、提出問題

根據(jù)項(xiàng)目需要研究數(shù)據(jù)產(chǎn)生的業(yè)務(wù)背景，在對數(shù)據(jù)進(jìn)行深入的分析，這樣得到數(shù)據(jù)分析的參考性就越有價值。電商數(shù)據(jù)分析指標(biāo)有一系列的指標(biāo)體系和分析方法。可以參考

根據(jù)該數(shù)據(jù)集提出問題：

根據(jù)數(shù)據(jù)集提出問題如下：

訂單維度：筆單價，連帶率，訂單金額和商品數(shù)量的關(guān)系？
客戶維度：客單價，客戶消費(fèi)金額和消費(fèi)件數(shù)的關(guān)系？
商品維度：價格定位，價格定位與商品銷售量、銷售額的關(guān)系？
時間維度：每月/日銷售趨勢，影響因素有哪些？
區(qū)域維度：客戶分布，客戶消費(fèi)能力分布，主要消費(fèi)市場？
客戶行為：客戶的生命周期、留存情況、購買周期如何？

三、理解數(shù)據(jù)

四、數(shù)據(jù)清洗

4.1導(dǎo)入數(shù)據(jù)

#導(dǎo)入包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.style.use("bmh")plt.rc('font',family='SimHei', size=13)%matplotlib inline#導(dǎo)入數(shù)據(jù)data_df = pd.read_excel('OnlineRetail.xlsx', sheet_name='Online Retail',dtype=str )

4.2查看數(shù)據(jù)

#查看數(shù)據(jù)信息data_df.info()data_df.shape#查看前五行data_df.head(3)可以發(fā)現(xiàn)：

(1)由于導(dǎo)入數(shù)據(jù)選擇數(shù)據(jù)類型dtype=str，所以各列數(shù)據(jù)類型都是Object

(2)InvoiceDate時間包含日期和時分秒信息，訂單、商品和客戶都存在多次行為。

4.3列名重命名

#列名重命名data_df.rename(columns={'InvoiceDate':'InvoiceTime'},inplace=True)4.4刪除重復(fù)值

刪除所有字段重復(fù)的記錄

#刪除重復(fù)值rows_before = data_df.shape[0]data_df.drop_duplicates(inplace = True)rows_after = data_df.shape[0]print('原行數(shù)：{0}，現(xiàn)行數(shù)：{1}，刪除行數(shù)：{2}'.format(rows_before,rows_after,rows_before-rows_after))#刪除后，重設(shè)索引data_df.reset_index(drop = True, inplace = True)

可以發(fā)現(xiàn)：原始數(shù)據(jù)541909條記錄數(shù)，刪除5268記錄數(shù)，即有5268條重復(fù)記錄

4.5缺失值處理

統(tǒng)計(jì)缺失值：

#查看缺失值data_df.isnull().sum().sort_values(ascending=False)#統(tǒng)計(jì)數(shù)據(jù)各列缺失數(shù)量和比例def missing_value_table(data):    #統(tǒng)計(jì)缺失數(shù)量    mis_val = data.isnull().sum()    #缺失占比百分?jǐn)?shù)    mis_val_percent = mis_val/len(data)    #結(jié)果制作一個表格    mis_val_table = pd.concat([mis_val,mis_val_percent], axis = 1)    #給類名重命名    mis_val_table_rename = mis_val_table.rename(columns={0:'Missing Values',1:'% of Total Values'})    #對結(jié)果進(jìn)行排序    mis_val_table_rename = mis_val_table_rename[mis_val_table_rename.iloc[:,1] != 0].sort_values('% of Total Values',ascending=False).round(1)    return mis_val_table_rename#統(tǒng)計(jì)缺失值missing_value_table(data_df)

可以發(fā)現(xiàn)：

(1)CustomerID特征缺失135037條記錄，缺失率達(dá)到30%，Description特征僅缺失1454條

(2)Description特征是商品的描述信息，不是分析重點(diǎn)，可以不進(jìn)行填充

(3)CustomerID特征是客戶的唯一編號，是客戶維度分析的重要特征。缺失量大多不適合刪除?？蛻艟幪柌贿m合用插值法、均值法，數(shù)據(jù)量大不適合用眾數(shù)。這里采用‘0’進(jìn)行填充。

#查詢數(shù)據(jù)中是否存在0號客戶data_df[data_df['CustomerID']=='0'].shape[0]#用0填充CustomerIDdata_df['CustomerID'].fillna('0',inplace=True)#再次統(tǒng)計(jì)缺失值data_df.isnull().sum().sort_values(ascending = False)

可以發(fā)現(xiàn)，客戶單號已經(jīng)不存在缺失值了

4.6一致化處理

4.6.1時間信息一致化處理

將InvoiceTime特征轉(zhuǎn)化為datetime格式，并新增月Month、日Day、時Hour特征列

#一致化處理data_df['InvoiceTime'] = pd.to_datetime(data_df['InvoiceTime'],errors = 'coerce')#新增Date特征data_df['Date'] = pd.to_datetime(data_df['InvoiceTime'].dt.date,errors = 'coerce')#新增特征Month特征data_df['Month'] = data_df['InvoiceTime'].astype('datetime64[M]')#查看特征信息data_df.info()

4.6.2數(shù)據(jù)類型一致化處理

把UnitPrice特征轉(zhuǎn)為浮點(diǎn)型，Quantity和CustomerID轉(zhuǎn)為整型

#類型轉(zhuǎn)換data_df['Quantity'] = data_df['Quantity'].astype('int32')data_df['UnitPrice'] = data_df['UnitPrice'].astype('float')data_df['CustomerID'] = data_df['CustomerID'].astype('int32')#添加總價SumPrice特征sales_df['SumPrice'] = sales_df['Quantity'] * sales_df['UnitPrice']

4.7異常值處理

進(jìn)行描述性統(tǒng)計(jì)：

data_df.describe()可以發(fā)現(xiàn)，特征Quantity、UnitPrice、SumPrice存在負(fù)值，且絕對值的數(shù)量較大,SumPrice特征是根據(jù)Quantity和UnitPrice相乘得到，二者之一為負(fù)值。

#查看Quantity、UnitPrice、SumPrice的記錄數(shù)data_df[(data_df['Quantity'] <= 0)|(data_df['UnitPrice'] <= 0)].shape[0]#查看前5條記錄data_df[(data_df['Quantity'] <= 0)|(data_df['UnitPrice'] <= 0)].head()

可以發(fā)現(xiàn)：數(shù)據(jù)有兩類(1)C字頭被取消的訂單(2)單價為0的訂單

4.7.1C字頭被取消的訂單

這里把成功訂單和取消訂單分開保存

query_c = data_df['InvoiceNo'].str.contains('C')#只含取消訂單data_cancel = data_df.loc[query_c,:].copy()#只含成功訂單data_success = data_df.loc[-query_c,:].copy()#為sales_cancel增加字段SrcInvoiceNo，用于存放去掉“C”的發(fā)票編號data_cancel['SrcInvoiceNo'] = data_cancel['InvoiceNo'].str.split('C',expand=True)[1]print('原始訂單記錄：{0}，取消訂單記錄數(shù)：{1}，成功訂單記錄數(shù)：{2}'.format(data_df.shape[0],data_cancel.shape[0],data_success.shape[0]))

可以發(fā)現(xiàn)，取消訂單數(shù)和成功訂單數(shù)沒有重合

4.7.2免費(fèi)訂單（單價為0）

免費(fèi)訂單會對訂單量、件單價、連帶率指標(biāo)的計(jì)算造成影響，頁單獨(dú)用表存放，方便后面對免費(fèi)訂單進(jìn)行分析

query_free = data_success['UnitPrice'] == 0# 只含免費(fèi)訂單data_free = data_success.loc[query_free,:].copy()# 只含普通訂單data_success = data_success.loc[-query_free,:]#查看處理后的描述統(tǒng)計(jì)data_success.describe()

可以發(fā)現(xiàn)，還有異常值時，單價為負(fù)值的訂單

4.7.3單價為負(fù)的訂單

#查看單價為負(fù)值的訂單query_minus = data_success['UnitPrice'] < 0#正常訂單數(shù)據(jù)data_success = data_success.loc[-query_minus,:]data_success.shape

可以發(fā)現(xiàn)，經(jīng)過數(shù)據(jù)清洗之后，數(shù)據(jù)還剩data_success還剩524878條記錄。

五、數(shù)據(jù)可視化

5.1訂單維度(InvoiceNo特征)

#data_success根據(jù)訂單號進(jìn)行分組，對Quantity的商品數(shù)量和SumPrice的總價進(jìn)行分組求和：innovice_grouped = data_success.groupby('InvoiceNo')[['Quantity','SumPrice']].sum()innovice_grouped.describe()

可以發(fā)現(xiàn)：
(1)該數(shù)據(jù)共有訂單數(shù)19960，訂單均價為533英鎊，連帶率為279，說明訂單是以批發(fā)為主。

(2)數(shù)量和總價的均值已經(jīng)超過中位數(shù)，總價甚至已經(jīng)超過了Q3分位數(shù)，說明客戶購買力差距比較大，存在一些購買力比較強(qiáng)的客戶，拉過高總價的均值。

#訂單總交易分布圖f,[ax1, ax2] = plt.subplots(2,1,figsize=(12,10))sns.distplot(innovice_grouped['SumPrice'],bins=100,kde=False,ax=ax1,            hist_kws={'alpha':1,'color':'g'})ax1.set_title('SumPrice Distribution of Orders')ax1.set_ylabel('Frequency')ax1.set_xlabel('SumPrice')sns.distplot(innovice_grouped[innovice_grouped.SumPrice<1000]['SumPrice'],bins=100,kde=True,color='r',ax=ax2,            hist_kws={'alpha':0.8,'color':'g'})ax2.set_title('SumPrice Distribution of Orders (Below 1000)')ax2.set_ylabel('Frequency')ax2.set_xlabel('SumPrice')plt.savefig('1-1.png')

可以發(fā)現(xiàn)，400英鎊以內(nèi)的訂單金額占比較大，有三個峰值，分別是20、100-220、300-330英鎊，這些區(qū)域的訂單數(shù)量比較多。

對訂單的商品數(shù)量進(jìn)行分析

#全部訂單數(shù)量分布f,[ax1, ax2] = plt.subplots(2,1,figsize=(12,10))sns.distplot(innovice_grouped['Quantity'],bins=100,kde=False,ax=ax1,            hist_kws={'alpha':1,'color':'g'})ax1.set_title('SumPrice Distribution of Orders')ax1.set_ylabel('Frequency')ax1.set_xlabel('SumPrice')#單筆訂單數(shù)量小于2000分布sns.distplot(innovice_grouped[innovice_grouped['Quantity']<2000]['Quantity'],bins=100,kde=True,color='r',ax=ax2,            hist_kws={'alpha':0.8,'color':'g'})ax2.set_title('SumPrice Distribution of Orders (Below 1000)')ax2.set_ylabel('Frequency')ax2.set_xlabel('SumPrice')

可以發(fā)現(xiàn)，在總體訂單分布中存在大量訂單使得數(shù)據(jù)較大，訂單量小于2000分布時，商品數(shù)量呈現(xiàn)長尾分布，大部分訂單的商品數(shù)量集中在300以內(nèi)，同時，訂單商品數(shù)量越多，訂單越少。

繪制訂單交易金額和單筆訂單商品數(shù)的散點(diǎn)圖：

plt.figure(figsize=(14,4))plt.subplot(121)plt.scatter(innovice_grouped['Quantity'], innovice_grouped['SumPrice'], color='g')plt.title('SumPrice & Quantity')plt.ylabel('SumPrice')plt.xlabel('Quantity')# 篩去商品件數(shù)在20000及以上的訂單plt.subplot(122)plt.scatter(innovice_grouped[innovice_grouped.Quantity < 20000]['Quantity'], innovice_grouped[innovice_grouped.Quantity < 20000]['SumPrice'], color = 'g')plt.title('SumPrice & Quantity (Quantity < 20000)')plt.ylabel('SumPrice')plt.xlabel('Quantity')

可以發(fā)現(xiàn)，訂單的交易金額和訂單商品的數(shù)量在總體趨勢上呈正比，即訂單商品數(shù)量越多，定金額越多。同時在數(shù)量接近0的位置，存在高價訂單。

5.2客戶維度(CustomerID特征)

這里僅對CustomerID特征值不為空的記錄進(jìn)行分析：

#僅對含有CustomerID的客戶進(jìn)行分析：data_customer = data_success[data_success['CustomerID'] != 0].copy()#按照客戶ID和訂單編號分組customer_grouped = data_customer.groupby(['CustomerID','InvoiceNo'])[['Quantity','SumPrice']].sum()#重設(shè)索引customer_grouped = customer_grouped.reset_index()#統(tǒng)計(jì)每個客戶的訂單數(shù)、商品數(shù)量和訂單金額customer_grouped =  customer_grouped.groupby('CustomerID').agg({'InvoiceNo': np.size, 'Quantity': np.sum, 'SumPrice': np.sum})描述性統(tǒng)計(jì)customer_grouped.describe()

可以發(fā)現(xiàn)：

(1)人均下單數(shù)4次，中位數(shù)2次，有至少25的人僅下過一次單，沒有留存。

(2)共有4338為客戶，每位客戶平均購買商品件數(shù)1187件，甚至超過了Q3分位數(shù)，最大值為196915件。

(3)每位客戶的平均消費(fèi)額為2048英鎊，超過Q3分位數(shù)，最大消費(fèi)金額280206英鎊，說明存在強(qiáng)力消費(fèi)客戶，拉高了平均消費(fèi)金額。

進(jìn)一步分析觀察客戶消費(fèi)金額分布：

#客戶消費(fèi)金額分布f,[ax1, ax2] = plt.subplots(2,1,figsize=(12,10))sns.distplot(customer_grouped['SumPrice'],bins=50,kde=False,ax=ax1,            hist_kws={'alpha':1,'color':'r'})ax1.set_title('SumPrice Distribution of Customers')ax1.set_ylabel('Frequency')ax1.set_xlabel('SumPrice')#消費(fèi)金額低于5000的客戶分布sns.distplot(customer_grouped[customer_grouped['SumPrice']<5000]['SumPrice'],bins=60,kde=True,color='g',ax=ax2,            hist_kws={'alpha':0.8,'color':'r'})ax2.set_title('SumPrice Distribution of Customers (Below 5000)')ax2.set_ylabel('Frequency')ax2.set_xlabel('SumPrice')

可以看出，大部分客戶的消費(fèi)能力不高，金額更為集中在1000英鎊以內(nèi)。與訂單金額的多峰分布相比，客戶消費(fèi)金的分布呈現(xiàn)單峰長尾狀。

#繪制客戶消費(fèi)金額與消費(fèi)件數(shù)的散點(diǎn)圖plt.figure(figsize=(14,4))plt.subplot(121)plt.scatter(customer_grouped['Quantity'], customer_grouped['SumPrice'], color = 'r')plt.title('SumPrice & Quantity')plt.ylabel('SumPrice')plt.xlabel('Quantity')plt.subplot(122)plt.scatter(customer_grouped[customer_grouped['Quantity'] < 25000]['Quantity'], customer_grouped[customer_grouped.Quantity < 25000]['SumPrice'], color = 'r')plt.title('SumPrice & Quantity (Quantity<25000)')plt.ylabel('SumPrice')plt.xlabel('Quantity')

可以發(fā)現(xiàn)，客戶群體的消費(fèi)規(guī)律性更強(qiáng)，客戶消費(fèi)主要集中低商品數(shù)量上，同時存在一定消費(fèi)能力比較強(qiáng)的客戶?？傮w上講，消費(fèi)金額和客戶購買數(shù)量呈正相關(guān)，與實(shí)際相符。

5.3商品維度(StockCode特征)

根據(jù)觀察，商品的單價在不同的訂單中價格會有波動，以商品21484為例：

data_success.loc[data_success['StockCode']=='21484',:]['UnitPrice'].value_counts()

#按照商品編號對商品數(shù)量Quantity和商品總價SumPrice進(jìn)行分組goods_grouped = data_success.groupby('StockCode')[['Quantity','SumPrice']].sum()#計(jì)算商品的均價goods_grouped['AvgPrice'] = goods_grouped['SumPrice']/goods_grouped['Quantity']

查看商品的均價分布：

#所有商品均價分布f,[ax1, ax2] = plt.subplots(2,1,figsize=(12,10))sns.distplot(goods_grouped['AvgPrice'],bins=100,kde=False,ax=ax1,            hist_kws={'alpha':1,'color':'b'})ax1.set_title('AvgPrice Distribution')ax1.set_ylabel('Frequency')ax1.set_xlabel('SumPrice')#均價小于100英鎊的商品分布sns.distplot(goods_grouped[goods_grouped['AvgPrice']<100]['AvgPrice'],bins=100,kde=True,color='r',ax=ax2,            hist_kws={'alpha':0.8,'color':'b'})ax2.set_title('AvgPrice Distribution (Below 100)')ax2.set_ylabel('Frequency')ax2.set_xlabel('SumPrice')plt.show()

可以發(fā)現(xiàn)，總體上來上商品的均價都是出于低價位，高價商品很少。商品價位低于100時，商品銷售數(shù)量高峰的價位是1-5英鎊，高于10英鎊的商品銷量已經(jīng)很低，可知，該電商的低昂為低價的小商品市場。

分析商品單價和商品數(shù)量散點(diǎn)圖

#總體商品單價和商品數(shù)量散點(diǎn)圖plt.figure(figsize=(14,4))plt.subplot(121)plt.scatter(goods_grouped['AvgPrice'],goods_grouped['Quantity'],color='b')plt.title('AvgPrice & Quantity')plt.ylabel('Quantity')plt.xlabel('AvgPrice')#商品價位低于50的單價和商品數(shù)量分布圖plt.subplot(122)plt.scatter(goods_grouped[goods_grouped.AvgPrice<50]['AvgPrice'], goods_grouped[goods_grouped.AvgPrice<50]['Quantity'],color='b')plt.title('AvgPrice & Quantity (AvgPrice < 50)')plt.ylabel('Quantity')plt.xlabel('AvgPrice')

可以發(fā)現(xiàn)，前面分析低價位商品更受歡迎是正正確的。

分析商品單價和銷售金額散點(diǎn)圖

#總體商品單價和銷售額的散點(diǎn)圖plt.figure(figsize=(14,4))plt.subplot(121)plt.scatter(goods_grouped['AvgPrice'], goods_grouped['SumPrice'], color = 'y')plt.title('AvgPrice & SumPrice')plt.ylabel('SumPrice')plt.xlabel('AvgPrice')#商品價格低于50的單價和銷售額分布圖plt.subplot(122)plt.scatter(goods_grouped[goods_grouped.AvgPrice < 50]['AvgPrice'], goods_grouped[goods_grouped.AvgPrice < 50]['SumPrice'], color = 'y')plt.title('AvgPrice & SumPrice (AvgPrice < 50)')plt.ylabel('SumPrice')plt.xlabel('AvgPrice')

可以發(fā)現(xiàn)，低價區(qū)的商品缺失是銷售額的主要構(gòu)成部分，高價商品銷量低，并沒有帶來多少的銷售額，建議采購部門可以多采購低價位商品進(jìn)行銷售。

5.4時間維度(InvoiceNo特征)

按照訂單號分組，隨后提取時間信息

time_grouped = data_success.groupby('InvoiceNo').agg({'Date': np.min, 'Month': np.min, 'Quantity': np.sum, 'SumPrice': np.sum}).reset_index()

5.4.1月份信息分析

根據(jù)月份進(jìn)行分組分析

#根據(jù)月份進(jìn)行分組統(tǒng)計(jì)month_grouped = time_grouped.groupby('Month').agg({'Quantity': np.sum, 'SumPrice': np.sum, 'InvoiceNo': np.size})#畫雙軸折線圖month = month_grouped.plot(secondary_y = 'InvoiceNo', x_compat=True,figsize=(12,4))month.set_ylabel('Quantity & SumPrice')month.right_ax.set_ylabel('Order quantities')

可以發(fā)現(xiàn)，三條折線的趨勢較為相似，除了2011.2和2011.4外，2010.12-2011.8銷售趨勢較為平穩(wěn)，9-11月銷售趨勢增加，這有可能和節(jié)假日活動有關(guān)，經(jīng)調(diào)研，發(fā)現(xiàn)該區(qū)間有節(jié)日：

說明，假日對該電商平臺影響較為明顯。

5.4.2日期信息分析

#將日期設(shè)為索引，按日畫折線圖time_grouped = time_grouped.set_index('Date')day = time_grouped.groupby('Date').agg({'Quantity': np.sum, 'SumPrice': np.sum, 'InvoiceNo': np.size}).plot(secondary_y = 'InvoiceNo', figsize = (14, 5))day.set_ylabel('Quantity & SumPrice')day.right_ax.set_ylabel('Order quantities')

可以發(fā)現(xiàn)：銷售額和銷量趨勢較為一致，但是最后一天2.11.12.9銷量和銷售額明顯提高。

# 取2011年10月1日至2011年12月9日day_part = time_grouped['2011-10-01':'2011-12-09'].groupby('Date').agg({'Quantity': np.sum, 'SumPrice': np.sum, 'InvoiceNo': np.size}).plot(secondary_y = 'InvoiceNo', figsize = (14, 5))day_part.set_ylabel('Quantity & SumPrice')day_part.right_ax.set_ylabel('Order quantities')

可以發(fā)現(xiàn)，12月份前8天的三條這些趨勢較為一致，最后一天的銷量和銷售額明顯提高，把這天信息顯示出來查驗(yàn)。

data_success[data_success.Date == '2011-12-09'].sort_values(by = 'SumPrice', ascending = False).head()可以發(fā)現(xiàn)，以為英國客戶，一次性購買8萬余件的紙品工藝，拉高了銷售量。

5.5區(qū)域維度(Country特征)

#提取一張客戶ID及其對應(yīng)國家的關(guān)系表data_country = data_success.drop_duplicates(subset=['CustomerID', 'Country'])#按客戶分組，計(jì)算消費(fèi)總額country_grouped = data_customer.groupby('CustomerID')[['SumPrice']].sum()#將上述兩張表合并data_country = data_country.drop({'SumPrice'},axis=1)country_grouped = country_grouped.merge(data_country, on=['CustomerID'])#按國家再次分組，計(jì)算出各國客戶消費(fèi)總額和客戶總數(shù)country_grouped2 = country_grouped.groupby('Country').agg({'SumPrice':np.sum,'CustomerID': np.size})新增AvgAmount字段，存放該國家客戶的人均消費(fèi)金額country_grouped2['AvgAmount'] = country_grouped2['SumPrice']/country_grouped2['CustomerID']對消費(fèi)總額降序排列country_grouped2.sort_values(by='SumPrice',ascending=False).head()

可以發(fā)現(xiàn)，絕大部分客戶來自英國本土，主要境外收入來源是英國周邊的國家，基本上符合以英國為中心向外輻射的情況。

5.6客戶行為分析

這里只分析數(shù)據(jù)集完成的數(shù)據(jù)，排除用戶ID缺失的數(shù)據(jù)。

5.6.1客戶生命周期分析

#提取數(shù)據(jù)select_customer = data_success[data_success['CustomerID'] != 0].copy()#查看用戶初次與末次消費(fèi)時間#客戶的初次消費(fèi)時間mindate = data_customer.groupby('CustomerID')[['Date']].min()#客戶的末次消費(fèi)時間maxdate = data_customer.groupby('CustomerID')[['Date']].max()#計(jì)算用戶消費(fèi)的生命周期life_time = maxdate - mindate#生命周期描述性統(tǒng)計(jì)分析life_time.describe()

可以發(fā)現(xiàn)：

(1)共有4338位客戶，平均客戶的生命周期是130天，中位數(shù)是93天，說明有部分的生命周期很長的忠實(shí)客戶拉高了均值

(2)最小值和Q1分位數(shù)都是0天，說明存在25%以上的客戶僅消費(fèi)1次，生命周期的分布呈兩極分化的狀態(tài)

#新增life_times特征life_time['life_times'] = life_time['Date'].dt.days#繪制總體客戶生命周期柱狀圖f,[ax1, ax2] = plt.subplots(2,1,figsize=(12,10))sns.distplot(life_time['life_times'],bins=20,kde=False,ax=ax1,            hist_kws={'alpha':1,'color':'g'})ax1.set_title('Life Time Distribution')ax1.set_ylabel('Customer number')ax1.set_xlabel('Life time (days)')#繪制不止一次消費(fèi)的客戶生命周期柱狀圖sns.distplot(life_time[life_time['life_times']>0]['life_times'],bins=100,kde=True,color='r',ax=ax2,            hist_kws={'alpha':0.8,'color':'g'})ax2.set_title('Life Time Distribution without One-time Deal Hunters')ax2.set_ylabel('Customer number')ax2.set_xlabel('Life time (days)')plt.savefig('16-1.png')plt.show()

可以發(fā)現(xiàn)：

(1)總體來看，大量客戶在該數(shù)據(jù)期間僅消費(fèi)一次，沒有留存下來，留存客戶在350天有個峰值，一年時間間隔，有大量客戶采購，說明這個時間段是客戶聚集消費(fèi)時間。

(2)生命周期在0-75天的客戶數(shù)略高于75-170天，可以考慮加強(qiáng)前70天內(nèi)對客戶的引導(dǎo)。約1/4的客戶集中在170天-330天，屬于較高質(zhì)量客戶的生命周期；而在330天以后，則是數(shù)量可觀的死忠客戶，擁有極高的用戶粘性。

5.6.2客戶留存分析

#sales_customer新增字段用戶首次消費(fèi)日期mindatecustomer_retention=select_customer.merge(mindate,on='CustomerID',how='inner',suffixes=('','Min'))#新增字段DateDiff，用于存放本次消費(fèi)日期與首次消費(fèi)日期的時間差，并轉(zhuǎn)為數(shù)值：customer_retention['DateDiff'] = (customer_retention.Date-customer_retention.DateMin).dt.days#新增字段DateDiffBin存放時間分段date_bins = [0, 3, 7, 30, 60, 90, 180]customer_retention['DateDiffBin'] = pd.cut(customer_retention.DateDiff, bins = date_bins)customer_retention['DateDiffBin'].value_counts()#畫柱狀圖customer_counts = customer_retention['DateDiffBin'].value_counts()customer_counts.plot.bar()#畫餅圖labels = customer_counts.keys().categories.sort_values(ascending=False)values = customer_counts.valuesexplode = (0.1,0,0,0,0,0)plt.pie(values,explode=explode,labels=labels,autopct='%1.1f%%',shadow=False,startangle=150)plt.title("客戶留存分布")plt.show()

可以發(fā)現(xiàn)：

(1)在這些老客戶中，只有0.9%在第一次消費(fèi)的次日至3天內(nèi)有過消費(fèi)，2.4%的客戶在4-7天有過消費(fèi)。

(2)分別有17.2%和18.7%的客戶在首次消費(fèi)后的第二個月內(nèi)和第三個月內(nèi)有過購買行為。

(3)將時間范圍繼續(xù)放寬，有高達(dá)50.5%的客戶在90天至半年內(nèi)消費(fèi)過。說明該電商網(wǎng)站的客戶群體，其采購并非高頻行為，但留存下來的老客戶忠誠度卻極高。

5.6.3客戶購買周期

#排除客戶在同一天購買商品記錄customer_cycle = customer_retention.drop_duplicates(subset=['CustomerID', 'Date'], keep='first')#按照日期進(jìn)行排序customer_cycle.sort_values(by = 'Date',ascending = True) #定義函數(shù)diff，用于計(jì)算相鄰兩次消費(fèi)的時間差def diff(group):    d = group.DateDiff - group.DateDiff.shift()    return d#先按客戶編碼分組，在應(yīng)用diff函數(shù)：last_diff = sales_cycle.groupby('CustomerID').apply(diff)last_diff.head(10)

按照訂單統(tǒng)計(jì)的購買日期分析

last_diff.hist(bins = 70, figsize = (12, 6), color = 'r')可以發(fā)現(xiàn)，大部分購買行為的消費(fèi)間隔比較短。但這是所有訂單的購買周期分布，并不是對客戶個體為統(tǒng)計(jì)單位的購買周期分布。

故對客戶編號進(jìn)行分組：

last_diff_customer = last_diff.groupby('CustomerID').mean()last_diff_customer.hist(bins = 70, figsize = (12, 6), color = 'r')

可以發(fā)現(xiàn)，購物周期的峰值在15-70天范圍內(nèi)，該電商平臺可以以30天為周期推出優(yōu)惠活動，吸引客戶，提高客戶購買周期。

六、總結(jié)

(1)該電商平臺訂單以批發(fā)性質(zhì)為主，訂單間差異較大，存在部分購買力極強(qiáng)的客戶?？傮w來說訂單交易金額與訂單內(nèi)商品件數(shù)正相關(guān)?？蛻羧后w比較健康，其消費(fèi)金額與購買商品數(shù)量正相關(guān)，而且規(guī)律性比訂單更強(qiáng)。

(2)商品的單價會發(fā)生波動，集中于1-2英鎊，定位主要是低價的小商品市場。低于5英鎊的商品最受客戶喜愛，同時也構(gòu)成了銷售額的主要部分。高價的商品雖然單價不菲，但銷量很低，并沒有帶來太多的銷售額。建議平臺采購部門可以多遴選售價低于10英鎊的產(chǎn)品，來進(jìn)一步擴(kuò)充低價區(qū)的品類。受節(jié)日影響可能較大，建議在假日提高商品種類。

(3)絕大部分客戶來自英國本土，主要境外收入也多來自周邊國家，影響力隨距離而衰減?？梢钥紤]增加境外的宣傳投放，提高知名度。

(4)生命周期平均生命周期為130天，生命周期的分布呈兩極分化的狀態(tài)。消費(fèi)兩次及以上的客戶平均生命周期是203天，遠(yuǎn)高于總體均值103天。建議更加重視客戶初次消費(fèi)的體驗(yàn)感，可以考慮通過網(wǎng)站內(nèi)服務(wù)評價、客服電詢等方式獲知新客對于購買流程中不滿意之處，針對性地加以改進(jìn)；并且花更多的精力引導(dǎo)其進(jìn)行再次消費(fèi)，如發(fā)放有時限的優(yōu)惠券等。

(5)留存情況：客戶群體的采購并非高頻行為，但留存下來的老客戶忠誠度極高。部分留存客戶的購買周期集中在15-70天，建議可以每隔30天左右對客戶進(jìn)行些優(yōu)惠活動的信息推送。

-------------------------------------結(jié)束----------------------------------------------

關(guān)鍵詞：數(shù)據(jù),分析,銷售,用戶

網(wǎng)站
營銷
設(shè)計(jì)
運(yùn)營
優(yōu)化
效率
專注
電商
方案
推廣

解決方案&服務(wù)

客戶&案例

營銷資訊

關(guān)于我們

解決方案&服務(wù)

客戶&案例

營銷資訊

關(guān)于我們

微信公眾號

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果，本站不支持IE9及以下版本的瀏覽器，建議您使用谷歌Chrome瀏覽器。點(diǎn)擊下載Chrome瀏覽器

關(guān)閉

<abbr id="z8t0q"></abbr>

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

快捷入口

電商用戶銷售數(shù)據(jù)分析

跨境電子商務(wù)，阿里巴巴國際站和全球速賣通有什么區(qū)別？

淘寶網(wǎng)商品銷量與評價被指隨意買賣 “好評”你還敢信么

“聾易通”項(xiàng)目亮相北京-中國第21屆軟件博覽會

深圳跨境電商《eBay開店培訓(xùn)班》開課啦！

國際貿(mào)易（一）——重商主義

定制鏈?zhǔn)讓谩俺鞘泻匣锶藙?chuàng)業(yè)集訓(xùn)營”圓滿落幕

電商數(shù)據(jù)分析—PPT

18家中國域名商（國際域名）解析量報告(6月30日)

第四屆互聯(lián)網(wǎng)金融創(chuàng)新趨勢峰會圓滿落幕

微信直接收發(fā)郵件，天天企郵合作企業(yè)微信提升工作效率

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

快捷入口

電商用戶銷售數(shù)據(jù)分析

推薦文章

人機(jī)交互：以用戶為中心的設(shè)計(jì)和評估（第5版）

用戶界面設(shè)計(jì)指南作者簡介

用戶界面設(shè)計(jì)指南編輯推薦

網(wǎng)站日志之狀態(tài)碼分析

外貿(mào)B2C平臺選擇速賣通、ebay、亞馬遜分析？

電子商務(wù)里面的 GMV (Gross Merchandise Volume) 的定義是什么？和

B2C電子商務(wù)模式下產(chǎn)品運(yùn)營方案有哪些啊 哪位大俠能針對性的分析

房地產(chǎn)銷售為何不流行 B2C 模式，如何大規(guī)模地采用電商模式賣房子？

O2O 模式的核心是解決了用戶的哪些需求？

自己做海外母嬰食品代購平臺網(wǎng)站與在淘寶銷售的區(qū)別？優(yōu)缺點(diǎn)？

跨境電子商務(wù)，阿里巴巴國際站和全球速賣通有什么區(qū)別？

淘寶網(wǎng)商品銷量與評價被指隨意買賣 “好評”你還敢信么

“聾易通”項(xiàng)目亮相北京-中國第21屆軟件博覽會

深圳跨境電商 《eBay開店培訓(xùn)班》開課啦！

國際貿(mào)易（一）——重商主義

定制鏈?zhǔn)讓谩俺鞘泻匣锶藙?chuàng)業(yè)集訓(xùn)營”圓滿落幕

電商數(shù)據(jù)分析—PPT

18家中國域名商（國際域名）解析量報告(6月30日)

第四屆互聯(lián)網(wǎng)金融創(chuàng)新趨勢峰會圓滿落幕

微信直接收發(fā)郵件，天天企郵合作企業(yè)微信提升工作效率

外貿(mào)B2C平臺選擇速賣通、ebay、亞馬遜分析？

電子商務(wù)里面的 GMV (Gross Merchandise Volume) 的定義是什么？和

B2C電子商務(wù)模式下產(chǎn)品運(yùn)營方案有哪些啊哪位大俠能針對性的分析

房地產(chǎn)銷售為何不流行 B2C 模式，如何大規(guī)模地采用電商模式賣房子？

O2O 模式的核心是解決了用戶的哪些需求？

自己做海外母嬰食品代購平臺網(wǎng)站與在淘寶銷售的區(qū)別？優(yōu)缺點(diǎn)？

跨境電子商務(wù)，阿里巴巴國際站和全球速賣通有什么區(qū)別？

深圳跨境電商《eBay開店培訓(xùn)班》開課啦！

微信直接收發(fā)郵件，天天企郵合作企業(yè)微信提升工作效率