Quantity和UnitPrice的最小值都是負值,其中Quantity的負值為" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 電商訂單數(shù)據(jù)分析報告

電商訂單數(shù)據(jù)分析報告

時間:2023-03-16 00:14:02 | 來源:電子商務(wù)

時間:2023-03-16 00:14:02 來源:電子商務(wù)

本次分析的是英國一家在線零售商的交易訂單數(shù)據(jù),時間跨越為:2010年12月1日至2011年12月1日。數(shù)據(jù)來源于UCI Maching Learning Repository 。數(shù)據(jù)量為50萬。

Quantity和UnitPrice的最小值都是負值,其中Quantity的負值為退貨,而UnitPrice則是退貨所產(chǎn)生的資金耗損。

一般而言,消費類的數(shù)據(jù)分布,都是長尾形態(tài)。大部分用戶都是小額,然而小部分用戶貢獻了收入的大頭,這就是經(jīng)典的二八理論。

在數(shù)據(jù)清洗階段,主要就是修正數(shù)據(jù)類型,另外新增了每筆訂單的總額、交易月份與日期特征列。

之前的數(shù)據(jù)粒度是“商品”:

現(xiàn)將數(shù)據(jù)粒度修改為“每筆訂單”:

需要注意的是,這里Quantity和UnitPrice的乘積不一定等于TatalPrice,因為不是一一對應(yīng)的。

本次分析的架構(gòu)如下:

用戶消費趨勢分析

用戶個體消費分析

用戶消費行為分析

下面正式開始。

用戶消費趨勢分析

grouped_month = df_order.groupby('Month')order_month_total_price = grouped_month.TotalPrice.sum()plt.figure(figsize=(10,6))plt.plot(order_month_total_price)plt.xlabel('month')plt.ylabel('price')plt.title('total price pre month')可以看到隨著時間的推移,每月訂單總額在逐步提升,尤其在2011-08后有一個顯著的提升。但是同年11月份又出現(xiàn)了大幅下滑。

order_month_customers = grouped_month.InvoiceNo.count()plt.figure(figsize=(10,6))plt.plot(order_month_customers)plt.xlabel('month')plt.ylabel('order')plt.title('number of orders pre month')訂單數(shù)量的變化和消費金額大體一致。

order_month_products = grouped_month.Quantity.sum()plt.figure(figsize=(10,6))plt.plot(order_month_products)plt.xlabel('month')plt.ylabel('products')plt.title('number of products pre month')銷售商品數(shù)量的變化自然和前面兩項的變化是一致的。

order_month_customers = grouped_month.CustomerID.apply(lambda x:len(x.drop_duplicates()))plt.figure(figsize=(10,6))plt.plot(order_month_customers)plt.xlabel('month')plt.ylabel('customers')plt.title('number of customers pre month')消費客戶數(shù)隨著時間的發(fā)展和上面也是一樣的。但是可以更細致地看到,消費客戶數(shù)低于訂單數(shù),說明這個電商還是有一定的用戶黏性,即用戶復(fù)購率還不錯。

整體來說,如果這個數(shù)據(jù)集是中國電商的,也許可以把10到12月這個震蕩的現(xiàn)象歸結(jié)為雙十一。但是這個訂單來自于一家英國的電商平臺,因此結(jié)果也只能猜測也許和年底提前促銷清庫存有關(guān)系。

用戶個體消費分析

# 查看有消費的記錄# 注意query只接受字符串形式的參數(shù)df_customer = df_order.groupby('CustomerID').agg({'InvoiceNo':'count', 'TotalPrice':'sum'}).query('TotalPrice > 0')df_customer.describe()用戶平均購買商品的數(shù)量為5,最多的是購買了249件,即電商企業(yè)的大客戶。
消費金額上,平均約為1925英鎊,處于75%再往上,說明存在大額訂單。且標準差約為8266英鎊,說明波動非常大。

plt.figure(figsize=(10,6))plt.scatter(x=df_customer.InvoiceNo, y=df_customer.TotalPrice, alpha = 0.3)plt.xlabel('Times')plt.ylabel('Total Price')plt.title('Times and Total Price')可以看到,存在少許的離群點。 可以利用切比雪夫定理,截取Total Price平均數(shù)2個標準差以內(nèi)的數(shù)據(jù)(這里左邊界用0即可)。

plt.figure(figsize=(10,6))plt.scatter(x=df_customer.query('TotalPrice < 18456').InvoiceNo, y=df_customer.query('TotalPrice < 18456').TotalPrice, alpha = 0.3)plt.xlabel('Times')plt.ylabel('Total Price')plt.title('Times and Total Price')這里可以看出二者具有一定的線性規(guī)律,大額多訂單客戶還是非常多的。

plt.figure(figsize=(10,6))plt.hist(df_customer.query('TotalPrice < 18456').TotalPrice, bins = 30)plt.xlabel('Total Price')plt.ylabel('Frequence')plt.title('Total Price Distribution')消費金額是典型的長尾分布,大部分客戶的消費金額小于2500英鎊。

plt.figure(figsize=(10,6))user_amount.prop.plot()plt.xlabel('Total')plt.ylabel('Prop')plt.title('Customers Cumsum')按用戶消費金額進行升序排列后繪圖。
由圖可知排名后70%的用戶僅貢獻了20%的消費額度,而排名前30%的用戶貢獻了80%的消費額——關(guān)注高質(zhì)量用戶。

用戶消費行為分析

order_dif.describe()用戶的平均消費間隔是33天,最長的消費間隔可達1年,其實就是用戶流失了。如果要喚回用戶的話,建議判斷的最長失活時長不超過33天。

下面查看分布圖。

plt.figure(figsize=(10,6))plt.hist((order_dif / np.timedelta64(1, 'D')).dropna(), bins = 30)plt.xlabel('Period')plt.ylabel('Frequence')plt.title('Period Distribution')又是非常典型的長尾分布,大部分用戶的消費間隔其實不長。
考慮可以消費后立即贈送優(yōu)惠券,消費后10天(分布天數(shù)最多)進行用戶回訪,消費后20天發(fā)送優(yōu)惠券到期通知或關(guān)聯(lián)商品推送,消費后30天進行短信推送,防止客戶流失。

order_date_min = df_order.groupby('CustomerID').InvoiceDate.min()order_date_max = df_order.groupby('CustomerID').InvoiceDate.max()order_date_dif = order_date_max - order_date_minorder_date_dif.head(10)理論上來說,隨著產(chǎn)品的成熟,用戶生命周期是呈現(xiàn)增長的趨勢的,但是這個數(shù)據(jù)集并沒有體現(xiàn)用戶注冊時間這一類可以看出時間遠近的變量(第一次訂單時間是不可以的,因為這個數(shù)據(jù)集只是一年內(nèi)的數(shù)據(jù)。)因此不好判斷。

order_date_dif.mean()用戶的平均生命周期是133天,但是平均數(shù)就準確么?不一定的,還是需要查看整體分布。

plt.figure(figsize=(10,6))plt.hist((order_date_dif / np.timedelta64(1,'D')).dropna(), bins = 90)plt.xlabel('Life Period')plt.ylabel('Frequence')plt.title('Life Period Distribution')可以看到存在很多一次消費后就不再購買的客戶,這些都是屬于質(zhì)量較差的客戶。這可能是這部分引流的渠道客戶質(zhì)量不高。

下面排除掉為0的客戶,再進行查看。

plt.figure(figsize=(10,6))plt.hist((order_date_dif / np.timedelta64(1,'D')).dropna()[(order_date_dif / np.timedelta64(1,'D')).dropna()>0], bins = 90)plt.xlabel('Life Period')plt.ylabel('Frequence')plt.title('Life Period Distribution(more than 0 day)')雖然排除了一次性消費客戶,但仍有不少用戶生命周期靠攏在0。

分布呈現(xiàn)典型的雙峰趨勢。

部分質(zhì)量差的用戶,雖然消費了兩次,但是仍舊無法持續(xù),因此就像上面分析的,在用戶首次消費20-30天內(nèi)應(yīng)該盡量引導(dǎo)繼續(xù)消費。

少部分客戶的生命周期集中在50-300天,屬于普通型生命周期的客戶。

高質(zhì)量用戶的生命周期,集中在300天以后,他們已經(jīng)屬于忠誠用戶。

(order_date_dif / np.timedelta64(1,'D')).dropna()[(order_date_dif / np.timedelta64(1,'D')).dropna()>0].mean()二次消費或者以上的客戶的生命周期大約為191天,高于總體的133天。因此從運營策略上看來,用戶首次消費后應(yīng)該花費更多的精力,以引導(dǎo)其進行二次、多次消費。對于用戶的生命周期,這會帶來相較于原來1/2的增量。

新用戶、活躍用戶、流失用戶、回流用戶

purchase_status_counts.fillna(0).T.plot.area(figsize = (10,6))purchase_status_counts.fillna(0).T.apply(lambda x:x/x.sum(), axis=1)可以看出用戶層級的分布和用戶轉(zhuǎn)化漏斗趨勢。隨著產(chǎn)品的發(fā)展,活躍用戶的占比為10%-15%,新增用戶沒有產(chǎn)品剛剛推出的時候流量大,這是正常的,因為產(chǎn)品推出期間一定采取了大量的引流措施?;亓饔脩暨@里指的是上月沒有消費,本月又有消費的,時間長短取決于上面的分析結(jié)果??梢钥吹交钴S用戶和回流用戶的占比變化和消費趨勢是相同的,12月份有了一個明顯的下滑。

復(fù)購率

pivoted_purchase_return = pivoted_counts.applymap(lambda x: 1 if x > 1 else np.NaN if x == 0 else 0)pivoted_purchase_return.head()(pivoted_purchase_return.sum() / pivoted_purchase_return.count()).plot(figsize = (10,6))可以看到,在穩(wěn)定的時期,復(fù)購率在30% - 40%,還是非??捎^的。

回購率

def purchase_back(data): status = [] for i in range(12): if data[i] == 1: if data[i+1] == 1: status.append(1) if data[i+1] == 0: status.append(0) else: status.append(np.NaN) status.append(np.NaN) return pd.Series(status, index=columns_month)pivoted_purchase_back = df_purchase.apply(purchase_back, axis=1)pivoted_purchase_back.head()(pivoted_purchase_back.sum() / pivoted_purchase_back.count()).plot(figsize = (10,6))在穩(wěn)定時期,用戶回購率隨著時間變化有所上升,回購率約在35% - 50%,也是較高的。


總結(jié):

  1. 每月的消費總金額隨著時間在增長,且2011年11月增長幅度最大??紤]到消費金額的影響因素,原因可能有幾點:
2. 客戶消費有一定規(guī)律性,大部分客戶消費金額在2000英鎊以下,這點充分反應(yīng)了二八法則。且通過圖表可以看出,消費排名前30%的用戶貢獻了80%的消費額。這些高質(zhì)量客戶可以屬于“黃金會員”類型,針對這類客戶可以做一些VIP服務(wù)。
其實客戶價值可以按照RFM模型來分類,這里就暫時不過多涉及。

3. 用戶消費周期呈現(xiàn)典型的長尾分布,大部分用戶的消費間隔非常短,甚至有很多一次購買用戶,可能這些用戶就是營銷活動中的羊毛黨??紤]可以消費后立即贈送優(yōu)惠券,消費后10天進行用戶回訪,消費后20天發(fā)送優(yōu)惠券到期通知或關(guān)聯(lián)商品推送,消費后30天進行短信推送,以增強客戶黏性,防止客戶流失。
二次消費或者以上的客戶的生命周期大約為191天,高于總體的133天。因此從運營策略上看來,用戶首次消費后應(yīng)該花費更多的精力,以引導(dǎo)其進行二次、多次消費。對于用戶的生命周期,這會帶來更高的增量。


特別說明:

由于數(shù)據(jù)集是截取某年的訂單數(shù)據(jù),2010年12月前與2011年12月后的用戶訂單數(shù)據(jù)未知,因此上文計算出的用戶第一次消費時間、最后一次消費時間以及每月新客、老客、回流客的占比和留存率并不是準確的,而只能出這段時間的電商平臺發(fā)展狀況和用戶特征。切勿以偏概全。

關(guān)鍵詞:分析,報告,單數(shù)

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉