国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 網(wǎng)絡營銷 > 運營數(shù)據(jù)中常見的數(shù)據(jù)陷阱

運營數(shù)據(jù)中常見的數(shù)據(jù)陷阱

時間:2022-05-24 07:48:01 | 來源:網(wǎng)絡營銷

時間:2022-05-24 07:48:01 來源:網(wǎng)絡營銷

當下的時代已經(jīng)是一個真正的大數(shù)據(jù)時代,而互聯(lián)網(wǎng)產(chǎn)品達到億級的用戶量,甚至十億級的用戶量,都已經(jīng)不鮮見了,產(chǎn)品的迭代方向,用戶行為的分析都要用數(shù)據(jù)說話,產(chǎn)品經(jīng)理、運營人員想要做出正確的決定,要比以往任何時候都更加依賴數(shù)據(jù)。

如今,“大數(shù)據(jù)”的概念已經(jīng)被炒得沸沸揚揚,不可否認,現(xiàn)在的各個領(lǐng)域的數(shù)據(jù)確實是越來越多了,人們的數(shù)據(jù)意識也正在增強,尤其是在積累相對容易的電商行業(yè),但面對眾多的運營數(shù)據(jù),你真的能有效的將其應用嗎?先不談各種復雜的計量模型,先從幾個簡單的統(tǒng)計學概念入手,提醒大家:數(shù)據(jù)有陷阱,應用需謹慎。

1、算術(shù)平均數(shù)的局限性

算數(shù)平均數(shù),即幾個數(shù)字相加后除以個數(shù),這也許是大家僅有的對平均數(shù)的理解,但其實平均數(shù)還有很多,比如中位數(shù)、幾何平均數(shù)、眾數(shù)等等。

對此,我們先來看一個例子:某店鋪一段時間的營業(yè)額數(shù)據(jù)如下:該店鋪12期銷售額的算數(shù)平均數(shù)是300,但有10期數(shù)值都在300以下,這樣的數(shù)值合理嗎?前10期的算數(shù)平均數(shù)僅是210,和300相去甚遠,顯然后面兩期的數(shù)值對整體的拉升作用明顯。

來個更極端的例子,三個人的年收入分別是3萬、3萬和300萬,但算數(shù)平均是102萬,原本是兩個?絲和一個高帥富,可一平均后大家都成了高帥富,大家很多時候吐槽統(tǒng)計數(shù)字有水分,其實這就是算術(shù)平均數(shù)的陷阱。

那么,怎樣獲得更準確的平均數(shù)呢?有人說,“去掉最大值,去掉最小值”,這方法沒錯,但略顯粗暴,我們介紹幾個更科學的計算方式。

先看中位數(shù),中位數(shù)即將數(shù)列從小到大排列后,取中間位置的那個數(shù)字作為平均數(shù),若數(shù)列是偶數(shù),則取中間兩位數(shù)的算數(shù)平均,例1的中位數(shù)是200,顯然比300要來的合理的多。

其次是眾數(shù),即出現(xiàn)頻率最高的那個數(shù)。

最后介紹下幾何平均數(shù),若要求5個數(shù)字的幾何平均數(shù),則將這5個數(shù)連乘后開5次方,例1中的幾何平均數(shù)是268,也要比300更接近真實水平。

目前普遍在用的算數(shù)平均數(shù),受極值的影響很大,其準確性是值得管理者們注意的,億企邦建議管理者將中位數(shù)也應用起來,對算數(shù)平均的判斷起輔助作用,若兩者相差過大,則需要找到極值產(chǎn)生的原因。

在EXCEL中,中位數(shù)、眾數(shù)和幾何平均數(shù)的函數(shù)分別是MEDIAN、MODE和GEOMEAN,應用起來非常方便。

2、引入定基比率

目前大家比較熟悉的是同比增長率和環(huán)比增長率,同比增長率能夠排除掉季節(jié)性的因素,反映出較為實質(zhì)性的增長,而環(huán)比能夠連續(xù)地、動態(tài)地反映出指標的變化,但僅有這兩個指標有時候是不夠的。

比如,去年和今年市場行情相差很大,那么同比(今年與去年同期比)的參照性就很不可靠,而環(huán)比只看到了這期和上期的差異,若相隔的期數(shù)多了,就很難判斷現(xiàn)在的狀況如何,怎么辦?大家不要忘了定基比率,即將固定的某期設為基數(shù),其后各期該期進行對比。

比如某店鋪今年1月至12月的銷售額數(shù)據(jù)為(10,12,13,16,18,13,17,19,18,20,25,22),我們將1月數(shù)據(jù)設為基數(shù)100,其后各期與之的比值即為定基比數(shù)據(jù)(100,120,130,…,250,220),億企邦認為定基比有時更能反映出某段時間的經(jīng)營成果,比如某項改革從1月開始了,那就將各種運營指標以1月為基期,以后各月與它對比,便能直觀反映這項改革帶來的效果(具體可查看億企邦《如何以客戶為中心進行數(shù)據(jù)挖掘與分析》的相關(guān)介紹)。

3、絕對的排名不一定可靠

某天你孩子向你報告考試成績,說考了第9名,你是高興還是憤怒?先別急著下論斷,得先問問幾個人考試,若是500人,那你必然賜予擁吻和禮物;而若是10個人,你八成會賞個巴掌,這就是絕對數(shù)字排名的局限性。

那么,我們用個百分比數(shù)值來代替之,就免去了這樣的尷尬,即排名數(shù)值除以總的參與排名的個數(shù),比如我經(jīng)營50款產(chǎn)品,某款產(chǎn)品銷售額排在第8位,那就表明它排在16%。

要多說一點的是,在百分比的排名中,需重視四分位數(shù),即25%,50%,75%三個檔次,許多指標的優(yōu)劣都會以四分衛(wèi)數(shù)來衡量,比如你的轉(zhuǎn)化率在行業(yè)內(nèi)的前25%以內(nèi)浮動,那你暫時不用擔心,將精力放在其他方面,若低于25%了,那你或許要花力氣來提升你的轉(zhuǎn)化率了。

4、不要被漂亮的增長曲線蒙蔽

對于許多中小型的電商企業(yè),經(jīng)營的第一步便是沖銷售額,因此粗放經(jīng)營是普態(tài),對各種指標的大起大落習以為常,有了漂亮的增長業(yè)績,穩(wěn)定性真的不重要嗎?億企邦不這么認為,尤其是成本,穩(wěn)定各項成本是對企業(yè)發(fā)展的一種蓄力。

比如采購成本,許多企業(yè)判斷其采購成本的唯一指標便是算數(shù)平均數(shù),其弊端在上文中已經(jīng)指出,而對穩(wěn)定性的認識只停留在人的主觀感受或采購曲線的波動上,億企邦建議電商們計算方差指標,即EXCEL中的VAR函數(shù),方差越大,表示該指標穩(wěn)定性越差。

一般來說,一個健康的企業(yè),不管銷售額如何變化,其成本的穩(wěn)定性(絕對值較穩(wěn)定或者變化率較穩(wěn)定)會較強,即方差較小,穩(wěn)定性變差,一般預示著重大變化的來臨,面對越來越飽和的市場和越來越激烈的競爭,電商企業(yè)急需關(guān)注自己運營的穩(wěn)定性,尤其是與供應鏈各個環(huán)節(jié)相關(guān)的穩(wěn)定性,如采購成本、推廣費用、物流費用等等,任何指標若變得不穩(wěn)定了,就該警惕,找出背后的原因(具體可查看億企邦《如何通過大數(shù)據(jù)來獲取商業(yè)價值》的相關(guān)介紹)。

5、不要太在意活動中的數(shù)據(jù)

億企邦有幸觀察過一個日化店鋪的數(shù)據(jù),老板非常想知道什么因素對銷售額的影響最大?在對其運營數(shù)據(jù)進行回歸分析后,發(fā)現(xiàn)做活動的次數(shù)和時長對其銷售額都沒有影響(統(tǒng)計不顯著),唯一有影響的是客單價,客單價越低銷售額越高。

乍看之下,這個結(jié)論著實有些讓人無語(因為誰都知道),但模型顯示,客單價每降低一元,總銷售額提升100多,鑒于其高于50%的毛利率,降價一元可以總體上多賺50塊,但是總銷售額是萬元級的,因此多賺的50元微不足道,所以總體上看,銷售額似乎是一個不受人為控制的指標(自然波動),這似乎是一個謎題。

但促銷活動的不顯著是值得我們思考的,當然,也許是我們遺漏了某關(guān)鍵的指標,也許僅僅有客單價、促銷次數(shù)、促銷天數(shù)、轉(zhuǎn)化率、UV、熟客率等指標是不夠的,但不妨自問,我們很多時候是不是太過看重促銷和推廣了呢!

6、數(shù)據(jù)的“假規(guī)律”和“偽相關(guān)”

數(shù)據(jù)越大未必就能帶來更高的預測率,甚至還會帶來“假規(guī)律”和“偽相關(guān)”,比方說:搜索2005至2015年間的美國汽車銷售與“印度餐館”,結(jié)果發(fā)現(xiàn)二者之間竟然存在相關(guān)關(guān)系,這個東西顯然是無法解釋的,那么,偽相關(guān)的原因是什么呢?

首先,相關(guān)性并不意味著因果關(guān)系,比方說:Google Flu Trends對趨勢的預測并非屢試不爽,有幾次Google Trends就嚴重高估了流感病例的數(shù)量,包括2011/12的美國流感,2008/09瑞士流感,2008/09德國流感、2008/09比利時流感等。

英國倫敦大學學院的研究人員對此進行了研究,結(jié)果發(fā)現(xiàn),到Google搜索“流感”的人可以分成兩類:一類是感冒患者;另一類是跟風搜索者(可能是因為媒體報道而對感冒話題感興趣者)。

顯然第一類人的數(shù)據(jù)才是有用的,其搜索是內(nèi)部產(chǎn)生的,獨立于外界的,因此這些人的搜索模式應該與受到外界影響而進行搜索的人的模式不同,而正是第二類人的社會化搜索使得Google Flu Trends的預測失真,這正是因為Google Flu Trends把搜索“流感”與得流感的相關(guān)性當成了因果關(guān)系所致。

而稍早前美國東北大學與哈佛大學的研究人員對Google Flu Trends的失真案例進行的另一組研究則認為,這反映出了熱炒大數(shù)據(jù)的氛圍下誕生的一股大數(shù)據(jù)自大思潮,這股思潮認為,大數(shù)據(jù)完全可以取代傳統(tǒng)的數(shù)據(jù)收集方法,其最大問題在于,絕大多數(shù)大數(shù)據(jù)與經(jīng)過嚴謹科學試驗和采樣設計得到的數(shù)據(jù)之間存在很大的不同,首先,大未必全;其次,大則可能魚龍混雜。

此外,Google搜索算法本身的變化也有可能影響到Google Flu Trends的結(jié)果,這個原因不難理解,要知道,Google搜索的調(diào)整非常頻繁,單去年就進行了890項改進,其中就有不少屬于算法的調(diào)整,媒體對于流感流行的報道會增加與流感相關(guān)的詞匯的搜索次數(shù),也會令Google增加相關(guān)搜索的推薦,從而令一些本身并不感冒的人也對流感產(chǎn)生了興趣,進而把數(shù)據(jù)弄臟。

對于清洗數(shù)據(jù),歸根到底還是需要對數(shù)據(jù)進行模式分析,在流感趨勢這個例子,研究人員認為,執(zhí)行獨立搜索的患流感人群的模式會隨著時間推移而異于社會化搜索,其表現(xiàn)應該是在流感爆發(fā)時搜索急劇攀升,然后隨著流感消失而緩慢下降,相反,社會化搜索則會表現(xiàn)得更為勻稱,數(shù)據(jù)表明,在Google流感趨勢出現(xiàn)高估的時候,趨勢曲線的對稱性的確更高。

這說明在分析大數(shù)據(jù)時必須要注意此類陷阱,充斥的大數(shù)據(jù)集以及統(tǒng)計學家對分析結(jié)果的傳播會令真實的數(shù)據(jù)被放大或弄臟。

億企邦點評:

其實,數(shù)據(jù)的價值并不僅僅體現(xiàn)在其大小和精準度上,利用創(chuàng)新性數(shù)據(jù)分析方法去分析數(shù)據(jù)才是本質(zhì),在未來數(shù)據(jù)能夠逐步成為真正的大數(shù)據(jù),并且數(shù)字世界與實體世界的映射趨于一致時,大數(shù)據(jù)也許就能發(fā)揮其完全的威力,乃至于改變我們解決問題的方式。

關(guān)鍵詞:數(shù)據(jù),陷阱,中常

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉