《推薦系統(tǒng)實戰(zhàn)》共有8章,因此分為八篇博客來寫。下面介紹第六章。

其他幾章可點擊以下鏈接進行詳讀。

第六章:利用社交網絡數(shù)據(jù)互聯(lián)網" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務 > 推薦系統(tǒng)實戰(zhàn)之利用社交網絡

推薦系統(tǒng)實戰(zhàn)之利用社交網絡

時間:2023-03-13 21:46:01 | 來源:電子商務

時間:2023-03-13 21:46:01 來源:電子商務

前言

項亮寫的《推薦系統(tǒng)實戰(zhàn)》是作為入門推薦系統(tǒng)的中文書籍不二選擇。

《推薦系統(tǒng)實戰(zhàn)》共有8章,因此分為八篇博客來寫。下面介紹第六章。

其他幾章可點擊以下鏈接進行詳讀。

第六章:利用社交網絡數(shù)據(jù)

互聯(lián)網中的一個新寵兒便是社交網絡。當前的社交網絡類型眾多,有熟人類型的微信、陌生人社交的陌陌,職場類型的領英和脈脈等。基于社交網絡的推薦可以很好地模擬現(xiàn)實社會,在現(xiàn)實社會中,很多時候我們都是通過可信的朋友渠道獲得推薦。

美國著名的第三方調查機構尼爾森曾調查了影響用戶相信某個推薦的因素。調查結果顯示,90%的用戶相信朋友對他們的推薦,70%的用戶相信網上其他用戶對廣告商品的評論。因此,好友的推薦對增加用戶對推薦結果的信任度非常重要,同時也間接說明了社交網絡在推薦系統(tǒng)中具有重要的意義。

本章將詳細探討如何利用社交網絡數(shù)據(jù)來給用戶進行個性化推薦。主要涉及兩點,一是如何利用社交網絡來給用戶推薦物品,二是如何利用社交網絡來給用戶推薦好友。本章將以以下幾點為核心進行介紹:

本章的思維導圖

1.獲取社交網絡數(shù)據(jù)的途徑

獲取社交網絡數(shù)據(jù)途徑主要有以下幾種:

1.1電子郵件

電子郵件誕生較早,是一種社交工具。我們可以分析用戶的聯(lián)系人列表了解用戶的好友信息,還可以 通過研究兩個用戶之間的郵件往來頻繁程度度量兩個用戶的熟悉程度。只是,因為電子郵件是一個封閉的系統(tǒng),因此很難獲得用戶的聯(lián)系人列表和往來郵件。此外,還可以分析用戶郵箱的后綴,來進行社區(qū)劃分,進而獲得一種隱式的社交關系。

1.2用戶注冊信息

有些網站需要用戶填寫一些注冊信息,例如統(tǒng)計人口信息等。這些信息也是一種隱式的社交網絡數(shù)據(jù)。

1.3用戶的位置數(shù)據(jù)

在網頁上可以獲得用戶位置信息就是IP地址,在移動端可以獲取GPS數(shù)據(jù)。利用這兩種數(shù)據(jù),可以勾畫出用戶所屬的社區(qū)關系。

1.4論壇和討論組

用戶因興趣相似或在某個帖子下進行討論,則可推斷出兩者的社區(qū)關系。

1.5即時聊天工具

即時聊天工具如QQ等,有聯(lián)系人列表,根據(jù)用戶之間聊天的頻次,可以推斷出用戶的熟悉程度。不幸的是,由于即時聊天和電子郵件系統(tǒng)都是封閉的系統(tǒng),因此一般不會將這種社會關系公開。

1.6社交網站

近幾年,社交網絡的發(fā)展催生了很多社交應用,例如Facebook和Twitter。這種新型的社交網絡與以往封閉的社交應用不同,其用戶關系是可以公開的。例如Facebook上,是雙向好友,而Twitter上是單向好友。Facebook是社交圖譜代表,Twitter是興趣圖譜代表。

2.社交網絡數(shù)據(jù)的簡介

社交網絡既有節(jié)點也有邊和權值,因此可以使用圖來表示社交網絡。定義一個圖G(V,E,W),其中V是頂點的集合,E是邊的集合,W是對應邊的權重。

典型的社交網絡有Facebook、Twitter、微博和微信。

此外,在有向社交網絡中,還定義out(u)為頂點u指向的頂點集合,例如,如果是在微博中,則out(u)表示用戶u關注的好友集合。in(u)則為指向頂點u的頂點集合,以微博為例,其表示關注用戶u的好友集合。

一般社交網絡數(shù)據(jù)可劃分三類:

接下來,我們看一下社交網絡數(shù)據(jù)的分布規(guī)律。

(1) 社交網絡中用戶的入度(in degree)和出度(out degree)的分布滿足長尾分布。

圖6-3和圖6-4分別展現(xiàn)了Slashdot社交網絡數(shù)據(jù)集中用戶的入度和出度分布情況。其中Slashdot是一個類似于Twitter的社交網站。

3.基于社交網絡的推薦

基于社交網絡的推薦在學術界也被稱為社會化推薦,其也已在大多數(shù)社交網站中被應用。如大家所熟知的微信中公眾號文章會顯示被多少朋友閱讀,亞馬遜利用Facebook好友信息給用戶推薦商品等等。

利用社交網絡中好友信息給用戶做推薦有兩個優(yōu)勢:

3.1基于鄰域的社會化推薦算法

一個直覺就是用戶的行為偏好會直接影響到用戶。因此,最簡單的想法是給用戶推薦用戶朋友喜歡的物品集合:

/begin{equation} p_{u i}=/sum_{i /in /text { out }(u)} r_{v i} /end{equation}

其中out(v)是用戶好友的集合。如果用戶v喜歡物品i,則$r_{v i}=1$, 否則為0。

由于用戶和不同好友的熟悉度不同,影響的權重也自然應該不相同,因此可以在用戶之間加入好友和用戶的熟悉程度以及興趣相似度:

/begin{equation} p_{u i}=/sum_{v /in /operatorname{out}(u)} w_{u v} r_{v i} /end{equation}

其中 w_{uv} 由兩部分組成,一部分是用戶u和用戶v的熟悉程度,另一部分是用戶u和用戶v的興趣相似度。用戶u和用戶v的熟悉程度(familiarity)描述了用戶u和用戶v在現(xiàn)實社會中的熟悉程度。因此可以用用戶之間的共同好友比例來度量:

/begin{equation} /text { familiarity }(u, v)=/frac{|/operatorname{out}(u) /cap /operatorname{out}(v)|}{|/operatorname{out}(u) /cup /operatorname{out}(v)|} /end{equation}

興趣相似度(similarity)可使用用戶的行為來計算??刹捎闷鋵Ω信d趣的物品集合的重合度:

/begin{equation} /text { similiarity }(u, v)=/frac{|N(u) /cap N(v)|}{|N(u) /cup N(v)|} /end{equation}

其中N(u)是用戶u喜歡的物品集合。

3.2 基于圖的社會化推薦算法

在社交網站中存在兩種關系,一種是用戶對物品的興趣關系,一種是用戶之間的社交網絡關系。因此采用圖的形式可以融入這兩種關系。如下是一個兩者結合的二分圖:

定義網絡關系之后,還需要要定義邊的權重。其中用戶的社交關系之間的權重可以定義為用戶之間相似度的 /alpha 倍(涵蓋了熟悉程度和興趣相似度),而用戶和物品之間的權重可以定義為用戶對物品喜歡程度的 /beta 倍。其中 /alpha/beta 是根據(jù)需要確定。

構建好上述的圖之后就可以采用PersonalRank模型來進行建模了。

當然除了上述用戶和用戶之間設計關系之外,還可以有用戶和群組之間的關系。例如社群的存在。

3.3 實際系統(tǒng)中的社會化推薦算法

前面提到的基于領域的社會化推薦算法也存在一定的弊端。其因為在計算時,需要得到用戶所有好友的歷史行為數(shù)據(jù),這一操作對在實際中是非常困難的。因為在社交網絡中,用戶的歷史記錄是非常龐大的,因此不太可能將所有用戶的行為都緩存在內存中。

為了使其有較快的響應,有兩個改進的方法。一是做截斷,即選擇與用戶相似度最高的top-N好友進行計算。此外,在計算時可以只用用戶的1一個歷史行為數(shù)據(jù)。二是重新設計數(shù)據(jù)庫。具體思想是給每個用戶維護一個消息隊列。

3.4 社會化推薦系統(tǒng)和協(xié)同過濾推薦系統(tǒng)

社會化推薦系統(tǒng)的結果往往很難通過離線實驗去評測,因為其優(yōu)勢不在于增加預測準確度,而是在于通過用戶的好友增加用戶對推薦結果的信任度,從而讓用戶單擊哪些很冷門的推薦結果。

3.5 信息流推薦

信息流主要關注的問題是如何從社交網絡中好友的信息墻給用戶展示其感興趣的信息墻。最典型的信息流推薦算法是Facebook的EdgeRank。

4 給用戶推薦好友

好友推薦是社會化網絡的重要應用之一,其目標是根據(jù)用戶現(xiàn)有的好友及他們的行為記錄來給用戶推薦新的好友。 好友推薦算法在社交網絡上也被稱為鏈路預測(Link Prediction)。下面介紹一些簡單的算法。

4.1 基于內容的匹配

可以給用戶推薦和他們有相似內容屬性的用戶作為好友。常見的內容屬性有用戶的人口統(tǒng)計學屬性,年齡、性別、職業(yè)、畢業(yè)學校和工作單位;用戶的興趣,包括用戶喜歡的物品和發(fā)表的帖子;用戶為位置信息,包含用戶的住址、IP地址和郵編等。

4.2 基于共同興趣的好友推薦

利用用戶喜歡的物品,進行相似度計算,其越相似說明他們的興趣越相投。

4.3 基于社交網絡圖的好友推薦

可以基于用戶現(xiàn)有的社交網絡圖來進行未來好友預測?;诤糜训耐扑]方法,最簡單的計算其共同好友的比例。其重疊越大,其推薦可能性就越大。

一點題外話

六度原理是指社會中任意兩個人都可以通過不超過6個人的路徑相互認識,如果轉化為圖的術語,就是社交網絡圖的直徑為6。

總結

本章介紹了基于社交網絡數(shù)據(jù)的推薦算法,其包含了獲取社交網絡數(shù)據(jù)的途徑、社交網絡數(shù)據(jù)的介紹、基于社交網絡的推薦和基于社交網絡的好友推薦。

關鍵詞:社交,網絡,利用,系統(tǒng),實戰(zhàn),推薦

74
73
25
news

版權所有? 億企邦 1997-2025 保留一切法律許可權利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關閉