個人公眾號:數(shù)據(jù)森麟(ID:shujusenlin),本站同" />
時間:2023-06-18 13:45:02 | 來源:網(wǎng)站運營
時間:2023-06-18 13:45:02 來源:網(wǎng)站運營
“水泊梁山“互聯(lián)網(wǎng)有限公司一百單八將內(nèi)部社交網(wǎng)絡(luò):作者介紹:徐麟,目前就職于杭州唯品會產(chǎn)品技術(shù)中心,哥大統(tǒng)計數(shù)據(jù)狗,從事數(shù)據(jù)挖掘&分析工作,喜歡用R&Python玩一些不一樣的數(shù)據(jù)
個人公眾號:數(shù)據(jù)森麟(ID:shujusenlin),本站同名專欄作者:數(shù)據(jù)森麟 。
with open("水滸傳全文.txt", encoding='gb18030') as file: shuihu = file.read()shuihu = shuihu.replace('/n','')shuihu_set = shuihu.split(' ')shuihu_set=[k for k in shuihu_set if k!='']songjiang_set=[k for k in shuihu_set if '宋江' in k]haohan = pd.read_excel('水滸人物.xlsx')haohan['出場段落']=0
haohan.sort_values('出場段落',ascending=False,inplace=True)attr = haohan['姓名'][0:10] v1 = haohan['出場段落'][0:10]bar = Bar("水泊梁山年收入TOP10")bar.add("年收入(萬)", attr, v1, is_stack=True,is_label_show=True)bar.render('水泊梁山年收入TOP10.html')haohan.sort_values('出場段落',ascending=True,inplace=True)attr = haohan['姓名'][0:10]v1 = haohan['出場段落'][0:10]bar = Bar("水泊梁山年收入BOTTOM10")bar.add("年收入(萬)", attr, v1, is_stack=True,is_label_show=True)bar.render('水泊梁山年收入BOTTOM10.html')
net_df = pd.DataFrame(columns=['Source','Target','Weight','Source_Ratio','Target_Ratio'])for i in range(0,107): for j in range(i+1,108): this_weight = len([k for k in shuihu_set if haohan['使用名'][i] in k and haohan['使用名'][j] in k]) net_df=net_df.append({'Source':haohan['姓名'][i],'Target':haohan['姓名'][j], 'Weight':this_weight, 'Source_Ratio':this_weight/haohan['出場段落'][i], 'Target_Ratio':this_weight/haohan['出場段落'][j]}, ignore_index=True) print(str(i)+':'+str(j))
關(guān)鍵詞:網(wǎng)絡(luò),社交,內(nèi)部,梁山
微信公眾號
版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。