時間:2023-03-08 00:06:01 | 來源:電子商務(wù)
時間:2023-03-08 00:06:01 來源:電子商務(wù)
大家都知道文章內(nèi)容重復(fù)過高不好,會被K,會降權(quán),不會被收錄,各種說法流連在SEO初學(xué)者的腦海中,一個新站數(shù)據(jù)怎么來?你能每天更新幾十篇內(nèi)容嗎?顯然很多人搞不定,于是采集這個說法就有了,繼而出現(xiàn)了偽原創(chuàng),常見的為原創(chuàng)方式是顛倒文章內(nèi)容,近義詞替換,添加或者減少一部分內(nèi)容,但是用久了后發(fā)現(xiàn),這樣還是不會收錄,原因是什么呢?今天筆者就詳細(xì)的分析了下,希望這篇文章可以解決大家的疑問。
百度并不是不收錄內(nèi)容相同的網(wǎng)站,像經(jīng)常寫軟文的就知道,寫了軟文就是為了讓別人轉(zhuǎn)載,就是為了增加外鏈和相關(guān)域,顯然是可以收錄的,舉個明顯的例子:百度新聞搜索關(guān)云長
可以很明顯的看到有相同新聞,這就代表同樣的內(nèi)容還是可以收錄的,如果仔細(xì)查看,可以點(diǎn)擊上圖花紅圈的地方進(jìn)去,
這些都是相似頁面,仔細(xì)看看會發(fā)現(xiàn),有的標(biāo)題不一樣,描述大部分也不一樣,所以標(biāo)題細(xì)微的變化和描述的不相同對偽原創(chuàng)是沒有作用的,百度可以識別出來,
然后我們再看看正文部分,筆者找到一個工具,可以檢測兩篇文章的相似度,大家來看看正文部分的相似度:
忘記標(biāo)紅了,呵呵,大家將就下,數(shù)值在最上邊,內(nèi)容是從標(biāo)題到文章結(jié)束部分,相似度是96.973%,相似度很高,很明顯這樣的文章簡直就可以說是采集的,可是仔細(xì)想想,搜索引擎是通過蜘蛛來訪問的頁面,那么判斷文章相似度會不會和源代碼有關(guān)系呢?于是筆者有把兩個網(wǎng)站的源代碼復(fù)制進(jìn)去檢測了下相似度,請看下圖:
這個是百度新聞搜索cnzz的2個相似頁面的源代碼,相似度大大降低了,才45.332%,這樣的兩個頁面很顯然是無法判斷出來的,但是百度偏偏又可以判斷出這2篇文章相似。
總結(jié):通過以上觀察,搜索引擎的判斷能力加強(qiáng)了,不再局限于網(wǎng)站的源代碼,而是可以直接找出文章的中文部分,并來對比其他網(wǎng)站,所以即使大家的網(wǎng)站程序不一樣,頁面布局不一樣,只要內(nèi)容是采集的,那么搜索引擎就可以判斷出文章的相似度,但是并不是內(nèi)容相似百度就不收錄。
版權(quán)沒有,盜版不究,任意抄襲,確保完整,www.dytj8.com。交流才能進(jìn)步,借助A5平臺和大家分享,交流
關(guān)鍵詞:判斷,索引,分析
客戶&案例
營銷資訊
關(guān)于我們
微信公眾號
版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。