網(wǎng)站文章被長(zhǎng)期采集會(huì)出現(xiàn)什么問(wèn)題?
時(shí)間:2022-05-28 02:51:01 | 來(lái)源:網(wǎng)絡(luò)營(yíng)銷
時(shí)間:2022-05-28 02:51:01 來(lái)源:網(wǎng)絡(luò)營(yíng)銷
定期更新站內(nèi)的文章幾乎是每一個(gè)網(wǎng)站都會(huì)做的事情,當(dāng)然不是每網(wǎng)站都注重原創(chuàng),也不是每個(gè)網(wǎng)站都愿意花這個(gè)時(shí)間去做原創(chuàng)的文章,不少人就在用采集的方式在更新自己的網(wǎng)站文章。且不說(shuō)大量采集他人文章的網(wǎng)站會(huì)怎么樣,這里根據(jù)自己網(wǎng)站的實(shí)際情況,說(shuō)一說(shuō)長(zhǎng)期處于被他人采集文章的網(wǎng)站會(huì)有什么樣的后果,以及要避免被他人采集的方法。
百度BaiduSpider喜歡原創(chuàng)的東西,但是百度蜘蛛對(duì)于原創(chuàng)源址的判斷目前還無(wú)法做到精準(zhǔn)的地步,它并不能完全自主的判斷某一篇文章它的始發(fā)點(diǎn)是哪里,當(dāng)我們更新一篇文章,并且很快的被他人采集的時(shí)候,蜘蛛可能同一時(shí)間接觸了到很多一摸一樣的文章,那么它就會(huì)很迷茫,并不清楚到底哪個(gè)是原創(chuàng)的,哪些是復(fù)制的。
因此,當(dāng)我們的網(wǎng)站長(zhǎng)期處于被采集的狀態(tài)的時(shí)候,我們網(wǎng)站上更新的文章大部分都在互聯(lián)網(wǎng)上存在一樣的內(nèi)容,而假如網(wǎng)站權(quán)重又不夠高,那么蜘蛛就很可能將你的網(wǎng)站列為采集站,它更相信你網(wǎng)站的文章是采集自互聯(lián)網(wǎng)的,而不是互聯(lián)網(wǎng)當(dāng)中其他的站是采集你的文章。
一、網(wǎng)站內(nèi)容被長(zhǎng)期采集會(huì)出現(xiàn)的狀況 當(dāng)你的網(wǎng)站出現(xiàn)以下這幾種狀況的時(shí)候,說(shuō)明搜索引擎蜘蛛可能已經(jīng)誤判你的網(wǎng)站內(nèi)容為采集的了,作為一個(gè)專業(yè)的SEO人員,你就要開始仔細(xì)的檢查你的網(wǎng)站內(nèi)容是不是正在長(zhǎng)期被人采集了。
1、先文章頁(yè)停止收錄,然后整個(gè)網(wǎng)站不收錄 這點(diǎn)是一定會(huì)發(fā)生的,因?yàn)楸话俣日`判為采集站,所以你的文章頁(yè)一定會(huì)被百度列為考察期,在這個(gè)期間,文章頁(yè)是一定會(huì)停止收錄的。當(dāng)然這個(gè)停止收錄不會(huì)只是影響你的文章頁(yè),它也會(huì)讓那個(gè)百度重新審核你整個(gè)網(wǎng)站,所以其他的頁(yè)面也會(huì)漸漸的開始不收錄。筆者的網(wǎng)站曾有半個(gè)月沒(méi)有收錄過(guò)一個(gè)頁(yè)面,原因就是因?yàn)檫@個(gè)導(dǎo)致的。
2、網(wǎng)站收錄開始減少,快照停滯 正如前面所說(shuō),百度會(huì)重新對(duì)你的網(wǎng)站進(jìn)行考量,這個(gè)時(shí)候,一定會(huì)發(fā)現(xiàn)你網(wǎng)站存在著一些頁(yè)面和互聯(lián)網(wǎng)當(dāng)中存在類似,百度會(huì)毫不考慮的減少你這些頁(yè)面的收錄,所以很多人發(fā)現(xiàn)網(wǎng)站停止收錄之后,慢慢的引起了網(wǎng)站整個(gè)收錄的減少,就是這個(gè)原因。頁(yè)面不怎么收錄,百度對(duì)網(wǎng)站的信任度下降,最終,快照也會(huì)停滯一段時(shí)間(具體可查看億企邦《如何保持百度快照每天更新》的相關(guān)介紹)。
3、排名并未有所波動(dòng),流量正常 當(dāng)出現(xiàn)收錄減少,快照停滯的時(shí)候,我們最關(guān)心的問(wèn)題就是排名的問(wèn)題,擔(dān)心排名會(huì)有所影響。這點(diǎn)到是可以放心,因?yàn)槲恼卤徊杉瑢?dǎo)致自己站受到百度的考核,這個(gè)只是影響了百度對(duì)網(wǎng)站的信任度,并不會(huì)導(dǎo)致網(wǎng)站權(quán)重的下降,所以網(wǎng)站的關(guān)鍵詞排名并不會(huì)受到影響。
4、改善之后,網(wǎng)站收錄依然存在異常 假設(shè)我們發(fā)現(xiàn)自己網(wǎng)站被采集之后,我們對(duì)網(wǎng)站進(jìn)行了一些改善,成功的避免了網(wǎng)站被采集,那么你的網(wǎng)站還會(huì)有一個(gè)適應(yīng)期,整個(gè)適應(yīng)期表現(xiàn)出來(lái)的癥狀為:網(wǎng)站漸漸的開始收錄文章頁(yè),但是收錄的并不是即時(shí)更新的文章,有可能是前天的或者大前天更新的。這樣的癥狀大概會(huì)存在1周的時(shí)間,之后收錄會(huì)慢慢的趨于正常,快照也會(huì)慢慢的恢復(fù)。
5、搜索引擎蜘蛛有爬取,但不抓取 分析網(wǎng)站日志,你會(huì)發(fā)現(xiàn)蜘蛛會(huì)爬取經(jīng)常采集文章的頁(yè)面,但是時(shí)間長(zhǎng)了就不會(huì)抓取了,這可能是因?yàn)樵谒阉饕嬷┲肟磥?lái),你的網(wǎng)站內(nèi)容都是采集而來(lái),網(wǎng)絡(luò)上重復(fù)的內(nèi)容太多,抓取你這樣的一個(gè)小站,就浪費(fèi)了資源,這樣無(wú)疑是對(duì)網(wǎng)站收錄有很大的影響。
一般做SEO的人都知道,在網(wǎng)絡(luò)營(yíng)銷搜索引擎索引環(huán)節(jié)中搜索引擎蜘蛛會(huì)進(jìn)行去重處理,其實(shí)在蜘蛛爬行的時(shí)候已經(jīng)在進(jìn)行檢測(cè),當(dāng)蜘蛛爬行和抓取文件時(shí)會(huì)進(jìn)行一定程度的復(fù)制內(nèi)容檢測(cè),遇到權(quán)重低的網(wǎng)站推廣上大量轉(zhuǎn)載或抄襲內(nèi)容時(shí),很可能不再繼續(xù)爬行。這也就是為什么很多站長(zhǎng)查看日志的時(shí)候發(fā)現(xiàn)了蜘蛛,但是頁(yè)面從來(lái)沒(méi)有被抓取的原因,因?yàn)榕佬邪l(fā)現(xiàn)是重復(fù)內(nèi)容,那么它將放棄抓取,也就只停留在爬行過(guò)的階段。
6、排名上不去,上去了也不穩(wěn)定 當(dāng)你發(fā)現(xiàn)你寫的原創(chuàng)文章,已經(jīng)收錄后,排名卻上不去,搜索看到的都是其他站轉(zhuǎn)載的鏈接,甚至是排名上去了也不穩(wěn)定,過(guò)了一天,排名又被降下去了,遇到這種情況,你就要仔細(xì)的查看一下,你網(wǎng)站的原創(chuàng)文章是不是正在長(zhǎng)期被人采集了。
7、隱形降權(quán) 這個(gè)已經(jīng)是達(dá)到搜索引擎的“忍耐限度”了,長(zhǎng)期采集,導(dǎo)致網(wǎng)站的收錄排名都不穩(wěn)定,蜘蛛每次過(guò)去也獲取不到想要的內(nèi)容,已經(jīng)從蜘蛛不喜歡的網(wǎng)站降為用戶討厭的網(wǎng)站,此時(shí),百度就會(huì)將之前的排名都降降甚至是直接給你踢到百名之外,即降權(quán)。降權(quán)是網(wǎng)站面臨最嚴(yán)重的問(wèn)題。
不管你是采集別人的文章,還是別人采集你的文章,雖然我們的選擇方式和目的也不一樣,但是過(guò)度采集帶來(lái)的后果都是一樣的,所以采集之前我們也要權(quán)衡一下是否值得。
這一系列的現(xiàn)象都是當(dāng)網(wǎng)站處于長(zhǎng)期被他人采集的情況下會(huì)出現(xiàn)的,所以當(dāng)你自己的網(wǎng)站存在這樣的一些現(xiàn)象的時(shí)候,你首先要找的原因就是自己每天更新的文章是不是正在被別人采集。
二、長(zhǎng)期被采集該怎么辦? 如果你的網(wǎng)站已經(jīng)是處于被人長(zhǎng)期采集的情況了,作為SEO人員,肯定是要想辦法解決的,當(dāng)然別人要采集你的文章,你也不可能完全強(qiáng)制性的禁止到可以不讓別人采集了,所以,我們能做的就是在自己本身上做一些改動(dòng)。
1、提升頁(yè)面權(quán)重 提升頁(yè)面的權(quán)重是可以從根本上解決這個(gè)問(wèn)題的,我們都知道,像A5、Chinaz這樣的網(wǎng)站每天都會(huì)被別人采集,但是這完全沒(méi)有影響到A5、Chinaz網(wǎng)站的收錄,這就是因?yàn)樗麄兊臋?quán)重足夠的高,當(dāng)別人網(wǎng)站出現(xiàn)和他們一樣的文章的時(shí)候,蜘蛛會(huì)默認(rèn)的把他們的文章作為原創(chuàng)源。
所以,一定要提升文章頁(yè)面的權(quán)重,多做一些這個(gè)頁(yè)面的外鏈。
2、Rss合理利用 開發(fā)一個(gè)這樣的功能也是有必要的,在網(wǎng)站文章有更新的時(shí)候,第一時(shí)間就讓搜索引擎知道,主動(dòng)出擊,這樣會(huì)很有助于收錄的。而且Rss也能有效增加網(wǎng)站的流量,可以說(shuō)是一舉兩得。
3、做一些細(xì)節(jié),限制機(jī)器的采集 被人工采集還沒(méi)什么,要是沒(méi)人用工具定時(shí)、大量的采集你網(wǎng)站的文章,這確實(shí)讓人很頭疼,所以我們應(yīng)該在頁(yè)面的細(xì)節(jié)上做一些處理,至少能夠防止機(jī)器的采集。比如頁(yè)面不要設(shè)計(jì)的太傳統(tǒng)、大眾化;Url的寫法要多變一些,不要成為默認(rèn)疊加等設(shè)置;圖片盡量加上水印,增加別人的采集文章后加工處理的時(shí)間成本。
4、被采集更新的文章多與自己網(wǎng)站有關(guān) 別人采集我們的文章,是因?yàn)樗麄円残枰覀兏碌膬?nèi)容,所以如果我們更新的都是與自己網(wǎng)站有關(guān)的信息,經(jīng)常會(huì)穿插我們網(wǎng)站的名稱,別人在采集的時(shí)候就會(huì)覺(jué)得我們的文章對(duì)他們并沒(méi)有太多的意義,這也是很不錯(cuò)的避免采集的方式。
5、搜索引擎算法的完善 保持良好的心態(tài),畢竟百度也推出了颶風(fēng)算法來(lái)打擊懲罰(具體可查看億企邦《百度推出颶風(fēng)算法:嚴(yán)厲打擊惡劣采集》的相關(guān)介紹),原創(chuàng)文章被采集抄襲這是一個(gè)難題,技術(shù)上一直在改進(jìn)優(yōu)化,谷歌搜索引擎也不能完美解決這個(gè)問(wèn)題,因此把自己的網(wǎng)站做好,讓文章能夠?qū)崿F(xiàn)秒收錄才是上策。
文章經(jīng)常被采集,這肯定是會(huì)對(duì)我們產(chǎn)生影響的,所以我們要盡量的去避免,讓自己網(wǎng)站的內(nèi)容在互聯(lián)網(wǎng)當(dāng)中成為唯一性,提升百度對(duì)我們網(wǎng)站的信任度,讓我們的優(yōu)化工作更加順暢。
億企邦點(diǎn)評(píng): 我們回歸搜索引擎的工作原理本質(zhì),它就是為了給用戶搜索出結(jié)果的時(shí)候,能夠滿足并解決用戶自身的需求。也就是說(shuō),不管你的文章怎么來(lái)的(采集文章也是能解決用戶需求的),并且排版好看,邏輯表達(dá)清晰,可讀性強(qiáng),那是不是就符合了搜索引擎為用戶提供有價(jià)值內(nèi)容,解決用戶搜索需求的本質(zhì)?因此也就有了排名。
但是,這樣的采集行為是不可行的,試想長(zhǎng)期都給予采集內(nèi)容更好的排名,就一定會(huì)引起原創(chuàng)作者的不忿。這樣的情況持續(xù)下去,站長(zhǎng)們都開始采集內(nèi)容或者抄襲內(nèi)容,不去生產(chǎn)原創(chuàng)文章或者偽原創(chuàng)文章。那么必定用戶在使用搜索引擎查詢時(shí),解決用戶需求的能力就會(huì)越來(lái)越弱。
因此,為了打造更好的互聯(lián)網(wǎng)內(nèi)容生態(tài)圈,搜索引擎會(huì)不斷推出算法來(lái)打擊采集站點(diǎn),也會(huì)對(duì)原創(chuàng)內(nèi)容給予一定的排名優(yōu)待,鼓勵(lì)原創(chuàng)作者創(chuàng)造更多的優(yōu)質(zhì)內(nèi)容的。
關(guān)鍵詞:文章,長(zhǎng)期,采集