網(wǎng)站被鏡像指的是什么?被鏡像之后有什么后果?

網(wǎng)站被鏡像是指,在網(wǎng)絡(luò)上出現(xiàn)一個和你的網(wǎng)站一模一樣的被復(fù)制的網(wǎng)站,除了域名之外全部都一模一樣。

網(wǎng)站被鏡像有兩種情況:" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

15158846557 在線咨詢 在線咨詢
15158846557 在線咨詢
所在位置: 首頁 > 營銷資訊 > 網(wǎng)站運營 > 網(wǎng)站被鏡像指的是什么?被鏡像之后有什么后果?

網(wǎng)站被鏡像指的是什么?被鏡像之后有什么后果?

時間:2023-06-11 15:30:02 | 來源:網(wǎng)站運營

時間:2023-06-11 15:30:02 來源:網(wǎng)站運營

網(wǎng)站被鏡像指的是什么?被鏡像之后有什么后果?:

網(wǎng)站被鏡像指的是什么?被鏡像之后有什么后果?

網(wǎng)站被鏡像是指,在網(wǎng)絡(luò)上出現(xiàn)一個和你的網(wǎng)站一模一樣的被復(fù)制的網(wǎng)站,除了域名之外全部都一模一樣。

網(wǎng)站被鏡像有兩種情況:

一完全鏡像你的站,除了網(wǎng)址不一樣,完全山寨你的。

另一種是博彩站,都是抓取的你的網(wǎng)頁內(nèi)容,但是實際查看的時候,隱藏掉了,顯示的是他的廣告。

網(wǎng)站被鏡像的情況出現(xiàn)之后,被鏡像的網(wǎng)站還能夠超過原網(wǎng)站的排名,原網(wǎng)站會遭受非常大的損失,被百度K站,造成排名和收錄被清零的情況發(fā)生。

因此如果我們在日常網(wǎng)站維護(hù)中,發(fā)現(xiàn)這一類的鏡像網(wǎng)站一定要及時處理,以減少對我們網(wǎng)站正常運營的影響。

網(wǎng)站被鏡像之后的處理方法,

方案一:網(wǎng)站被鏡像之后,第一時間,我們應(yīng)該在百度站長平臺進(jìn)行反饋,百度站長平臺的說明是,百度會自動識別一些惡意鏡像網(wǎng)站,但是如果你發(fā)現(xiàn)你的搜索詞(如你的網(wǎng)站名稱)被鏡像的網(wǎng)站排名已經(jīng)到了第一頁,那么你需要第一時間去百度站長提交,讓百度將鏡像網(wǎng)站放入鏡像網(wǎng)站黑名單。

1、百度站長反饋中心:http://ziyuan.baidu.com/feedback

2、百度舉報平臺進(jìn)行舉報(如果鏡像網(wǎng)站有博彩等非法的內(nèi)容,舉報是比較有效的)http://jubao.baidu.com/jubao/(百度站長反饋的時候,你需要像百度提交相關(guān)的資質(zhì)證明,比如百度快照截圖,網(wǎng)站備案資料,域名證書等等一些有力證明你的網(wǎng)站的資料,提交之后,百度會給與回復(fù)。)

方案二: 用.htaccess屏蔽鏡像網(wǎng)站的ip和域名, 空間設(shè)置只能通過域名訪問,ip不能訪問(鏡像程序狗基本都是利用程序爬網(wǎng)站ip進(jìn)來鏡像的)
如果網(wǎng)站鏡像不是整站復(fù)制,而是使用解析的方式進(jìn)行的,那么你可以查詢到鏡像網(wǎng)站的ip,并在服務(wù)器上拒絕ip,或者利用你的服務(wù)器防御軟件,如云鎖、安全狗等列入黑名單。如果你使用的是虛擬主機(jī),那么你可以使用第三方防御,如360網(wǎng)站衛(wèi)士、百度云加速,也可以對鏡像網(wǎng)站進(jìn)行杜絕。

1.截獲IP

將上述文件命名為“ip.php”放在網(wǎng)站根目錄,然后我通過鏡像網(wǎng)站網(wǎng)址訪問http://www.***.com/ip.php,然后在上述PHP程序生成的ip.txt中獲取了這個IP:




<?php

$file = "ip.txt";//保存的文件名

$ip = $_SERVER['REMOTE_ADDR'];

$handle = fopen($file, 'a');

fwrite($handle, "IP Address: ");

fwrite($handle, "$ip");

fwrite($handle, "/n");

fclose($handle);

?>
104.194.16.230 (美國)

2.屏蔽IP

在htaccess中添加下述代碼:

Deny from 104.194.16.230

當(dāng)你再次用鏡像網(wǎng)址訪問你的網(wǎng)站的時候就會報4.3錯誤了,現(xiàn)在百度即使收錄了這個網(wǎng)址對你的網(wǎng)站也不會產(chǎn)生任何影響

如果你的服務(wù)器是windows服務(wù)器就是屏蔽一下ip就可以了,如果網(wǎng)站使用了cdn需要讓cdn官方技術(shù)幫你屏蔽一下即可。LINUX主機(jī)通過修改.htaccess也可以設(shè)置,這部分可以讓技術(shù)操作。

方案三: 轉(zhuǎn)移網(wǎng)站鏡像到其他網(wǎng)站,比如:把鏡像我的網(wǎng)站轉(zhuǎn)移到一些大型網(wǎng)站上去,對大型網(wǎng)站幾乎沒有影響,但如果有影響的話大型網(wǎng)站的反饋話語權(quán)也比我們有分量。

把剛才的403錯誤頁面設(shè)置為其他網(wǎng)站網(wǎng)址,實現(xiàn)方法是在屏蔽IP的htaccess代碼中添加:

ErrorDocument 403 http://news.baidu.com/

這樣你訪問你的鏡像網(wǎng)址時,會發(fā)現(xiàn)它鏡像的是其實百度新聞。后果可想而知。

方案四: 利用百度云或者加速樂等隱藏真實網(wǎng)站ip

方案五: 服務(wù)器網(wǎng)站目錄保護(hù),網(wǎng)站其他禁止腳本運行,php和asp都可以設(shè)置;

如果對方是扒的網(wǎng)站模板,同時批量采集網(wǎng)站信息怎么辦?

1、限制IP地址單位時間的訪問次數(shù)
  分析:沒有哪個常人一秒鐘內(nèi)能訪問相同網(wǎng)站5次,除非是程序訪問,而有這種喜好的,就剩下搜索引擎爬蟲和討厭的采集器了。
 弊端:一刀切,這同樣會阻止搜索引擎對網(wǎng)站的收錄(不建議操作)
  適用網(wǎng)站:不太依靠搜索引擎的網(wǎng)站
  采集器會怎么做:減少單位時間的訪問次數(shù),減低采集效率
2、屏蔽ip
  分析:通過后臺計數(shù)器,記錄來訪者ip和訪問頻率,人為分析來訪記錄,屏蔽可疑Ip。(最有效的方式)
  弊端:似乎沒什么弊端,就是站長忙了點
  適用網(wǎng)站:所有網(wǎng)站,且站長能夠知道哪些是google或者百度的機(jī)器人
  采集器會怎么做:打游擊戰(zhàn)唄!利用ip代理采集一次換一次,不過會降低采集器的效率和網(wǎng)速(用代理嘛)。
3、利用js加密網(wǎng)頁內(nèi)容
Note:這個方法我沒接觸過,只是從別處看來
  分析:不用分析了,搜索引擎爬蟲和采集器通殺
  適用網(wǎng)站:極度討厭搜索引擎和采集器的網(wǎng)站
  采集器會這么做:你那么牛,都豁出去了,他就不來采你了
4、網(wǎng)頁里隱藏網(wǎng)站版權(quán)或者一些隨機(jī)垃圾文字,這些文字風(fēng)格寫在css文件中
  分析:雖然不能防止采集,但是會讓采集后的內(nèi)容充滿了你網(wǎng)站的版權(quán)說明或者一些垃圾文字,因為一般采集器不會同時采集你的css文件,那些文字沒了風(fēng)格,就顯示出來了。
  適用網(wǎng)站:所有網(wǎng)站
  采集器會怎么做:對于版權(quán)文字,好辦,替換掉。對于隨機(jī)的垃圾文字,沒辦法,勤快點了。
5、用戶登錄才能訪問網(wǎng)站內(nèi)容
  分析:搜索引擎爬蟲不會對每個這樣類型的網(wǎng)站設(shè)計登錄程序。聽說采集器可以針對某個網(wǎng)站設(shè)計模擬用戶登錄提交表單行為。
  適用網(wǎng)站:極度討厭搜索引擎,且想阻止大部分采集器的網(wǎng)站
  采集器會怎么做:制作擬用戶登錄提交表單行為的模塊
6、利用腳本語言做分頁(隱藏分頁)
  分析:還是那句,搜索引擎爬蟲不會針對各種網(wǎng)站的隱藏分頁進(jìn)行分析,這影響搜索引擎對其收錄。但是,采集者在編寫采集規(guī)則時,要分析目標(biāo)網(wǎng)頁代碼,懂點腳本知識的人,就會知道分頁的真實鏈接地址。
  適用網(wǎng)站:對搜索引擎依賴度不高的網(wǎng)站,還有,采集你的人不懂腳本知識
  采集器會怎么做:應(yīng)該說采集者會怎么做,他反正都要分析你的網(wǎng)頁代碼,順便分析你的分頁腳本,花不了多少額外時間。
7、防盜鏈措施(只允許通過本站頁面連接查看,如:Request.ServerVariables("HTTP_REFERER") )
  分析:asp和php可以通過讀取請求的HTTP_REFERER屬性,來判斷該請求是否來自本網(wǎng)站,從而來限制采集器,同樣也限制了搜索引擎爬蟲,嚴(yán)重影響搜索引擎對網(wǎng)站部分防盜鏈內(nèi)容的收錄。
  適用網(wǎng)站:不太考慮搜索引擎收錄的網(wǎng)站
  采集器會怎么做:偽裝HTTP_REFERER嘛,不難。
8、全flash、圖片或者pdf來呈現(xiàn)網(wǎng)站內(nèi)容
  分析:對搜索引擎爬蟲和采集器支持性不好,這個很多懂點seo的人都知道
  適用網(wǎng)站:媒體設(shè)計類并且不在意搜索引擎收錄的網(wǎng)站
  采集器會怎么做:不采了,走人
9、網(wǎng)站隨機(jī)采用不同模版
  分析:因為采集器是根據(jù)網(wǎng)頁結(jié)構(gòu)來定位所需要的內(nèi)容,一旦先后兩次模版更換,采集規(guī)則就失效,不錯。而且這樣對搜索引擎爬蟲沒影響。
 適用網(wǎng)站:動態(tài)網(wǎng)站,并且不考慮用戶體驗。(靜態(tài)網(wǎng)站頭部和底部調(diào)用不一樣的模塊,考慮八爪魚和火車頭兩種類型的采集)
  采集器會怎么做:一個網(wǎng)站模版不可能多于10個吧,每個模版弄一個規(guī)則就行了,不同模版采用不同采集規(guī)則。如果多于10個模版了,既然目標(biāo)網(wǎng)站都那么費勁的更換模版,成全他,撤。
10、采用動態(tài)不規(guī)則的html標(biāo)簽
  分析:這個比較變態(tài)??紤]到html標(biāo)簽內(nèi)含空格和不含空格效果是一樣的,所以< div >和< div >對于頁面顯示效果一樣,但是作為采集器的標(biāo)記就是兩個不同標(biāo)記了。如果次頁面的html標(biāo)簽內(nèi)空格數(shù)隨機(jī),那么
  采集規(guī)則就失效了。但是,這對搜索引擎爬蟲沒多大影響。
  適合網(wǎng)站:所有動態(tài)且不想遵守網(wǎng)頁設(shè)計規(guī)范的網(wǎng)站。
  采集器會怎么做:還是有對策的,現(xiàn)在html cleaner還是很多的,先清理了html標(biāo)簽,然后再寫采集規(guī)則;應(yīng)該用采集規(guī)則前先清理html標(biāo)簽,還是能夠拿到所需數(shù)據(jù)。

我們要從被鏡像發(fā)展到鏡像別人的網(wǎng)站,了解如何鏡像別人才會總結(jié)更好的鏡像解決辦法!

關(guān)鍵詞:

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉