所在位置:
首頁 >
營銷資訊 >
營銷百科 > 網(wǎng)站搜索引擎優(yōu)化技術(shù)分享7抓取優(yōu)先
網(wǎng)站搜索引擎優(yōu)化技術(shù)分享7抓取優(yōu)先
時間:2023-03-06 16:03:01 | 來源:營銷百科
時間:2023-03-06 16:03:01 來源:營銷百科
網(wǎng)站搜索引擎優(yōu)化技術(shù)分享7抓取優(yōu)先: 百度搜索引擎是通過蜘蛛抓取網(wǎng)站信息的,蜘蛛的抓取方式一般可以分為積累式抓取和增量式抓取兩種。積累式抓取是指從某個時間開始,通過遍歷的方式抓取系統(tǒng)所能允許存儲和處理的所有頁面,而增量式抓取是指在具有一定量規(guī)模的網(wǎng)頁集合的基礎(chǔ)上,采用更新數(shù)據(jù)的方式選取已經(jīng)在集合中的過時網(wǎng)頁進行抓取,以保證所抓取到的數(shù)據(jù)與真實網(wǎng)絡(luò)數(shù)據(jù)做夠接近。
n那么是搜索引擎的抓取優(yōu)先級呢?在信息抓取階段搜索引擎掌握的信息往往是局部的,因而為搜索引擎設(shè)計一個好的抓取優(yōu)先級策略并不是一件容易的事情,這里說的是一個深度抓取的優(yōu)先策略。深度優(yōu)先抓取它是以抓取到連接結(jié)構(gòu)關(guān)系中的所有內(nèi)容為主要目的的,具體實現(xiàn)方式是沿著樹形的深度遍歷樹的節(jié)點,盡可能深的搜索樹的分支,如果發(fā)現(xiàn)目標,則算法中止。
n深度優(yōu)先抓取過程中,抓取程序從起始頁開始,一個鏈接一個鏈接跟蹤下去,處理完這條線路最低端之后再轉(zhuǎn)入下一個起始頁,繼續(xù)跟蹤鏈接。由于深度優(yōu)先策略在面臨數(shù)據(jù)量爆炸性增長的萬維網(wǎng)環(huán)境時具有容易陷入抓取'黑洞'等缺陷,因此很少被現(xiàn)代搜索引擎的抓取子系統(tǒng)所采用。
[1]
關(guān)鍵詞:優(yōu)先,技術(shù),索引