時(shí)間:2022-02-18 04:36:01 | 來源:網(wǎng)絡(luò)推廣
時(shí)間:2022-02-18 04:36:01 來源:網(wǎng)絡(luò)推廣
Spider又叫WebCrawler或者Robot,是一個(gè)沿著鏈接漫游Web 文檔集合的程序。它一般駐留在服務(wù)器上,通過給定的一些URL,利用HTTP等標(biāo)準(zhǔn)協(xié)議讀取相應(yīng)文檔,然后以文檔中包括的所有未訪問過的URL作為新的起 點(diǎn),繼續(xù)進(jìn)行漫游,直到?jīng)]有滿足條件的新URL為止。WebCrawler的主要功能是自動(dòng)從Internet上的各Web 站點(diǎn)抓取Web文檔并從該Web文檔中提取一些信息來描述該Web文檔,為搜索引擎站點(diǎn)的數(shù)據(jù)庫(kù)服務(wù)器追加和更新數(shù)據(jù)提供原始數(shù)據(jù),這些數(shù)據(jù)包括標(biāo)題、長(zhǎng) 度、文件建立時(shí)間、HTML文件中的各種鏈接數(shù)目等。關(guān)鍵詞:
客戶&案例
營(yíng)銷資訊
關(guān)于我們
客戶&案例
營(yíng)銷資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。