本節(jié)我們了解一下靜態(tài)網(wǎng)頁(yè)和動(dòng)態(tài)網(wǎng)頁(yè)的相關(guān)概念。如果您熟悉前端語(yǔ)言的話,那么您可以快速地了解本節(jié)知識(shí)。

當(dāng)我們?cè)诰帉?xiě)一個(gè)爬蟲(chóng)程序前,首先要明確待爬取的頁(yè)面是靜態(tài)的,還是動(dòng)態(tài)的,只有確定了頁(yè)面" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

15158846557 在線咨詢 在線咨詢
15158846557 在線咨詢
所在位置: 首頁(yè) > 營(yíng)銷資訊 > 網(wǎng)站運(yùn)營(yíng) > 靜態(tài)網(wǎng)頁(yè)和動(dòng)態(tài)網(wǎng)頁(yè)

靜態(tài)網(wǎng)頁(yè)和動(dòng)態(tài)網(wǎng)頁(yè)

時(shí)間:2023-09-17 00:36:01 | 來(lái)源:網(wǎng)站運(yùn)營(yíng)

時(shí)間:2023-09-17 00:36:01 來(lái)源:網(wǎng)站運(yùn)營(yíng)

靜態(tài)網(wǎng)頁(yè)和動(dòng)態(tài)網(wǎng)頁(yè):

本節(jié)我們了解一下靜態(tài)網(wǎng)頁(yè)和動(dòng)態(tài)網(wǎng)頁(yè)的相關(guān)概念。如果您熟悉前端語(yǔ)言的話,那么您可以快速地了解本節(jié)知識(shí)。

當(dāng)我們?cè)诰帉?xiě)一個(gè)爬蟲(chóng)程序前,首先要明確待爬取的頁(yè)面是靜態(tài)的,還是動(dòng)態(tài)的,只有確定了頁(yè)面類型,才方便后續(xù)對(duì)網(wǎng)頁(yè)進(jìn)行分析和程序編寫(xiě)。對(duì)于不同的網(wǎng)頁(yè)類型,編寫(xiě)爬蟲(chóng)程序時(shí)所使用的方法也不盡相同。

靜態(tài)網(wǎng)頁(yè)

靜態(tài)網(wǎng)頁(yè)是標(biāo)準(zhǔn)的 HTML 文件,通過(guò) GET 請(qǐng)求方法可以直接獲取,文件的擴(kuò)展名是.html、.htm等,網(wǎng)面中可以包含文本、圖像、聲音、FLASH 動(dòng)畫(huà)、客戶端腳本和其他插件程序等。靜態(tài)網(wǎng)頁(yè)是網(wǎng)站建設(shè)的基礎(chǔ),早期的網(wǎng)站一般都是由靜態(tài)網(wǎng)頁(yè)制作的。靜態(tài)并非靜止不動(dòng),它也包含一些動(dòng)畫(huà)效果,這一點(diǎn)不要誤解。

我們知道,當(dāng)網(wǎng)站信息量較大的時(shí),網(wǎng)頁(yè)的生成速度會(huì)降低,由于靜態(tài)網(wǎng)頁(yè)的內(nèi)容相對(duì)固定,且不需要連接后臺(tái)數(shù)據(jù)庫(kù),因此響應(yīng)速度非常快。但靜態(tài)網(wǎng)頁(yè)更新比較麻煩,每次更新都需要重新加載整個(gè)網(wǎng)頁(yè)。

靜態(tài)網(wǎng)頁(yè)的數(shù)據(jù)全部包含在 HTML 中,因此爬蟲(chóng)程序可以直接在 HTML 中提取數(shù)據(jù)。通過(guò)分析靜態(tài)網(wǎng)頁(yè)的 URL,并找到 URL 查詢參數(shù)的變化規(guī)律,就可以實(shí)現(xiàn)頁(yè)面抓取。與動(dòng)態(tài)網(wǎng)頁(yè)相比,并且靜態(tài)網(wǎng)頁(yè)對(duì)搜索引擎更加友好,有利于搜索引擎收錄。

動(dòng)態(tài)網(wǎng)頁(yè)

動(dòng)態(tài)網(wǎng)頁(yè)指的是采用了動(dòng)態(tài)網(wǎng)頁(yè)技術(shù)的頁(yè)面,比如 AJAX(是指一種創(chuàng)建交互式、快速動(dòng)態(tài)網(wǎng)頁(yè)應(yīng)用的網(wǎng)頁(yè)開(kāi)發(fā)技術(shù))、ASP(是一種創(chuàng)建動(dòng)態(tài)交互式網(wǎng)頁(yè)并建立強(qiáng)大的 web 應(yīng)用程序)、JSP(是 Java 語(yǔ)言創(chuàng)建動(dòng)態(tài)網(wǎng)頁(yè)的技術(shù)標(biāo)準(zhǔn)) 等技術(shù),它不需要重新加載整個(gè)頁(yè)面內(nèi)容,就可以實(shí)現(xiàn)網(wǎng)頁(yè)的局部更新。

動(dòng)態(tài)頁(yè)面使用“動(dòng)態(tài)頁(yè)面技術(shù)”與服務(wù)器進(jìn)行少量的數(shù)據(jù)交換,從而實(shí)現(xiàn)了網(wǎng)頁(yè)的異步加載。下面看一個(gè)具體的實(shí)例:打開(kāi)百度圖片(https://image.baidu.com/)并搜索 Python,當(dāng)滾動(dòng)鼠標(biāo)滑輪時(shí),網(wǎng)頁(yè)會(huì)從服務(wù)器數(shù)據(jù)庫(kù)自動(dòng)加載數(shù)據(jù)并渲染頁(yè)面,這是動(dòng)態(tài)網(wǎng)頁(yè)和靜態(tài)網(wǎng)頁(yè)最基本的區(qū)別。如下所示:







圖3:動(dòng)態(tài)網(wǎng)頁(yè)(點(diǎn)擊看高清圖)

動(dòng)態(tài)網(wǎng)頁(yè)中除了有 HTML 標(biāo)記語(yǔ)言外,還包含了一些特定功能的代碼。這些代碼使得瀏覽器和服務(wù)器可以交互,服務(wù)器端會(huì)根據(jù)客戶端的不同請(qǐng)求來(lái)生成網(wǎng)頁(yè),其中涉及到數(shù)據(jù)庫(kù)的連接、訪問(wèn)、查詢等一系列 IO 操作,所以其響應(yīng)速度略差于靜態(tài)網(wǎng)頁(yè)。

注意:一般網(wǎng)站通常會(huì)使用動(dòng)靜相結(jié)合的方式,使其達(dá)到一種平衡的狀態(tài)??蓞⒖肌毒W(wǎng)站搭建動(dòng)靜結(jié)合》進(jìn)行簡(jiǎn)單了解。
當(dāng)然動(dòng)態(tài)網(wǎng)頁(yè)也可以是純文字的,頁(yè)面中也可以包含各種動(dòng)畫(huà)效果,這些都只是網(wǎng)頁(yè)內(nèi)容的表現(xiàn)形式,其實(shí)無(wú)論網(wǎng)頁(yè)是否具有動(dòng)態(tài)效果,只要采用了動(dòng)態(tài)網(wǎng)站技術(shù),那這個(gè)網(wǎng)頁(yè)就稱為動(dòng)態(tài)網(wǎng)頁(yè)。

抓取動(dòng)態(tài)網(wǎng)頁(yè)的過(guò)程較為復(fù)雜,需要通過(guò)動(dòng)態(tài)抓包來(lái)獲取客戶端與服務(wù)器交互的 JSON 數(shù)據(jù)。抓包時(shí),可以使用谷歌瀏覽器開(kāi)發(fā)者模式(快捷鍵:F12)Network選項(xiàng),然后點(diǎn)擊 XHR,找到獲取 JSON 數(shù)據(jù)的 URL,如下所示:







圖4:Chrome抓取數(shù)據(jù)包(點(diǎn)擊看高清圖)

或者您也可以使用專業(yè)的抓包工具 Fiddler(點(diǎn)擊訪問(wèn))。關(guān)于動(dòng)態(tài)網(wǎng)頁(yè)的數(shù)據(jù)抓取,在后續(xù)內(nèi)容會(huì)做詳細(xì)講解。

關(guān)鍵詞:動(dòng)態(tài),靜態(tài)

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉