微信里的網(wǎng)頁(yè)要如何爬取?
時(shí)間:2023-11-23 08:42:02 | 來(lái)源:網(wǎng)站運(yùn)營(yíng)
時(shí)間:2023-11-23 08:42:02 來(lái)源:網(wǎng)站運(yùn)營(yíng)
微信里的網(wǎng)頁(yè)要如何爬取?:準(zhǔn)備工作:先下載以下兩款軟件(微信Windows版、Fiddler)安裝:
1、登錄微信電腦版,打開(kāi)需要扒取的頁(yè)面.
3、左上角發(fā)現(xiàn)有四個(gè)菜單,首先點(diǎn)最后一個(gè)用默認(rèn)瀏覽器打開(kāi),這時(shí)候發(fā)現(xiàn)瀏覽器是打不開(kāi)這個(gè)頁(yè)面的,你會(huì)在瀏覽器看到如下圖的錯(cuò)誤提示信息.
這是因?yàn)槟愦蜷_(kāi)的瀏覽器是沒(méi)有登錄的,而這個(gè)頁(yè)面在微信里是已經(jīng)登錄了,這時(shí)候我們是需要獲取微信的登錄Cookie,如何獲取呢?下面帶大家認(rèn)識(shí)一個(gè)http抓包工具,就是上面安裝的Fiddler軟件了。
4、打開(kāi)Fiddler軟件,確保軟件左下角紅色框是錄制的狀態(tài),如下圖所示:
5、返回微信打開(kāi)的個(gè)人中心的頁(yè)面(圖2),在左上角的下拉菜單中點(diǎn)擊復(fù)制鏈接地址,我們就知道汽車(chē)站公眾號(hào)個(gè)人中心的真實(shí)地址,還是回到微信在左上角的下拉菜單中點(diǎn)擊刷新,點(diǎn)擊之后返回Fiddler軟件界面,這時(shí)候看到Fiddler界面已經(jīng)截獲了一些網(wǎng)址,找到剛才復(fù)制的網(wǎng)址,如下圖所示。
6、按上圖4個(gè)步驟操作就可以得到Cookie值了。
7、把cookie粘貼到扒站軟件的文本框,如下圖所示。