記得一個(gè)月前嘗試用爬蟲爬取過(guò)自己在校圖書館的借書情況。當(dāng)時(shí)遇到最大的問(wèn)題就是校圖書館的網(wǎng)頁(yè)源代碼有部分信息不是用文字顯示,而是用下面這種形式顯示的。當(dāng)時(shí)嘗試了各種方法,最后請(qǐng)教了" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

15158846557 在線咨詢 在線咨詢
15158846557 在線咨詢
所在位置: 首頁(yè) > 營(yíng)銷資訊 > 網(wǎng)站運(yùn)營(yíng) > HTML實(shí)體編碼的編碼與解碼

HTML實(shí)體編碼的編碼與解碼

時(shí)間:2023-07-23 12:27:02 | 來(lái)源:網(wǎng)站運(yùn)營(yíng)

時(shí)間:2023-07-23 12:27:02 來(lái)源:網(wǎng)站運(yùn)營(yíng)

HTML實(shí)體編碼的編碼與解碼:

記得一個(gè)月前嘗試用爬蟲爬取過(guò)自己在校圖書館的借書情況。當(dāng)時(shí)遇到最大的問(wèn)題就是校圖書館的網(wǎng)頁(yè)源代碼有部分信息不是用文字顯示,而是用下面這種形式顯示的。當(dāng)時(shí)嘗試了各種方法,最后請(qǐng)教了一位大佬才解決問(wèn)題。

斐波那契数列
最近打算制作一個(gè)屬于自己的網(wǎng)站,所以也想用這種編碼來(lái)給自己的網(wǎng)頁(yè)源代碼做個(gè)簡(jiǎn)單的加密,讓別人沒(méi)有那么容易爬取網(wǎng)站的數(shù)據(jù)。(笑死,網(wǎng)站估計(jì)訪問(wèn)都沒(méi)人來(lái)訪問(wèn))

所以,就想了解一下如何在文字與這種實(shí)體編碼間轉(zhuǎn)換。結(jié)果搜到的方法卻異常的簡(jiǎn)單:

這種編碼就是“&#”+文字的ASCII碼+“;”

圖書館網(wǎng)的實(shí)體編碼好像是在ASCII碼的基礎(chǔ)上轉(zhuǎn)成了十六進(jìn)制,然后再把前面的0去掉了。

代碼實(shí)現(xiàn)不難。下面是Python:

編碼:

s="斐波那契數(shù)列"#編碼:def decode(input): ans="" for i in range(len(input)): st=str(hex(ord(input[i]))) ans+="&#"+st[1:len(st)]+";" return ansprint(decode(s))輸出結(jié)果看看:

這種編碼正不正確呢?只要到圖書館網(wǎng)的源代碼里ctrl+F搜一搜即可。

解碼就是把上面的步驟反著寫即可:

#解碼def encode(input): ans=input.split(';') result="" for i in ans: if len(i): st=int("0"+i[2:],16) result+=chr(st) return result當(dāng)然,也可以用以前的方法:

import htmlprint(html.unescape(decode(s)))效果一樣:




之后將實(shí)體編碼直接寫在網(wǎng)頁(yè)源代碼就行了。

效果如下:

注:關(guān)于我制作一個(gè)屬于自己的網(wǎng)站,我打算把它整成一個(gè)知識(shí)分享型的網(wǎng)站,收錄我在本站上寫過(guò)的一些比較滿意的文章的鏈接,方便大家學(xué)習(xí)。從網(wǎng)頁(yè)的布局到文章的整理以及注冊(cè)域名之類的都需要很多時(shí)間,預(yù)計(jì)最快也需要半年時(shí)間吧。不過(guò),好的東西也更需要耐心等待。

暫時(shí)用騰訊云的靜態(tài)網(wǎng)站托管上線了一個(gè)網(wǎng)站,做的很隨意。有需要的讀者可以點(diǎn)鏈接訪問(wèn)。



關(guān)鍵詞:編碼,解碼,實(shí)體

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉