百度搜索結(jié)果標(biāo)題長度的深入研究解析
時間:2022-05-28 16:12:01 | 來源:網(wǎng)絡(luò)營銷
時間:2022-05-28 16:12:01 來源:網(wǎng)絡(luò)營銷
一般來說,網(wǎng)站標(biāo)題中的關(guān)鍵字越靠前的其權(quán)重越高,也越容易提升其排名能力。
搜索引擎會優(yōu)先將關(guān)鍵字更明確、匹配程度更高的頁面標(biāo)題排在前面。用百度推廣中的術(shù)語來說,匹配的權(quán)重順序為:精確匹配>短語匹配>廣泛匹配。
在網(wǎng)站標(biāo)題中,最為重要的關(guān)鍵字一定要分割清楚,以便讓百度進行到精確匹配,提高關(guān)鍵字的排名能力,而次要關(guān)鍵可以加入到短語匹配的行列中,并借助外鏈增強其排名能力。
在百度搜索結(jié)果頁中,標(biāo)題的最大顯示長度為30個漢字,標(biāo)題一旦超過長度會被截斷,超出部分將以省略號省去,所以一方面為了最大程度的突出關(guān)鍵字,另一方面保證良好的用戶體驗,對此,我們也對百度搜索結(jié)果標(biāo)題長度做了深入研究,在此我就借助億企邦的平臺跟大家分享一下:
一、標(biāo)題長度 一般來說,網(wǎng)頁標(biāo)題最好是7個漢字以上,不要超過30個漢字,對于搜索引擎來說,標(biāo)題中越靠前的內(nèi)容越重要,靠后的內(nèi)容比較次要,所以要把最重要的關(guān)鍵字,盡量放在前面位置,用一句簡短的話來概括網(wǎng)頁內(nèi)容,不要用列舉的形式,一個詞一個詞的隔開(具體可查看億企邦《如何利用SEO技術(shù)設(shè)置文章網(wǎng)頁標(biāo)題》的相關(guān)介紹)。
1、PC端 目前常見的搜索引擎百度和谷歌,PC端顯示的標(biāo)題一般是60個字符,也就是30個漢字,如果你的網(wǎng)頁標(biāo)題超過30個字,那后面的就會截斷,用省略號“…”代替。
(1)、百度標(biāo)題長度30個漢字的猜測 在2014年6月,曾出過4道SEO相關(guān)面試題,如何從實際工作中來查看一個人的SEO能力,回答過第3題的2個人都選擇了錯誤的答案B,原題如下:
百度標(biāo)題長度通常限制在64個字節(jié)以內(nèi),請問標(biāo)題長度小等于多少個漢字(一個漢字 = 2 字節(jié))能完整顯示標(biāo)題,末尾不會以省略符號 "…"(占 3 字節(jié))結(jié)束?
A、29 個;
B、30 個;
C、31 個;
D、32 個;
在登錄百度帳號狀態(tài)下,訪問百度數(shù)據(jù)開放平臺添加pc端新資源,可以看到提示:(為)方便您管理資源,請盡量填寫有意義的中文標(biāo)題,不超過30個(漢)字。
不超過30個漢字是迄今為止SEO行業(yè)主流的觀點,亦是2位回答者不約而同都選答案B的原因。
但過了3個月找到正確答案卻是C(31個漢字),更確切點是31.5個漢字。
2014年10月在百度站長平臺看到一篇文章,建議標(biāo)題字?jǐn)?shù)控制在65個字節(jié)內(nèi),對于搜索引擎來說,標(biāo)題過長意味著“超標(biāo)”,只會保留前65個字節(jié)的內(nèi)容。
對百度站長平臺提到的保留前65個字節(jié),大概是在封包里寫好的標(biāo)題結(jié)束的終止指令,所以HTML代碼中能看不出來,這樣算來63字節(jié)上限就合情合理了。
65字節(jié)來源之一是微軟開發(fā)者網(wǎng)絡(luò) WEB1047 - <title> 標(biāo)記內(nèi)容太長
<title> 標(biāo)記是網(wǎng)站開發(fā)人員控制的最重要標(biāo)記,該標(biāo)記可能會影響相關(guān)性和網(wǎng)站在搜索引擎結(jié)果中的排名。
搜索引擎只會分析 <title> 標(biāo)記的前 65 個字符(不包括空格)。在確定網(wǎng)頁相關(guān)性時,搜索引擎將不會考慮前 65 個字符后面的任何關(guān)鍵字。
出現(xiàn)在 <title> 標(biāo)記內(nèi)容中靠前位置的詞條在搜索引擎結(jié)果頁中更為顯眼,從而可提高您的網(wǎng)頁的點擊量。
COMSE新人培養(yǎng)練習(xí)題(2013新版) 提到:
廣告庫文件格式(共 9 列,以 tab 分隔):winfoid term bid q title desc1 desc2 targeturl showurl 其中 winfoid 為 uint64_t,term 長度 < 16 byte,0 <= bid <= 1000,0 <= q <= 1000000,title 長度 < 64 byte,desc1/desc2 長度 < 128byte,targeturl 長度 < 256 byte,showurl 長度 < 64byte
所以,最長65個標(biāo)簽(包括空格)。
標(biāo)題標(biāo)簽中65個字符之后的內(nèi)容可能被搜索引擎給予比較低的權(quán)重,至少在搜索結(jié)果頁面中顯示的標(biāo)題標(biāo)簽在第65個字符處就截斷了,不過需要仔細觀察這個數(shù)字,Google現(xiàn)在有時候支持到70個字符。
(2)、為何不是64字節(jié)? 下面闡述百度網(wǎng)頁搜索結(jié)果標(biāo)題字節(jié)截斷上限為何不是 64 字節(jié)或 30 個漢字。
標(biāo)題字節(jié)截斷上限理論上是64字節(jié),讓我們來抽樣檢驗下是否符合期望值。
案例1:
老A演講實錄 - 不可錯過的淘寶運營策略 - 看世界 鬼腳七自媒體第四季 64 字節(jié) //網(wǎng)頁
老A演講實錄 - 不可錯過的淘寶運營策略 - 看世界 鬼腳七自媒體第... 63 字節(jié) //serp
誰能百里挑一張戴維牽手成功_誰能百里挑一張戴維 - 百度搜索結(jié)果參數(shù) 64 字節(jié) //網(wǎng)頁
誰能百里挑一張戴維牽手成功_誰能百里挑一張戴維 - 百度搜索結(jié)果... 63 字節(jié) //serp
聰明的一休之反斗公主下載_聰明的一休之反斗公主 - 百度搜索結(jié)果參數(shù) 64 字節(jié) //網(wǎng)頁
聰明的一休之反斗公主下載_聰明的一休之反斗公主 - 百度搜索結(jié)果... 63 字節(jié) //serp
但是我不能忍不能忍是什么歌_但是我不能忍不能忍 - 百度搜索結(jié)果參數(shù) 64 字節(jié) //網(wǎng)頁
但是我不能忍不能忍是什么歌_但是我不能忍不能忍 - 百度搜索結(jié)果... 63 字節(jié) //serp
案例2:
123456789012345678901234567890123456789012345678901234567890123
能完整顯示 63 字節(jié) //serp
1234567890123456789012345678901234567890123456789012345678901...
省略符號 "…" 在第 62 個數(shù)字前截斷,(61+3) 字節(jié) //serp
隨機抽取的4個64字節(jié)標(biāo)題都出現(xiàn)省略符號 "…",63 字節(jié)更符合實際。
超過63字節(jié)百度通過分詞技術(shù)減少到相應(yīng)字節(jié)數(shù),范圍在 ([58,61]+3) 字節(jié)內(nèi)。
可能百度先用分詞技術(shù),分成多個單詞放在數(shù)組里,并行計算每個詞的字節(jié),這樣改·字?jǐn)?shù)統(tǒng)計函數(shù)性能相對一次性計算所有文字長度快得多。事后將各數(shù)組合起來的長度,再加上其他規(guī)則,小于64字節(jié)的部分作為展現(xiàn)標(biāo)題。
即:如果標(biāo)題長度是32個漢字,會減少1-3個漢字用省略符號"…"取代。
英文是山寨谷歌的截斷法,減少最后1個單詞,按標(biāo)題最后1個單詞長度決定,通常會比中文減少更多字節(jié)。
中西文符號混雜情況,減少字節(jié)范圍位于上述兩者間。
與標(biāo)題長度1-64字節(jié)范圍的常識不同,從1數(shù)到10都知道是10個,而4-13會錯認(rèn)為只有9個,據(jù)減法,(4 - 1) = (13 - 10),距離相等,亦是10個。
百度搜索開放平臺現(xiàn)有展示模板的xml格式樣例及規(guī)范的一條注釋給出了更為精確的字節(jié)數(shù)。
資源名稱,即展示在百度搜索結(jié)果頁中的標(biāo)題,長度限制為4-63字節(jié)。
觸發(fā)截斷上限63字節(jié),0也算1字節(jié),0-63亦有64個字節(jié)。
至于為何0也算一個字節(jié),因為觸發(fā)標(biāo)題字節(jié)數(shù)下限是小于3字節(jié),有些網(wǎng)頁?標(biāo)題標(biāo)簽(title tag)或標(biāo)題容器內(nèi)為空等,這幾種可能被百度默認(rèn)為0字節(jié)。
將個人網(wǎng)站首頁標(biāo)題改為2字節(jié)的we,沒有展現(xiàn)完整標(biāo)題亦無截斷,而是觸發(fā)了F2 = xxxxxx68網(wǎng)址的較低優(yōu)先級標(biāo)題策略。
wei 3 字節(jié) //serp
再改為3字節(jié)的wei,展現(xiàn)完整標(biāo)題,標(biāo)題恢復(fù)為F2 = xxxxxx6B網(wǎng)頁標(biāo)題。
msdn 的內(nèi)容不在搜索引擎預(yù)期要查找的位置提及:
如果 <title> 標(biāo)記包含少于五個字符,則搜索引擎可能會認(rèn)為其比較長標(biāo)題的相關(guān)性低。
如果 <title> 標(biāo)記不包含文本,則搜索引擎可能會認(rèn)為其根本沒有相關(guān)性。
另外,還有超過63字節(jié)的特殊案例:
百度高級搜索指令filetype: 可以檢索pdf, xls, ppt, doc, txt, wps, vsd, rtf, lrc, docx, pptx 等非網(wǎng)頁格式文件,有前綴標(biāo)題提示,不計入標(biāo)題長度(更多高級搜索指令,可查看億企邦《詳解搜索引擎的高級搜索語法指令》的相關(guān)介紹)。
【LRC】2014 CCTV “Star of Outlook” English Talent Competition 2014... //serp
docx 格式不被計算入搜索結(jié)果標(biāo)題長度內(nèi),兼有早期模版bug,搜索結(jié)果標(biāo)題實際上限是(7+61+3) 字節(jié)。
分析 bug 可能原因:
案例:
【LRC】如何使用css讓div居中對齊_百度文庫 【網(wǎng)頁搜索】本地搜索模塊
如何使用css讓div居中對齊_百度文庫 【網(wǎng)頁搜索】結(jié)果頁模版
百度本地搜索結(jié)果中出現(xiàn)【LRC】前綴,標(biāo)準(zhǔn)結(jié)果頁卻顯示W(wǎng)ord圖標(biāo),可能是早期模版沒有被PK掉所致。
(3)、百度數(shù)據(jù)開放平臺標(biāo)題長度限制和截斷條件注釋 《百度搜索開放平臺現(xiàn)有展示模板的xml格式樣例及規(guī)范》里另一條注釋:
資源所在頁面的鏈接地址,用于顯示在搜索結(jié)果的下方。不需要有 "http://" 的部分;Showurl 的長度限制為 2-42 字節(jié),如果超過 42 字節(jié),請截斷,并增加省略符號 "…",并保證截斷后的 showurl 加上省略符號總長度不超過 42 字節(jié)。
百度沒有直接提及網(wǎng)頁搜索結(jié)果展現(xiàn)標(biāo)題截斷字節(jié)數(shù)的上下限,所以我將《樣例及規(guī)范》的兩處注釋結(jié)合如下:
使用主流的中文環(huán)境操作系統(tǒng),瀏覽器等(字符編碼為 UTF-8, GB2312, BIG5 等),展示在百度中文搜索結(jié)果頁(字符編碼為 UTF-8, GB2312, BIG5 等)的網(wǎng)頁型標(biāo)題,長度限制為 3-63 字節(jié)(2 byte < title 長度 < 64 byte),如果 F 參數(shù)所指的標(biāo)題策略是 F2 = xxxxxx6B,短于 3 字節(jié)或超過 63 字節(jié)的非百度產(chǎn)品的普通結(jié)果(AS)會自動截斷,并增加省略符號 "…",截斷后加上省略符號的 title 長度限制為 3-64 字節(jié)。
百度設(shè)置一個不符合現(xiàn)實常見的標(biāo)題長度,可能是技術(shù)導(dǎo)向公司單純地想不到標(biāo)題長度亦是用戶體驗一部分,只是從計算機本身二進制的規(guī)則角度考慮,最長 64 字節(jié),抓取過來標(biāo)題長度超出 63 的多了去了,不顯示浪費資源。機械的把 8 的平方作為標(biāo)題長度。一直到了智能手機上,百度算是改變了愚昧做法,把字節(jié)數(shù)改成 3 - 52 字節(jié)。
(4)、截斷與分詞技術(shù) | 超出標(biāo)題字節(jié)上限的失控 關(guān)于分詞技術(shù),我曾在億企邦《百度中文分詞技術(shù)是什么》一文中,跟大家做過詳細的介紹了,一般來說,分詞是在截斷前執(zhí)行,案例:
林依晨宣布訂婚(圖)_網(wǎng)易新聞中心 //serp
百度搜索“林依晨訂婚”,“林依晨和訂婚”是分開飄紅的,可以推測百度事先已經(jīng)分過詞,飄紅后再計算分開的每個詞匯字?jǐn)?shù)是否超出了64字節(jié)。
案例:
小學(xué)作文_小學(xué)作文大全_小學(xué)作文題目_素材_百度文庫作文庫_百度文庫 //網(wǎng)頁
網(wǎng)上沒有找到百度網(wǎng)頁搜索分詞的源代碼,用百度音樂前端的 Chinese Segment (基礎(chǔ)語料分詞示例)勉強代替。
分詞結(jié)果:
小學(xué) 作文 _ 小學(xué) 作文 大全 _ 小學(xué) 作文 題目 _ 素材 _ 百度 文庫 作 文庫 _ 百度 文庫
小學(xué)作文_小學(xué)作文大全_小學(xué)作文題目_素材_百度文庫作..._百度文庫 //serp
分詞后的截斷并非機械地按照超過63字節(jié)上限加省略符號,而是計算到第50個字節(jié)作,雖然后面還有內(nèi)容,但省略符號占3字節(jié),_百度文庫占9字節(jié),若再加一個漢字,(50+3+9+2) = 64 就超出63字節(jié)上限,便去掉文庫,在第50個字節(jié)作這兒截斷。
//拼接title
$data['offsetInfo']['title'] = "/2".$queryInfo['wordNoSyntax']."/3_百度文庫";
百度文庫的標(biāo)題長度,末尾的“_百度文庫”是占用9字節(jié)的標(biāo)題,所以文庫的標(biāo)題長度只要超過54字節(jié)就會出現(xiàn)省略號...。
百度搜索結(jié)果展現(xiàn)的最短標(biāo)題測試:
搜索發(fā)現(xiàn)由于百度對韓文|朝鮮語支持有限,出現(xiàn)bug,加上展現(xiàn)的標(biāo)題會自動過濾掉百度數(shù)據(jù)庫里標(biāo)題的空格,所以在4字節(jié)的情況下,卻只展現(xiàn)1個逗號,不知還有無不能點擊的空標(biāo)題,否則1字節(jié)已經(jīng)是百度可見最短標(biāo)題了。
(5)、標(biāo)題前出現(xiàn)圖標(biāo)或提示詞 關(guān)于網(wǎng)站圖標(biāo)的問題,億企邦以下面這個案例跟大家分析一下:
不受分詞技術(shù)影響的截斷測試:
機械聯(lián)盟網(wǎng)-品牌導(dǎo)購-設(shè)備租賃-二手設(shè)備-配件-招聘求職-用機養(yǎng)... //serp
機械聯(lián)盟網(wǎng)-品牌導(dǎo)購-設(shè)備租賃-二手設(shè)備-配件-招聘求職-用機養(yǎng)機-... //serp
3字節(jié)的 機- 被 favorites icon(網(wǎng)站圖標(biāo)) 擠掉,而末尾的省略符號 "…" 不變??赡茴愃?CSS 里 text-overflow: ellipsis,使末尾處變成省略號。
從上面看到很難事先控制超出63字節(jié)百度會在哪里截斷標(biāo)題,因而建議pc端普通標(biāo)題長度不超過63字節(jié),展現(xiàn)網(wǎng)站圖標(biāo)的標(biāo)題長度不超過(64-3)=61字節(jié)。
(6)、標(biāo)題后綴為百度自家產(chǎn)品品牌 案例:
營銷人員如何通過在線營銷轉(zhuǎn)變他們的業(yè)務(wù)Forrester.How..._百度文庫 //serp
后綴“_百度文庫”占去9字節(jié),可控標(biāo)題長度為63 - 9 = 54字節(jié)。
常見百度產(chǎn)品實際可控標(biāo)題字節(jié)上限(長期更新)
_百度百科 54 字節(jié)
_百度知道 54 字節(jié)
_百度貼吧 54 字節(jié)
_百度文庫 54 字節(jié)
_百度經(jīng)驗 54 字節(jié)
(7)、特殊F參數(shù)影響標(biāo)題長度調(diào)查 百度F2參數(shù)的第7,8位含義是搜索結(jié)果前后標(biāo)題策略,與普通的F2 = xxxxxx6B網(wǎng)頁標(biāo)題是否會有所不同,限于篇幅,只用百度搜索結(jié)果7種標(biāo)題樣式較長的一種F2 = xxxxxxEB鏈接錨文本(-)網(wǎng)頁標(biāo)題測試。
億企邦 - 百度權(quán)威數(shù)據(jù)報告指出低質(zhì)站泛濫,優(yōu)質(zhì)站將受益 - 網(wǎng)絡(luò)...
(6+3+50+3) 字節(jié) //serp
開頭的億企邦是許多網(wǎng)頁上加了以作者名字的鏈接錨文本,( - )是百度連接前后標(biāo)題策略自動添加的,之后顯示網(wǎng)頁標(biāo)題中的前50個字節(jié),最后標(biāo)題超出63字節(jié),以3字節(jié)省略號截斷。
結(jié)論是截斷策略是在F參數(shù)所指的標(biāo)題策略后執(zhí)行,發(fā)現(xiàn)搜索結(jié)果標(biāo)題不同于原先設(shè)想后,可以查看F2第7,8位,再做相應(yīng)調(diào)整。
譬如搜索個人網(wǎng)站域名,百度賜予的奇葩標(biāo)題,您可能想看我的,查看HTML源碼 F2 = xxxxxx6E 權(quán)值標(biāo)簽,而真實H1標(biāo)簽是:<h1>您可能想看我的<a href="http://www.mahaixiang.cn">億企邦</a>。</h1>
H1標(biāo)簽嵌套錨文本標(biāo)簽內(nèi)容及結(jié)尾的句號被百度過濾掉,執(zhí)行標(biāo)題策略,僅剩下曖昧的“您可能想看我的”:<h1><a href="http://www.mahaixiang.cn/">您可能想看我的億企邦</a>。</h1>
事后重構(gòu)H1標(biāo)簽嵌套結(jié)構(gòu),完整展現(xiàn)H1容器內(nèi)的文本。
(8)、分析百度標(biāo)題規(guī)則優(yōu)先級 關(guān)于百度標(biāo)題各個規(guī)則優(yōu)先級的梳理,以PC端為例:
①、服務(wù)器
a、百度蜘蛛判斷網(wǎng)頁編碼字符集。
b、抓取網(wǎng)頁標(biāo)題,部分繁簡轉(zhuǎn)換。
c、部分全角標(biāo)點符號轉(zhuǎn)換半角標(biāo)點符號。
d、阿拉丁結(jié)果(sp)、最新相關(guān)信息(中間頁)等優(yōu)先級高于過濾重復(fù)標(biāo)點符號。
e、把連續(xù)重復(fù)超過3次的部分標(biāo)點符號替換為3次。
②、客戶端
a、選擇何種編碼的百度搜索(UTF-8, GB2312, Big5, etc.)
b、搜索框輸入查詢字符串
c、“百度一下”替換不同編碼,并將部分全角符號替換為半角符號及安全過濾。
d、HTML 實體轉(zhuǎn)換
e、是否開啟不糾錯策略 f=12&nojc=0(開),f=13&nojc=1(閉)
③、服務(wù)器
a、編碼轉(zhuǎn)換
b、F2-78 參數(shù)所指策略
c、標(biāo)題前后綴
d、分詞技術(shù)
e、匹配飄紅
f、計算可展現(xiàn)字?jǐn)?shù)
g、各種截斷
④、客戶端
a、展現(xiàn)在用戶眼前的可見標(biāo)題(3-64字節(jié))
b、點擊標(biāo)題
⑤、服務(wù)器
用戶點擊過的標(biāo)題以4-65字節(jié)長度存入數(shù)據(jù)庫。
2、平板電腦 百度Pad版研究不多,新買了一塊iPad mini 2測試Pad版搜索結(jié)果標(biāo)題長度,大致和PC端規(guī)則一致。
3、智能手機 關(guān)于百度移動搜索標(biāo)題字?jǐn)?shù)上限,我們先看一個案例:
SEO億企邦-SEO教程,SEO方法,SEO技術(shù),網(wǎng)站優(yōu)化,網(wǎng)絡(luò)推廣! 52 字節(jié) //serp
億企邦SEO博客-最權(quán)威的SEO技術(shù)研究和網(wǎng)站優(yōu)化學(xué)習(xí)平臺.. (51+2) 字節(jié) //serp
11人足球網(wǎng) - 天下足球|PES2015|FM2015|FIFA15|足球.... (48+4) 字節(jié) //serp
目前智能手機的兩大主流操作系統(tǒng):安卓和iOS,先拿三星手機瀏覽器Android 4.2測試了下,將標(biāo)題復(fù)制 + 粘貼到字?jǐn)?shù)統(tǒng)計性能比較工具里計算,不觸發(fā)截斷上限是52字節(jié)。
又上京東分24期買了個iPhone4s Safari瀏覽器iOS 7.1.2測試,PC端訪問m.baidu.com,有前綴當(dāng)前頁排名 + 后綴2點省略號,到了iPhone上,無前綴當(dāng)前頁排名,但后綴可能有4點省略號,長度范圍在 (50+2+[2,3]) 個字節(jié),其它規(guī)則與PC, iPad端類似。
123456789012345678901234567890123456789012345678901234567890123_斗破蒼穹吧_百度貼吧 83 字節(jié) //網(wǎng)頁
搜索結(jié)果只顯示 3 字節(jié)省略符號 ...。
展現(xiàn)下限亦是3個省略號,最少標(biāo)題是3字節(jié),與PC, Pad版相同,不再贅述,建議移動端標(biāo)題范圍是3-52字節(jié)。
二、標(biāo)題長度的其它發(fā)現(xiàn) 在對標(biāo)題長度做了常規(guī)測試以后,除了以上的結(jié)果,我們還有以下幾點新的發(fā)現(xiàn),在此也在億企邦上跟大家分享一下:
1、PC端 首先,我們先來看一下PC端的新發(fā)現(xiàn),具體來說,有以下幾點:
(1)、省略符號不止出現(xiàn)于標(biāo)題末尾 案例:
...123456789012345678901234567890123456789012345678901234567890 //serp
第1種情況是省略符號 "…" 作為前綴。
...batang開頭的字庫文件,這個文件大小為15.5 MB 和 C:..._百度知道 //serp
第2,3種情況是省略符號作為前后綴出現(xiàn),并且末尾還有“_百度知道”,實際標(biāo)題只顯示了48字節(jié)。
(2)、百度按照標(biāo)題寬度折行 .t{font-weight:normal;font-size:medium;margin-bottom:1px}
標(biāo)題字體大小是默認(rèn)的中等,而常見的16px, 540 / 16 = 33.75,一行最多展示33個漢字,大于64字節(jié)。
百度是按標(biāo)題總的寬度截斷,而非字?jǐn)?shù),只需查看CSS便可證明。
#content_left {
width:540px;
padding-left:138px;
padding-top:5px;
}
搜索結(jié)果寬度
#rs table {
width:540px;
}
有趣的是相關(guān)搜索寬度和搜索結(jié)果寬度保持一致。
案例:
是否折行的測量標(biāo)準(zhǔn)按您的瀏覽器字體字號而不同。
當(dāng)chrome瀏覽器配置是一個阿拉伯?dāng)?shù)字寬度為9 px,SERP顯示是540px,只能放60個9px的寬度,不可避免出現(xiàn)兩行標(biāo)題。
(3)、百度搜索結(jié)果標(biāo)題HTML實體轉(zhuǎn)換現(xiàn)象 雖然可見標(biāo)題長度是(61+3)字節(jié),但HTML實體轉(zhuǎn)換為字符前,源代碼的搜索結(jié)果標(biāo)題長度可以不止(61+3)字節(jié)。
案例:
Don't use ABCDEFGHIJKLMNOPQRSTUVWXYZ `1234567890-=~!@#$%^&*()... //serp
您所看到的實質(zhì)是瀏覽器經(jīng)過一次HTML實體轉(zhuǎn)換的標(biāo)題,在瀏覽器中查看HTML源代碼
Don't use ABCDEFGHIJKLMNOPQRSTUVWXYZ `1234567890-=~!@#$%^&*()...
(4)、PC端訪問手機端百度的標(biāo)題長度上限 億企邦SEO博客-最權(quán)威的SEO技術(shù)研究和網(wǎng)站優(yōu)化學(xué)習(xí)博客 53 字節(jié) //網(wǎng)頁
億企邦SEO博客-最權(quán)威的SEO技術(shù)研究和網(wǎng)站優(yōu)化學(xué)習(xí)博客 52 字節(jié) //網(wǎng)頁
億企邦SEO博客標(biāo)題比較特殊,標(biāo)題末尾有空格,PC端是2個空格,展現(xiàn)時候沒有空格,HTML源碼則保留1個空格,而移動端是1個空格,被算作搜索結(jié)果標(biāo)題的一部分。
另外,PC端訪問m.baidu.com如下:
10 億企邦SEO博客-最權(quán)威的SEO技術(shù)研究和網(wǎng)站優(yōu)化學(xué)習(xí)博客.. (3+51+2) 字節(jié) //serp
1 億企邦SEO博客-最權(quán)威的SEO技術(shù)研究和網(wǎng)站優(yōu)化學(xué)習(xí)博客.. (2+51+2) 字節(jié) //serp
位置前綴似乎不被計入標(biāo)題長度,10 和 1 是一樣的。如果去掉位置前綴,但保留空格,標(biāo)題長度是 53 字節(jié),網(wǎng)頁標(biāo)題末尾的 1 個空格反被 2 點省略號替換。不過智能手機上沒有截斷。
SEO億企邦-SEO教程,SEO方法,SEO技術(shù),網(wǎng)站優(yōu)化,網(wǎng)絡(luò)推廣!53 字節(jié) //網(wǎng)頁
SEO億企邦-SEO教程,SEO方法,SEO技術(shù),網(wǎng)站優(yōu)化,網(wǎng)絡(luò)推廣! 52 字節(jié) //網(wǎng)頁
PC端訪問m.baidu.com,搜索“SEO億企邦-SEO教程,SEO方法,SEO技術(shù),網(wǎng)站優(yōu)化,網(wǎng)絡(luò)推廣!”,顯示完整標(biāo)題,而搜索“SEO億企邦-SEO教程,SEO方法,SEO技術(shù),網(wǎng)站優(yōu)化,網(wǎng)絡(luò)推廣”,最后一個感嘆號被2點省略符號替換。目標(biāo)網(wǎng)頁標(biāo)題最后是全角感嘆號(2 字節(jié)),而百度展現(xiàn)的是半角感嘆號(1 字節(jié)),但智能手機端無此現(xiàn)象。
PC端訪問m.baidu.com標(biāo)題截斷算法不同于真正智能手機訪問m.baidu.com的算法。若要在PC端訪問m.baidu.com都不出現(xiàn)省略符號,建議在使用1個感嘆號、逗號等全角符號的情況下,字節(jié)小等于52字節(jié)。
最后分析下網(wǎng)頁標(biāo)題中的全角標(biāo)點符號具體分為5種情況。
①、轉(zhuǎn)換為半角(可能包含于繁簡轉(zhuǎn)換詞庫),過濾重復(fù)。
②、不轉(zhuǎn)換為半角,過濾重復(fù)。
③、不轉(zhuǎn)換為半角,不過濾重復(fù),與半角標(biāo)點符號是同義詞。
④、pc端訪問m.baidu.com,搜索詞包含可轉(zhuǎn)換半角標(biāo)點符號,轉(zhuǎn)換為半角,過濾重復(fù)。
⑤、pc端訪問m.baidu.com,搜索詞不包含可轉(zhuǎn)換半角標(biāo)點符號,不轉(zhuǎn)換為半角,過濾重復(fù)
(5)、過濾反復(fù)出現(xiàn)的標(biāo)題符號 急急急急急急急,難難難難難****** HELP ME!!!!! -CSDN論壇-CSDN.SEO-... 68 字節(jié) //網(wǎng)頁
急急急急急急急,難難難難難*** HELP ME!!! -CSDN論壇-CSDN.SEO-... 62 字節(jié) //serp
百度將“******”和“!!!!!”分別過濾為“***”和“!!!”。
【圖】【【【【【【【【世嘉日常保養(yǎng)之材料選擇】】】】】】】】_世嘉論壇_汽車之家論壇 82 字節(jié) //網(wǎng)頁
【圖】【【【世嘉日常保養(yǎng)之材料選擇】】】_世嘉論壇_汽車之家論壇 62 字節(jié) //serp
連續(xù)并且重復(fù)3次以上的魚尾號“【”替換為“【【【”,而1個不連續(xù)的魚尾號“【”不受影響。
(6)、全角標(biāo)點符號轉(zhuǎn)換為半角 下面這些全角標(biāo)點符號在普通搜索結(jié)果(as)會被替換為半角,在百度搜索框內(nèi)輸入下列標(biāo)點符號即可看到替換現(xiàn)象。
| ==> | 豎線
, ==> , 逗號
; ==> ; 分號
: ==> : 冒號
? ==> ? 問號
! ==> ! 嘆號
- ==> - 連接號
( ==> ( 左圓括號
) ==> ) 右圓括號
{ ==> { 左花括號
} ==> } 右花括號
‘ ==> ' 左單彎引號
’ ==> ' 右單彎引號
2、智能手機 接下來,我們再來看一下智能手機端的新發(fā)現(xiàn),具體來說,有以下幾點:
(1)、標(biāo)題折行 百度移動搜索優(yōu)化指南2.0提到:
①、用戶在百度移動搜索中輸入query搜索到你的頁面時,title作為最重要的內(nèi)容展現(xiàn)在搜索結(jié)果中,主題明確、吸引眼球的title能夠使用戶第一時間理解你頁面的主題是否符合他的需求,進而更快捷地從眾多搜索結(jié)果中選擇你點擊你。
②、主題明確;
③、簡潔扼要,不羅列,盡量不超過17個中文漢字,否則會折行;
④、如果你的品牌知名度高,品牌詞最好能夠展現(xiàn)出來;
⑤、吸引眼球。
17個漢字似乎是iPhone4s豎屏只有320寬度展現(xiàn)的上限附近,原理與百度按照標(biāo)題寬度折行類似。
(2)、百度搜索結(jié)果標(biāo)題HTML實體轉(zhuǎn)換現(xiàn)象 %27 是用 URL 編碼形式表示的 ASCII 字符(十六進制格式),十六進制格式用于在瀏覽器和插件中顯示非標(biāo)準(zhǔn)的字母和字符。
【百度對關(guān)于url中帶#被收錄的問題反饋】里澄清道:
關(guān)于 url 中帶 # 被收錄,之前跟站長平臺的劉老師反饋過了,她讓百度工程師看了一下,特說明如下:
①、百度是根據(jù)轉(zhuǎn)碼后的 url 進行抓取的,之前大家發(fā)現(xiàn)搜索結(jié)果中出現(xiàn) # 的 url 的 case,一般是原 url 把 # 轉(zhuǎn)碼成了 %23(url 編碼轉(zhuǎn)碼的知識大家網(wǎng)上搜就知道了);如http://www.mahaixiang.cn/s/%23%E6%98%A5%E6%99%9A%E7%AB%A5%E6%98%9F%E9%82%93%E5%91%9C%E8%B4%BA%E6%82%A3%E7%99%BD%E8%A1%80%E7%97%85/ (這個 url 中的 s/%23 實際上是轉(zhuǎn)碼后的 s/#)
②、當(dāng)百度抓取轉(zhuǎn)碼后的 url,在搜索結(jié)果中又把 %23 解碼成 #,因此大家看到了搜索結(jié)果中出現(xiàn) # 的url。
三、中英文混合字?jǐn)?shù)統(tǒng)計代碼比較 “工欲善其事,必先利其器”,分析百度搜索結(jié)果標(biāo)題長度前,先要找到適宜的字?jǐn)?shù)統(tǒng)計工具,只是為了您的閱讀體驗,放到后面才介紹。
1、字節(jié) 字節(jié)(B)是 Byte 的中文,多用作存儲容量單位,亦可作為傳輸容量單位。英文維基百科解釋:
The byte /?ba?t/ is a unit of digital information in computing and telecommunications that most commonly consists of eight bits.【字節(jié)(讀音: 百特)是計算與通信中一種數(shù)字信息單位,1 字節(jié)代表 8 比特最常見?!?br>
1 字節(jié)(Byte) = 1 個英文字符(UTF-8 編碼) = 8 比特(bit) = 8 位二進制數(shù)字
2、百度計算中文長度驗證 漢語字符不同于英語字符,有3種常見長度,分別是2,3,4字節(jié)。
案例:
百度搜索結(jié)果URL參數(shù)解析疑問 - 搜外問答
<?php echo strlen('百度搜索結(jié)果URL參數(shù)解析疑問 - 搜外問答');?>
中文 16 個字符
非中文 6 字節(jié)
PHP strlen() 函數(shù)
華文 = (54 - 6) / 16 = 3 字節(jié)
改·字?jǐn)?shù)統(tǒng)計函數(shù)
華文 = (38 - 6) / 16 = 2 字節(jié)
接下來,我們在來看看百度計算朝鮮語長度驗證:
韓國延世大學(xué)醫(yī)院(?????? ??)-綜合醫(yī)院-韓國館-幫5買
韓國延世大學(xué)醫(yī)院(?????? ??)-綜合醫(yī)院-...
非韓文長度為 32 字節(jié),???????? 根據(jù)上述截斷規(guī)則,8 個韓文是 4 × 8 = 32 字節(jié)。
照著朝鮮語一路推下去,各種轉(zhuǎn)碼字節(jié)數(shù)很難用改·字?jǐn)?shù)統(tǒng)計函數(shù)兼容,實際上百度僅對幾種轉(zhuǎn)碼較為支持,將中文轉(zhuǎn)為小語種導(dǎo)致的亂碼字節(jié)數(shù)通常大于字?jǐn)?shù)統(tǒng)計函數(shù)64字節(jié)上限。下面亦提到用戶電腦上沒有安裝適合的字體也無法正常顯示和正常統(tǒng)計字節(jié)。
XML及其子集XHTML采用UTF-8作為標(biāo)準(zhǔn)字集,理論上我們可以在各種支持XML標(biāo)準(zhǔn)的瀏覽器上顯示任何地區(qū)文字的網(wǎng)頁,只要電腦本身安裝有合適的字體即可??梢岳?&#nnn; 的格式顯示特定的字符。nnn 代表該字符的十進制Unicode代碼。如果采用十六進制代碼,在編碼之前加上 x 字符即可,但部分舊版本的瀏覽器可能無法識別十六進制代碼。
中日韓統(tǒng)一表意文字:
但是另一方面,也有批評認(rèn)為 Unicode 收入大量錯訛字及寫法高度相似的同一字的不同字形本身就是不應(yīng)該的。電腦文本本身永遠不可能完全無損地記錄文獻,且文獻本身也會因傳抄制版等原因略有不同,如果把每個字的各種寫法全部編碼,不僅浪費空間,而且檢索困難,寫法稍有不同就無法檢出,以至于檢索字詞時必須反復(fù)檢索其不同寫法,造成重復(fù)勞動,對文獻研究反而是種妨礙,例如 Unicode 中將避諱的缺筆字也進行編碼,在檢索文獻時,這些字無法檢索出,反造成困擾。完全無損地研究、記錄文獻只能通過查看原本或照相復(fù)印版來完成,把無損保存轉(zhuǎn)嫁給編碼是錯誤的。
通過百度搜索的實際情況,結(jié)合維基百科對 Unicode 的簡介,很可能是采用一一對應(yīng)的方式簡單地把 UTF-8, GBK, BIG5, etc. 編碼的繁體字詞自動轉(zhuǎn)換為簡體字詞以提升檢索速度。
引用后來隨著我們不斷的執(zhí)著的去強調(diào)必須一秒內(nèi)出結(jié)果,必須99.9甚至99.99%,而省略了十進制或十六進制Unicode代碼,導(dǎo)致出現(xiàn)了百度搜索繁體字,卻很少在SERP看到繁體字的現(xiàn)象。反之無法或很難檢索到十進制或十六進制Unicode代碼的華文。非要完美在百度搜索結(jié)果展現(xiàn)繁體字,并被搜索到,通過編碼是不合情理的,更好的建議是在縮略圖里展示異體字。
百度查詢詞過濾機制(filter):檢索詞帶有 http:// 會被自動過濾掉,其他一些會造成惡意攻擊的字符亦會被過濾。
3、百度字?jǐn)?shù)統(tǒng)計函數(shù)與計算搜索結(jié)果標(biāo)題是否為同一函數(shù) 案例:
Рослинництво, тваринництвотавет...
百度改·字?jǐn)?shù)統(tǒng)計函數(shù) 63 字節(jié)
正則表達式 45 字節(jié)
PHP strlen + mb_strlen 函數(shù) 48.5 字節(jié)
截圖中上方標(biāo)題約為下方標(biāo)題長度一半,都觸發(fā)截斷,只有改·字?jǐn)?shù)統(tǒng)計函數(shù)的計算結(jié)果與前述標(biāo)題字節(jié)上限結(jié)論一致。
其他2種字?jǐn)?shù)統(tǒng)計能解釋標(biāo)題長度為何較短,但與觸發(fā)標(biāo)題字節(jié)上限誤差較大。
4、速度測試 ★★☆☆☆ 2 星 改·字?jǐn)?shù)統(tǒng)計函數(shù)采用 for 循環(huán)遍歷每個字符,速度較慢,適合少量計算。
★★★☆☆ 3 星 正則表達式處理較短單一字符集有優(yōu)勢。
★★★★★ 5 星 PHP strlen + mb_strlen 函數(shù)的優(yōu)點是無論多少字?jǐn)?shù),速度快捷穩(wěn)定。
5、兼容性測試 案例:
···(3 個間隔號)
改·字?jǐn)?shù)統(tǒng)計函數(shù) 6 字節(jié)
正則表達式 4 字節(jié)
PHP strlen + mb_strlen 函數(shù) 4.5 字節(jié)
вул?ца(白俄羅斯)
改·字?jǐn)?shù)統(tǒng)計函數(shù) 12 字節(jié)
正則表達式 8 字節(jié)
PHP strlen + mb_strlen 函數(shù) 9 字節(jié)
★★★★★ 5 星 論文主要用解釋百度標(biāo)題計數(shù),改·字?jǐn)?shù)統(tǒng)計函數(shù)兼容性自是最好。
★★★☆☆ 3 星 正則表達式缺陷在于小范圍的字符集內(nèi)有效,超出中英文字符等集合便失效了。
★★★☆☆ 3 星 當(dāng)然 PHP 自帶函數(shù)兼容性比正則表達式好不到哪里。
6、速度與兼容性最優(yōu)化方案 最少限制與應(yīng)用范圍考慮,百度搜索結(jié)果基本屬于中英文符號混雜64字節(jié)以內(nèi)標(biāo)題為主,使用百度的改·字?jǐn)?shù)統(tǒng)計函數(shù)最合適。
7、字?jǐn)?shù)統(tǒng)計工具結(jié)果比較 案例:拿烏克蘭語網(wǎng)站測試各個字?jǐn)?shù)統(tǒng)計工具算法差異:
Рослинництво, тваринництво та ветеринар?я, техн?чне забезпечення :: Аграрний сектор Укра?ни 動植物與獸醫(yī)學(xué),技術(shù)支持: 烏克蘭農(nóng)村經(jīng)濟
微軟 word2010 10 字?jǐn)?shù)
站長工具 66 字符
愛站網(wǎng) 91 字符
正則表達式 123 字節(jié)
PHP strlen + mb_strlen 函數(shù) 130 字節(jié)
搜外 163 字節(jié)
排版助手 166 字節(jié)
有一個網(wǎng)站 169 字節(jié)
百度改·字?jǐn)?shù)統(tǒng)計函數(shù) 169 字節(jié)
站長工具、愛站網(wǎng)、工具貓、xpcha、正則表達式、PHP函數(shù)等字?jǐn)?shù)統(tǒng)計結(jié)果與百度計算方式相去較遠。
搜外seo綜合診斷較為接近百度字?jǐn)?shù)統(tǒng)計結(jié)果,缺點是運行耗時長及受限于只能查詢指定域名,使用范圍不大。
排版助手作為網(wǎng)絡(luò)編輯常用的工具,很接近百度計算方式,很實用,不過仍有誤差。
有一個網(wǎng)站在線字?jǐn)?shù)統(tǒng)計與百度改·字?jǐn)?shù)統(tǒng)計函數(shù)計算結(jié)果一致,不過在間隔號、回車等符號計算方法與之不同。
8、PHP源碼 百度改·字?jǐn)?shù)統(tǒng)計函數(shù)
<?php
$str = stripslashes(htmlspecialchars_decode($words, ENT_QUOTES));
function smarty_modifier_wordcount($str,$encoding = 'UTF-8')
{
if(strtolower($encoding) == 'gbk') {
$encoding = 'gb18030';
}
if(!is_string($str)||$str === '') return false;
$mbLen = iconv_strlen($str, $encoding);
$subLen = 0;
for ($i = 0; $i < $mbLen; $i++) {
$mbChr = iconv_substr($str, $i, 1, $encoding);
if (1 == strlen($mbChr)) {
$subLen += 1;
} else {
$subLen += 2;
}
}
return $subLen;
}
echo smarty_modifier_wordcount($str);
?>
正則表達式:
<?php
$str = stripslashes(htmlspecialchars_decode($words, ENT_QUOTES));
$number += strlen(preg_replace('/[/x80-/xff]{1,3}/', ' ', $str, -1, $number));
echo $number;
?>
PHP strlen + mb_strlen 函數(shù)
<?php
$str = stripslashes(htmlspecialchars_decode($words, ENT_QUOTES));
echo ((strlen($str) + mb_strlen($str, 'UTF8')) / 2);
?>
附錄: 以下是本文中的一些名詞解釋:
htmlspecialchars_decode() 函數(shù)會把一些預(yù)定義的 HTML 實體轉(zhuǎn)換為字符。
? ENT_QUOTES - 解碼雙引號和單引號
預(yù)定義的字符有:
& 成為 & 和號
" 成為 " 雙引號
' 成為 ' 單引號
< 成為 < 小于
> 成為 > 大于
F2參數(shù)第7,8位 破解出的F2參數(shù)第7,8位,百度搜索結(jié)果標(biāo)題大致分為以下幾種形式:
F2 = xxxxxx68 網(wǎng)址 url
F2 = xx2xxx6A 標(biāo)語 slogan
F2 = xxxxxx6B 網(wǎng)頁標(biāo)題 title
F2 = xxxxxx6E 大字標(biāo)題 headline
F2 = xxxxxx6F 大字標(biāo)題 - 網(wǎng)頁標(biāo)題 headline - title
F2 = xxxxxxEA 錨文本 anchortext
F2 = xxxxxxEB 錨文本 - 網(wǎng)頁標(biāo)題 anchortext - title
filetype: 文件類型限定搜索: 搜索結(jié)果限制為特定的文件擴展名結(jié)尾的網(wǎng)頁
百度支持的擴展名和類型:
filetype:pdf PDF Adobe Acrobat
filetype:xls Microsoft Excel
filetype:ppt Microsoft Powerpoint
filetype:doc Microsoft Word
filetype:txt
filetype:wps
filetype:vsd
filetype:rtf // srcid = 1525 [10] ,全部是百度文庫
filetype:all // 其中的"all"表示搜索百度所有支持的文件類型 [11]
filetype:lrc // bug
filetype:docx // 得到的前綴是 【LRC】,這個 bug 最晚在 2012年01月出現(xiàn)
filetype:pptx // 得到的前綴是 【LRC】,這個 bug 最晚在 2012年01月出現(xiàn)
SERP search engine results page 搜索引擎返回查詢結(jié)果列表頁的英文縮寫。
省略符號 "…" 用于截斷表示搜索結(jié)果標(biāo)題超出限制的部分,pc 與 Pad 版省略符號是 3 字節(jié),智能手機移動端省略符號為 2-4 字節(jié)。
UTF-8 一種針對 Unicode 的可變長度字符編碼(定長碼),可以有 1-3 字節(jié)不同長度。
億企邦點評: 其實做百度的SEO優(yōu)化,很多時候百度本身的一些頁面是很值得我們效仿的,比如說百度百科、百度知道等他們不只是能從標(biāo)題結(jié)構(gòu)方面給予我們優(yōu)化指導(dǎo),更在網(wǎng)頁元素方面能讓我們學(xué)到很多SEO優(yōu)化技巧,值得SEOer們?nèi)ド钊胙芯俊?br>