百度搜索結(jié)果展示的基本原理
時間:2022-05-28 21:27:02 | 來源:網(wǎng)絡(luò)營銷
時間:2022-05-28 21:27:02 來源:網(wǎng)絡(luò)營銷
我們在百度或者其它搜索引擎上輸入一個關(guān)鍵詞,點擊查詢,搜索引擎會從先到后列出大量的結(jié)果,看到這些結(jié)果,我們常會有疑問:這些結(jié)果是怎么來的呢?排序的標(biāo)準(zhǔn)又是什么呢?這個看似簡單的問題,卻是搜索引擎研究的核心難題之一。
為了解答這個疑問,億企邦特意寫了這篇文章,為大家介紹一下百度搜索結(jié)果展示的基本工作原理:
一、頁面抓取原理 搜索引擎在抓取到我們網(wǎng)站的前提是必須要有渠道,當(dāng)你新建一個域名,新建了一個普通頁面,頁面沒有經(jīng)過任何人的訪問,也沒有任何地方出現(xiàn)過你的頁面,那么搜索引擎是無法正確的抓取到你的頁面的,有些頁面或網(wǎng)站之所以什么都沒有操作,搜索引擎也一樣可以抓取和收錄,其原因主要是通過以下幾個渠道:
1、鏈接渠道 我們做外鏈的主要目的是什么,是傳遞權(quán)重還是能夠更好的讓搜索引擎通過這個鏈接來抓取我們的站點(具體可查看億企邦《外鏈對網(wǎng)站SEO優(yōu)化到底有什么作用》的相關(guān)介紹)?這是大家都在考慮的一個問題,其實更重要的是讓搜索引擎能夠通過此鏈接正確的抓取到我們的網(wǎng)站,這也是SEOER都在說,現(xiàn)在新站建議做外鏈,老站就沒必要的原因之一。
2、提交渠道 80%的站點在建立以后會手動提交到搜索引擎,這是搜索引擎在收錄到更多站點的一個重點渠道,當(dāng)搜索引擎不知道你的站點存在的時候,你提交了你的站點,這就是直接告訴了搜索引擎,你的站點是存在的,值得搜索引擎的收錄。
3、瀏覽器渠道 百度曾報道,360瀏覽器可根據(jù)用戶流量的網(wǎng)頁進(jìn)行收集和抓取,也就是說,當(dāng)用戶使用了360瀏覽器瀏覽了某一個未被360搜索引擎發(fā)現(xiàn)的站點,那么360瀏覽器將會記錄這個網(wǎng)站,然后將這個網(wǎng)站放到搜索引擎去處理,同樣,我想百度瀏覽器也會做類似的事情吧。
二、文章收錄原理 一些SEO初學(xué)者,剛接觸百度收錄的時候,總會問:為什么同時發(fā)布兩篇文章,一篇被收錄,還有一篇未收錄?為何我在大型網(wǎng)站發(fā)布的軟文未收錄?等等收錄問題,其實百度對網(wǎng)站文章收錄這一點看的相對嚴(yán)格(具體可查看億企邦《百度收錄網(wǎng)站文章的現(xiàn)狀及原則依據(jù)》的相關(guān)介紹),所以我們在這一點不能掉以輕心。
當(dāng)然,收錄的原則也沒有想象中那么復(fù)雜,如果你的網(wǎng)站能夠健康的打開,收錄基本不是問題,只是時間問題,對于百度搜索引擎的收錄工作原理主要有以下3個:
1、對比 當(dāng)搜索引擎在抓取到你網(wǎng)站的文章頁面的時候,會識別你的每一個內(nèi)頁的相同區(qū)與不同區(qū),也就是說,你網(wǎng)站的不同區(qū)將會被定義為主題內(nèi)容區(qū)域,然后拿著你的主題內(nèi)容與其他網(wǎng)站的主題內(nèi)容進(jìn)行對比,分出你頁面主題內(nèi)容的原創(chuàng)度。
2、分類 通過對你的站點進(jìn)行對比后,可以直接對你的內(nèi)容進(jìn)行分類,如同億企邦的一篇關(guān)于SEO相關(guān)的文章,搜索引擎可直接通過對比來判斷,你的網(wǎng)站屬于那種類型,是否適合你的站點。
3、用戶得分 分類之后,并不是代表搜索引擎就一定會收錄你的文章,主要還是要依靠用戶的得分,用戶的點擊率、停留時間判斷出此文的價值。
通過以上幾點的算法,當(dāng)文章的綜合價值達(dá)到搜索引擎的標(biāo)準(zhǔn)值的時候,搜索引擎將會對其網(wǎng)站頁面進(jìn)行收錄。
三、頁面過濾原理 很多網(wǎng)站頁面被百度收錄之后,百度認(rèn)為該頁面對用戶沒有太大的價值,或者是質(zhì)量度比較低的頁面,百度必然就會過濾掉,這也是用戶體驗好的一種表現(xiàn)。
很多站點以優(yōu)化為目的,絲毫不考慮用戶的體驗,例如一些橋頁、跳轉(zhuǎn)頁面這些就是典型,百度的k站就是一種過濾頁面的表現(xiàn),把那些作弊的站點的頁面全部的過濾掉(具體可查看億企邦《百度是如何判斷網(wǎng)站更有抓取和收錄價值的》的相關(guān)介紹)。
很多人抱怨百度多次的k站事件,尤其是那些?絲站長們整天在論壇抱怨這個抱怨那個,為什么k你的站,很顯然你的站點真的是以用戶體驗為核心運營站嗎?
做SEO的人大多都是為了優(yōu)化而運營站點,每天寫的站內(nèi)的更新、做外鏈肯定一部分是為了優(yōu)化而優(yōu)化,百度k你的站是犧牲少部分人的利益,更多的用戶是從中獲益的,要知道每天有上億人在使用百度,如果搜索出來的信息是你為了優(yōu)化而運營的站點,低質(zhì)量的頁面,那百度是拿自己未來的前途給你優(yōu)化站點做鋪墊的,所以過濾頁面這方面百度非常的嚴(yán)格。
四、頁面信息展示原理 一旦搜索引擎抓取到頁面,并且進(jìn)行了收錄和過濾后,接下來就需要給用戶展示信息了,對此,搜索引擎也需要經(jīng)過以下2個主要步驟:
1、建立索引 經(jīng)過了收錄頁面以及過濾頁面的工作之后,百度會對這些頁面逐一進(jìn)行標(biāo)記和識別,并將這信息進(jìn)行儲存為結(jié)構(gòu)化的數(shù)據(jù),儲存到百度的搜索的服務(wù)器中,這些儲存的數(shù)據(jù)有網(wǎng)頁的信息、網(wǎng)頁的標(biāo)題關(guān)鍵詞頁面描述等標(biāo)簽、網(wǎng)頁外鏈及描述、抓取記錄。
還會將網(wǎng)頁中的關(guān)鍵詞信息進(jìn)行識別和儲存,以便與用戶搜索的內(nèi)容進(jìn)行匹配,建立完善的索引數(shù)據(jù)庫,方便呈現(xiàn)出最佳的顯示信息。
2、顯示信息 用戶輸入的關(guān)鍵詞,百度會對其進(jìn)行一系列復(fù)雜的分析,并根據(jù)分析的結(jié)論在索引庫中尋找與之最為匹配的一系列網(wǎng)頁,按照用戶輸入的關(guān)鍵詞所體現(xiàn)的需求強弱和網(wǎng)頁的優(yōu)劣進(jìn)行打分,并按照最終的分?jǐn)?shù)進(jìn)行排列,展現(xiàn)給用戶,一般顯示出的最佳信息,需要關(guān)鍵詞匹配最高的相關(guān)頁面。
五、關(guān)鍵詞排名原理 搜索引擎的排名原理是大家最最關(guān)心的話題,搜索引擎的排名原理是通過多方面來給出的,不是單一的站內(nèi)優(yōu)化做的多好,也不是單一的點擊率有多高,而是根據(jù)網(wǎng)站的綜合得分得出排名,這主要由以下幾個點:
1、點擊率 從百度站長平臺的關(guān)鍵詞工具可以看出,當(dāng)你的網(wǎng)站排名在50頁之前的時候,點擊率對你的網(wǎng)站有直接影響,這也就是很多網(wǎng)絡(luò)公司接SEO的單,要求你網(wǎng)站的排名必須是多少的原因之一。
2、體驗度 頁面的體驗度是更具用戶的需求來定義的,當(dāng)用戶的重點需求在圖片的時候,那么頁面的體驗度最核心問題就在圖片上面,但是這種簡單的需求,基本的網(wǎng)站均可滿足,重點還需要在簡單的需求滿足的情況下,在滿足其他附加需求。
那么,搜索引擎為何能夠知道用戶的需求呢?主要原因還是用戶在搜索框搜索的內(nèi)容均被搜索引擎所記錄。
當(dāng)然,遇到同樣是圖片的站點,排名的好壞還有更多的算法,比如用戶在瀏覽你的圖片僅用1秒,而瀏覽競爭對手的圖片用了30秒,這就意味著競爭對手的內(nèi)容比你做的好,停留時間、PV、跳出率成功了搜索引擎重點考核數(shù)據(jù)。
3、信用度 信用度的積累可直接讓搜索引擎忽略很多細(xì)節(jié)問題,直接給與排名,這就是我們經(jīng)常在大站發(fā)布的外鏈軟件很容易就獲得排名的原理了,一個大型網(wǎng)站,經(jīng)過與搜索引擎的磨合,早已被搜索引擎加入到了信任用戶,所以,后期的軟文可以直接讓搜索引擎給他一個優(yōu)勢排名。
億企邦點評: 搜索引擎是用戶和網(wǎng)站之間的橋梁,它起到的永遠(yuǎn)是傳達(dá)的作用,用戶需要從搜索端獲得信息,你可以給搜索端提供信息,只有真正了解搜索端需要什么東西,站長們才能更好的提供信息資源。
對此,億企邦要提醒一下各位站長或SEO人員,要想利用好SEO優(yōu)化,首先就要了解搜索引擎的習(xí)慣,搜索引擎是怎么收錄網(wǎng)站的?通過什么算法?哪些內(nèi)容是搜索引擎樂意展示的?等等,只有把這些基本原理給弄懂了,才能更好的掌握搜索引擎需求,提高網(wǎng)站的整體運營模式。