時(shí)間:2022-08-06 03:51:01 | 來(lái)源:建站知識(shí)
時(shí)間:2022-08-06 03:51:01 來(lái)源:建站知識(shí)
URL的地位在SEO的過(guò)程中非常重要,也是SEOer所面臨的一個(gè)基本問(wèn)題,我們?cè)谝郧暗暮芏辔恼轮卸级啻翁岬揭粋€(gè)觀點(diǎn):
SEO的流量產(chǎn)生于你排名比較好的頁(yè)面,而這些頁(yè)面有排名的前提是被搜索引擎收錄。
我們知道網(wǎng)絡(luò)世界越來(lái)越龐大,內(nèi)容的產(chǎn)生幾乎可以說(shuō)是無(wú)窮無(wú)盡的,這對(duì)于資源有限的搜索引擎而言,它們可以做的只能是盡可能快地收錄新內(nèi)容,所以說(shuō),網(wǎng)絡(luò)中新內(nèi)容的產(chǎn)生 > 被抓取收錄的內(nèi)容。而URL跟搜索引擎的關(guān)系,舉個(gè)形象的例子,就好像你的地址跟速遞員之間的關(guān)系,一個(gè)準(zhǔn)確的以及便于查找的地址,將很大程度上提高速遞員的投遞。
那么搜索引擎在抓取頁(yè)面過(guò)程中,會(huì)遇到什么問(wèn)題呢?
一:URL的重復(fù)性。
請(qǐng)不要忽略這一點(diǎn),要講的內(nèi)容可能跟你想象中的不一樣。我們假設(shè)有以下兩個(gè)URL
這兩個(gè)頁(yè)面產(chǎn)生的內(nèi)容是一樣的,前者可能是偽靜態(tài),也可能是真實(shí)的靜態(tài)頁(yè)面,但似乎前者比后者更好。但事實(shí)并非如此,首頁(yè),這兩個(gè)URL的格式都是容易被抓取和收錄的,我們很多時(shí)候之所以不用?這種動(dòng)態(tài)的引入方式,就是為了避免可能產(chǎn)生的大量重復(fù)內(nèi)容。但是前者這種模式同樣可能產(chǎn)生大量的重復(fù)內(nèi)容,比如搜索引擎可能會(huì)誤以為這個(gè)888只是一個(gè)SessionID,在無(wú)法做到準(zhǔn)確判斷的情況下,前者這種模式的優(yōu)勢(shì)并不明顯。
可能有些人不太明白這段話了,首先要把URL和內(nèi)容分開(kāi)來(lái),在理解上述話的時(shí)候,我們先簡(jiǎn)單說(shuō)下搜索引擎對(duì)于重復(fù)性內(nèi)容的判斷:搜索引擎本身有個(gè)強(qiáng)大的數(shù)據(jù)庫(kù)存放已經(jīng)抓取進(jìn)來(lái)的內(nèi)容,判斷一個(gè)內(nèi)容是否有相似的,最佳做法是把即將抓取的內(nèi)容跟數(shù)據(jù)庫(kù)已有的內(nèi)容做比較,但通過(guò)閱讀《google網(wǎng)站質(zhì)量指南》,我們發(fā)現(xiàn)這是個(gè)理解誤區(qū),反過(guò)來(lái)想下,這種在抓取的時(shí)候就進(jìn)行內(nèi)容對(duì)比的技術(shù)手段可行性也并不強(qiáng),因?yàn)閮?nèi)容太龐大了。所以搜索引擎對(duì)抓取的URL分析就相當(dāng)重視,我們要讓搜索引擎認(rèn)為我們的URL對(duì)應(yīng)的內(nèi)容在站內(nèi)是不重復(fù)的,最佳的做法當(dāng)然還是靜態(tài)化URL,讓搜索引擎認(rèn)為網(wǎng)站本身的確有很多不同的內(nèi)容,針對(duì)這種情況,最佳的URL寫(xiě)法應(yīng)該是:
歸根結(jié)底,就是保證URL的唯一性以及不和其他一些情況混淆掉。
二:“無(wú)限空間”(無(wú)限循環(huán))
現(xiàn)在絕大多數(shù)博客上都會(huì)有一個(gè)日歷控件,就是不管你點(diǎn)擊哪個(gè)時(shí)間段,都會(huì)出現(xiàn)一個(gè)頁(yè)面,既然找不到對(duì)應(yīng)的內(nèi)容,但產(chǎn)生的URL都是唯一的,這樣一來(lái),就形成無(wú)限空間的概念了,因?yàn)闀r(shí)間是無(wú)止境的,所以產(chǎn)生的頁(yè)面也是無(wú)窮的,對(duì)于搜索引擎而言,這個(gè)是非常不友好的。
可以利用nofollw屬性做到有效的引導(dǎo)即可避免這種情況,相關(guān)文章:
三:層級(jí)要符合邏輯。
我們分析以下幾個(gè)頁(yè)面:
1、
2、
3、
如果說(shuō)搜索引擎今天只能抓取其中一個(gè)的話,那從優(yōu)先級(jí)上出發(fā),它是先抓取第1個(gè),那么這時(shí)又產(chǎn)生一個(gè)誤區(qū),如果我把頁(yè)面都放在根目錄下,就不存在層次的優(yōu)先級(jí)了,如果層次優(yōu)先級(jí)沒(méi)區(qū)別,搜索引擎會(huì)進(jìn)行同目錄下的URL的優(yōu)化比較,這也是為什么收錄的時(shí)候會(huì)先抓取網(wǎng)站首頁(yè)。所以最好的方式就是按照業(yè)務(wù)邏輯來(lái)建立子目錄,內(nèi)容跟內(nèi)容之間的從屬關(guān)系是怎么樣的,在URL就用層次優(yōu)化級(jí)方式來(lái)規(guī)劃。
四:重復(fù)內(nèi)容的處理。
上圖是我從某知名網(wǎng)購(gòu)平臺(tái)上搜索筆記本時(shí)出來(lái)的篩選條件,我們做個(gè)數(shù)據(jù)分析,在這個(gè)頁(yè)面中,品牌為16個(gè),價(jià)格條件為5個(gè),處理器為8個(gè),屏幕尺寸為8個(gè),硬盤(pán)容易條件為6,內(nèi)存為6個(gè),硬盤(pán)為6個(gè),顯卡條件為6個(gè),那么最多產(chǎn)生的搜索條件結(jié)果有:
16*5*8*8*6*6*6*6=6220800
而我們看上圖顯示的產(chǎn)品為2471個(gè),所以顯然重復(fù)性的內(nèi)容是非常多的,這里舉的例子還不是非常龐大的數(shù)據(jù),有些網(wǎng)站可以組合成幾億甚至幾百億的頁(yè)面出來(lái)。有興趣的朋友可以看下我之前寫(xiě)的ASP等動(dòng)態(tài)語(yǔ)言網(wǎng)站在做SEO時(shí),站內(nèi)搜索應(yīng)該注意的問(wèn)題。
【尊重原創(chuàng),分享觀點(diǎn)。來(lái)自芝麻開(kāi)門(mén)網(wǎng)絡(luò)科技原創(chuàng)文章,轉(zhuǎn)載請(qǐng)標(biāo)明文章來(lái)源 — 】
關(guān)鍵詞:索引,友好,建立,通過(guò),規(guī)范
客戶&案例
營(yíng)銷(xiāo)資訊
關(guān)于我們
客戶&案例
營(yíng)銷(xiāo)資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。