国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 建站知識 > 用一個站的統(tǒng)計(jì)數(shù)據(jù)來談seo及搜索引擎

用一個站的統(tǒng)計(jì)數(shù)據(jù)來談seo及搜索引擎

時間:2022-07-27 12:18:01 | 來源:建站知識

時間:2022-07-27 12:18:01 來源:建站知識

做互聯(lián)網(wǎng)已經(jīng)2年,一直是做技術(shù)的,在網(wǎng)絡(luò)運(yùn)營上卻是一片空白,說來真是慚愧的很。前一陣子決定自己做個站練練手,為將來從技術(shù)轉(zhuǎn)向運(yùn)營鋪一下路。

由于從來沒有做過運(yùn)營和網(wǎng)站推廣,運(yùn)營方面的朋友認(rèn)識的不是很多,因此做交換鏈接的可能性不大。而自己剛做站,就那么一點(diǎn)點(diǎn)流量做交換也實(shí)在對不起人家。思前想后,對我來說最快的也是最可行的網(wǎng)站運(yùn)營方法就是seo了,而且用seo來做網(wǎng)站運(yùn)營和網(wǎng)站推廣跟技術(shù)更近一點(diǎn),上手也比較快。于是看了很多seo的資料,不管是seo優(yōu)化網(wǎng)站的,還是用seo來作弊搞流量的,能看的都看了。但是寫這篇文章的目的不是告訴大家如何用seo優(yōu)化更不是教大家如何用seo作弊,畢竟我也是剛剛學(xué),而且seo的教材和資料已經(jīng)相當(dāng)多了。我寫的肯定也沒有人家寫的好。我只是想用我的大米站的一些數(shù)據(jù)來對搜索引擎和seo建立一些假設(shè),然后推測一些結(jié)論,最后大家再討論一下,希望可以共同得到進(jìn)步。

好了,廢話不說了,先說一下我大米站的基本情況。我的站是一個小說導(dǎo)航網(wǎng)站(多迷小說之家 ),基本思想就是把各大小說網(wǎng)站的小說資料都采集下來,然后分類整理放到我的網(wǎng)站上,用戶通過訪問我的網(wǎng)站就可以同時搜索到幾個大小說網(wǎng)站的所有小說資料并點(diǎn)擊觀看,同時也可以看到各站的排名,推薦,更新等信息。好了,不多說了,不然大家該以為我是在AD了。

首先是網(wǎng)站開發(fā),界面仿照hao123,采用最簡單方便的asp+access,也是因?yàn)槲业?00mb的虛擬空間空間只支持asp和access,系統(tǒng)一共只有4個頁面,分別是index.asp(主頁)、list.asp(列表頁)、search.asp(搜索頁)/bookReader.asp(詳細(xì)頁),一天的時間搞定。其中主頁還做了一個模版用來生成靜態(tài)頁(由于服務(wù)器空間有限,不能把所有的頁面都生成靜態(tài)頁,遺憾??!把動態(tài)頁生成靜態(tài)頁這點(diǎn)很重要,搜索引擎更喜歡靜態(tài)頁,這點(diǎn)在所有的搜索引擎官方說明中都有說明的)。接下來是數(shù)據(jù)采集,先選定了5個小說網(wǎng)站,分別是起點(diǎn)中文、小說閱讀、紅袖、瀟湘、新浪讀書,然后寫了個程序,自動把數(shù)據(jù)采集下來并保存到sqlserver數(shù)據(jù)庫上,用了2天的時間。大概采集了190000多條吧,最后把數(shù)據(jù)再手動導(dǎo)入到access上(這里也有個小插曲,由于access數(shù)據(jù)庫是單文件單用戶的,功能非常有限。不能寫存儲過程,所以翻頁只能用asp的Recordset對象,每次把所有符合條件的結(jié)果都放到內(nèi)存中,然后再分頁,我的19萬數(shù)據(jù)每次都放到內(nèi)存中,然后再從中拿出20條來,速度和占用內(nèi)存量可想而知。所以這里教大家一個小技巧,就是把每條要分頁的數(shù)據(jù)都加一個字段用來表示他出現(xiàn)的頁數(shù),這樣每次只需要尋找這個頁的數(shù)據(jù)就可以了,而且以后數(shù)據(jù)增加或者減少,只需要用畢加樹算法重新改一下頁字段問題就解決了。另一個頭痛的問題是access沒有全文檢索。所以數(shù)據(jù)搜索基本靠like,我做過測試,數(shù)據(jù)量超過2萬就有可能出現(xiàn)內(nèi)存溢出的現(xiàn)象,解決這個問題的辦法沒有別的,只有自己建倒排索引。這是我在用access做大數(shù)據(jù)量處理時遇到的兩個問題和解決辦法,算是拋磚引玉吧)

網(wǎng)站做好,數(shù)據(jù)采集完畢,裝上51la免費(fèi)流量統(tǒng)計(jì),做個搜索引擎跟蹤器,就開始做試驗(yàn)了。上線20多天,沒有做過什么推廣,只在貼吧中發(fā)過帖子(很幸運(yùn)有個帖子被頂起來了)。流量中,60%是百度搜索引擎來的,16%回頭客,16%貼吧(就是那個被頂起來的帖子),其它的是其它搜索引擎來的?;窘y(tǒng)計(jì)信息和收錄記錄如下圖:

(這里有個問題要說一下,我的域名和空間是去年9月份前后申請的,但是放了一個垃圾系統(tǒng)就再也沒有管。所以我在做多迷之前這個域名已經(jīng)被bd和gg收錄了,但是只有不到10頁的收錄量,所以我沒有花太多的時間讓搜索引擎收錄我,只是重新讓搜索引擎重新檢索我的網(wǎng)站而已)

再給大家看兩個數(shù)據(jù),是我記錄的bd和gg的搜索機(jī)器人(bot)每天取我網(wǎng)站的次數(shù)。(如圖)

ok!現(xiàn)在開始分析,首先說一下網(wǎng)頁的設(shè)計(jì),沒有frame,沒有沒必要的ajax,所有內(nèi)鏈接都加上了title,沒有隱藏和堆砌關(guān)鍵詞,沒有同色鏈接,就是說沒有進(jìn)行seo作弊。(注:以下假設(shè)和分析只代我目前的一些看法,不一定是正確的,希望大家也可以分析一下,指出我不對的地方)


現(xiàn)象1
我的title中是這么寫的——duomimi 多迷小說之家---青春校園|散文|玄幻小說|小說連載|靈異恐怖|短篇小說|

靈異推理|童話寓言|言情小說|網(wǎng)絡(luò)小說|歷史武俠|武俠小說。搜索結(jié)果顯示我在“青春校園短篇小說”這個長尾

關(guān)鍵詞中是第一位。
假設(shè):
頁面關(guān)鍵詞主要根據(jù)title標(biāo)簽中的關(guān)鍵詞定,但是title中的關(guān)鍵詞堆砌沒有用,只會取第一個關(guān)鍵詞做為你網(wǎng)頁的主關(guān)鍵詞并在搜索引擎的索引上建立相關(guān)性排序。

現(xiàn)象2
同樣的時間bd收錄1170,gg收錄17。相差甚多
假設(shè):
前人說的是對的,bd對新站感興趣,而gg對新站有考驗(yàn)期的,考驗(yàn)時間肯定在20天以上!

現(xiàn)象3
bd機(jī)器人每天搜索的次數(shù)變化很大,而gg每天的搜索的次數(shù)比較穩(wěn)定。但是bd搜索的頁數(shù)和收錄的頁數(shù)差不多,而gg搜索的頁數(shù)和收錄的差很遠(yuǎn)
假設(shè):
bd對于新站是來著不懼,有多少收多少。只要是爬下來的頁,只要沒有作弊,都收錄上去先。而gg爬的頁不會馬上放上去。是扔了還是放在什么地方了就不知道了。

現(xiàn)象4
假設(shè)主頁的深度是0,主頁上的內(nèi)鏈接是1,深度為1的頁上的內(nèi)鏈接為2以此類推,深度越潛的頁面搜索的次數(shù)越多
假設(shè):搜索引擎對深度潛的頁面更感興趣,可能使用這種方法來判斷更新的數(shù)據(jù),當(dāng)確定潛層頁面的數(shù)據(jù)都沒有

變化了才繼續(xù)往下爬。所以做站一定要時常更新,而且把更新的東西放得越潛越好,不要藏起來。

現(xiàn)象5
搜索引擎收錄的頁面中我的search頁面比例最大(bookreader頁是我后來加上去的以前沒有)。
假設(shè):搜索引擎不喜歡列表頁,更喜歡詳細(xì)頁,作為判定的方法估計(jì)主要是通過內(nèi)鏈接的數(shù)量來判斷,我的search頁的內(nèi)鏈接很少,基本都是外鏈接。所以它把我的search頁當(dāng)成是詳細(xì)頁了。

現(xiàn)象6
我在期間加了一個頁面bookreader頁,用戶點(diǎn)擊小說名稱后不再直接打開小說頁面,而是進(jìn)入我的bookreader頁面,就是說我把以前的外連接變成了內(nèi)鏈接。結(jié)果第二天,幾乎所有的搜索引擎的搜索數(shù)量都變少了。
假設(shè):搜索引擎很討厭對頁面內(nèi)鏈接的改變。所以盡量不要隨便改動頁面的內(nèi)鏈接。

現(xiàn)象7
每次搜索一次list頁會隔比較長的時間再搜索下一個頁,而bookreader和search頁則會相隔的時間較短。
假設(shè):由于list的內(nèi)鏈接多,而bookreader和search頁內(nèi)鏈接多,所以可能bd每天收錄的新鏈接數(shù)是有一個極限的。就是說,每天就收你這么多個鏈接,而這個數(shù)量應(yīng)該對不同的站不同,我計(jì)算一下,我的站應(yīng)該是在3000~4000左右

現(xiàn)象8
今天bd對我的搜索次數(shù)忽然有幾十變成1000多
假設(shè):現(xiàn)在還沒有弄清楚怎么回事,要看以后的變化,可以肯定的是我沒有對站做過什么改動,只是每5分鐘更新一次主頁而已。難道是對我的站升級了??

目前為止就想到這8個現(xiàn)象,以后我會繼續(xù)跟蹤并回帖分析的。算是拋磚引玉吧,希望大家一起來討論

 

關(guān)鍵詞:索引,數(shù)據(jù),統(tǒng)計(jì)

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉