下一代搜索引擎
時(shí)間:2023-03-18 17:34:01 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-18 17:34:01 來(lái)源:電子商務(wù)
今天來(lái)說(shuō)說(shuō)搜索引擎:
@百度 @搜狗搜索 @秘跡
搜索引擎是一種伴隨互聯(lián)網(wǎng)成長(zhǎng)的標(biāo)志性功能,但和郵箱、論壇、門(mén)戶(hù)、視頻等網(wǎng)站類(lèi)型不同,搜索引擎的數(shù)量相當(dāng)稀少,而且功能服務(wù)看起來(lái)也大同小異,一般人根本分辨不出這些搜索引擎到底有什么區(qū)別。在互聯(lián)網(wǎng)浪潮的風(fēng)云變幻中,搜索引擎就宛如一顆頑固的礁石在你來(lái)我往中始終不動(dòng),仿佛成了被時(shí)光凝固的雕像。
所以我覺(jué)得這個(gè)領(lǐng)域如此死氣沉沉是不合理的,作為宇宙第一產(chǎn)品創(chuàng)意師,我不是有意針對(duì)各位,我只是覺(jué)得在座的各位……
就先說(shuō)搜索引擎最奇怪的地方吧:從郵箱到論壇,從購(gòu)物到本站,從視頻到閱讀,從新聞到微博,從游戲到IM……所有的網(wǎng)絡(luò)應(yīng)用形式都在使用會(huì)員制,大部分網(wǎng)站、APP功能都需要注冊(cè)會(huì)員后才可以使用,就連殺毒軟件新聞閱讀之類(lèi)都有會(huì)員!
可是,搜索引擎的會(huì)員在哪里?或者說(shuō):
搜索引擎這個(gè)功能跟會(huì)員制有聯(lián)系嗎?最簡(jiǎn)單直接的,當(dāng)整個(gè)互聯(lián)網(wǎng)都需要會(huì)員制來(lái)增加用戶(hù)黏性、提供個(gè)性化服務(wù)、收集個(gè)人信息的時(shí)候,搜索引擎一直在躺尸。就拿國(guó)內(nèi)某業(yè)界龍頭來(lái)說(shuō),會(huì)員是早早就有了的,而且其會(huì)員可以享受的服務(wù)類(lèi)別還十分豐富,堪稱(chēng)業(yè)界翹楚。但是!即使這么豐富的服務(wù)內(nèi)容,
幾乎都跟搜索功能本身沒(méi)有關(guān)系!有人可能覺(jué)得,搜索功能的使用操作畢竟太過(guò)簡(jiǎn)單,沒(méi)什么細(xì)化深入的空間,所以也就不需要會(huì)員制這種復(fù)雜的東西。
然而,這只是習(xí)慣和成見(jiàn)蒙蔽了你的雙眼。搜索引擎的會(huì)員制其實(shí)大有作為:
1 個(gè)性化搜索結(jié)果訂制:
不同的人使用搜索引擎當(dāng)然會(huì)有不同的需求和使用偏好,而這種差異化的服務(wù)方式只能通過(guò)會(huì)員制來(lái)實(shí)現(xiàn)。2 更廣泛的細(xì)節(jié)收集和整理:
搜索的關(guān)鍵字、點(diǎn)擊偏好、網(wǎng)頁(yè)的瀏覽時(shí)間和次數(shù)……這一切都是用來(lái)驗(yàn)證、提升搜索效能的重要資料,而在過(guò)去的二十多年間,這些寶貴的海量資料幾乎都被無(wú)情拋棄了。3 將自然人作為搜索引擎的搜索對(duì)象:
搜索信息只是搜索引擎的表面工作,卻遠(yuǎn)遠(yuǎn)不是其核心。搜索引擎真正要去關(guān)注的并不是人們產(chǎn)生的信息,而是產(chǎn)生信息的人。如果能做到以上三點(diǎn),毫不夸張的說(shuō),搜索引擎這種網(wǎng)絡(luò)應(yīng)用方式將迎來(lái)誕生以來(lái)最大的一次變革迭代。
首先,搜索內(nèi)容的有效性會(huì)大大提升。以往你進(jìn)行搜索操作時(shí),部分垃圾網(wǎng)站會(huì)通過(guò)標(biāo)簽作弊等技術(shù)手段提升排名,但實(shí)際上網(wǎng)站里并沒(méi)有相應(yīng)內(nèi)容。因?yàn)椴荒軐?duì)搜索結(jié)果進(jìn)行個(gè)性訂制,用戶(hù)只能一次又一次的忍受這幾個(gè)垃圾網(wǎng)站的出現(xiàn),點(diǎn)擊進(jìn)去后才發(fā)現(xiàn)上當(dāng)受騙了。所以搜索引擎應(yīng)當(dāng)增加“網(wǎng)站黑名單”的功能,如果你發(fā)現(xiàn)一個(gè)垃圾網(wǎng)站,那么就可以將其徹底拉黑,以后的任何搜索結(jié)果都不會(huì)涉及到該網(wǎng)站(其實(shí)現(xiàn)在也可以通過(guò)搜索命令實(shí)現(xiàn),但操作相對(duì)復(fù)雜,且無(wú)法與賬號(hào)策略、操作習(xí)慣進(jìn)行綁定)。
與之相反,一些內(nèi)容良心的網(wǎng)站則可以被加入偏好列表,以后的搜索過(guò)程將更偏向于從這些網(wǎng)站中獲取結(jié)果。用戶(hù)甚至可以將一些實(shí)在的網(wǎng)站手動(dòng)添加進(jìn)搜索引擎白名單里,而不必在每次進(jìn)行搜索時(shí)都實(shí)用復(fù)雜的選項(xiàng)和命令。因此隨著越來(lái)越多網(wǎng)站的加入,
搜索引擎可以自然而然的依靠廣大用戶(hù)自發(fā)的統(tǒng)計(jì)行為形成網(wǎng)頁(yè)打分功能。而且該功能可以進(jìn)一步向所有用戶(hù)開(kāi)放:如果用戶(hù)覺(jué)得這個(gè)網(wǎng)站內(nèi)容符合自己的需求,那么就打高分,反之則扣分。
為了避免刷分行為,一套精確的用戶(hù)行為統(tǒng)計(jì)系統(tǒng)是必要的,部分“三無(wú)用戶(hù)”等群體將會(huì)在后臺(tái)被降低相應(yīng)權(quán)重,針對(duì)不同用戶(hù)推送不同結(jié)果的“避嫌機(jī)制”則會(huì)進(jìn)一步降低刷分行為的命中效率。該功能中的大部分策略應(yīng)當(dāng)是不向用戶(hù)公開(kāi)的,甚至是隨機(jī)、隨地、隨時(shí)調(diào)整參數(shù)變量的,以便使刷分者難以窺見(jiàn)作弊的門(mén)徑。
所以搜索引擎還應(yīng)當(dāng)將用戶(hù)的瀏覽器操作過(guò)程也予以收集記錄,哪個(gè)網(wǎng)站點(diǎn)開(kāi)后馬上就關(guān)掉了?哪個(gè)同樣的網(wǎng)頁(yè)被反復(fù)點(diǎn)開(kāi)?哪個(gè)頁(yè)面被仔細(xì)查看并有復(fù)制行為發(fā)生?哪個(gè)搜索結(jié)果被加入了收藏夾……這些信息都是最寶貴的結(jié)果檢驗(yàn)數(shù)據(jù),相當(dāng)于
讓所有用戶(hù)成為了搜索引擎的具名維護(hù)人員(盡量降低匿名賬戶(hù)和操作的數(shù)量和權(quán)重),幫助搜索引擎分辨搜索結(jié)果的好壞,進(jìn)而決定對(duì)不同網(wǎng)站的使用不同的抓取權(quán)重。
眾多用戶(hù)的海量選擇將會(huì)在大數(shù)據(jù)層面給予搜索引擎最實(shí)用的標(biāo)尺,讓搜索引擎主動(dòng)學(xué)習(xí)人類(lèi)的選擇,加大對(duì)所有優(yōu)秀網(wǎng)站的搜索深度,降低劣質(zhì)網(wǎng)站的搜索權(quán)重,使整個(gè)互聯(lián)網(wǎng)的內(nèi)容逐漸去粕存精,提高網(wǎng)絡(luò)的使用效率。
除了分辨不同的網(wǎng)站,在眾多網(wǎng)站內(nèi)部:不同的版塊、不同的用戶(hù)、不同的媒體、不同的法人、不同的地域……都可以成為被搜索引擎識(shí)別的對(duì)象。
作為用戶(hù)也可以將自己的用戶(hù)頁(yè)注冊(cè)到搜索引擎中,幫助搜索引擎在海量的網(wǎng)頁(yè)中找到最具價(jià)值的那些用戶(hù)。這里的價(jià)值不僅是指該用戶(hù)創(chuàng)造出的內(nèi)容是有價(jià)值的(比如偉大的在下?。?,更代表了該用戶(hù)在互聯(lián)網(wǎng)上的真實(shí)身份。這些用戶(hù)既是網(wǎng)絡(luò)內(nèi)容(搜索結(jié)果)的創(chuàng)造者,同時(shí)也是搜索引擎的使用者。每位用戶(hù)涉獵內(nèi)容之廣泛、使用媒體之多樣、在線時(shí)間之漫長(zhǎng)……都是不可仿冒的真實(shí)操作,更代表了堅(jiān)不可摧的真實(shí)身份。
這意味著,搜索引擎對(duì)互聯(lián)網(wǎng)內(nèi)容的抓取將不僅僅限于結(jié)果,還涉及到了更早之前的“起源”。搜索引擎網(wǎng)羅著整個(gè)互聯(lián)網(wǎng)世界的一切,也等同于網(wǎng)羅著現(xiàn)實(shí)世界的眾人。信息是驅(qū)動(dòng)人類(lèi)社會(huì)運(yùn)行的鏈條,搜索引擎就能成為驅(qū)動(dòng)鏈條轉(zhuǎn)動(dòng)的齒輪。而現(xiàn)在整個(gè)地球上所有的搜索引擎都不過(guò)是規(guī)束鏈條位置的從動(dòng)輪罷了。
對(duì)于個(gè)人來(lái)說(shuō),這代表著你在一個(gè)網(wǎng)站上所取得的成就將通過(guò)搜索引擎獲得貫通全網(wǎng)的逆天力量。例如你在本站是一頭關(guān)注十萬(wàn)的大V,同時(shí)你也在搜索引擎上注冊(cè)了你在微信、QQ、抖音、趕集、易車(chē)等網(wǎng)站APP上的賬戶(hù)(通過(guò)“先在搜索引擎發(fā)表部分內(nèi)容,然后再發(fā)表在相關(guān)網(wǎng)站上”等方法進(jìn)行注冊(cè)驗(yàn)證),那么當(dāng)你在這些網(wǎng)站和APP上發(fā)表內(nèi)容,這些內(nèi)容就會(huì)獲得與你在本站身份相對(duì)應(yīng)的排名權(quán)重(實(shí)際權(quán)重計(jì)算還會(huì)結(jié)合其他用戶(hù)對(duì)你貢獻(xiàn)內(nèi)容的評(píng)分,和你自身使用搜索引擎的相關(guān)數(shù)據(jù))。
可以想見(jiàn):這樣的排名策略對(duì)于那些投機(jī)取巧的蠅茍之輩將是多么慘痛的滅頂之災(zāi)。這些刷分的五毛通常都不具有成為大V的智商與實(shí)力,因此在搜索引擎刷分刷排名的難度將大大提高,甚至毫無(wú)可能。互聯(lián)網(wǎng)上所有劣質(zhì)用戶(hù)所產(chǎn)生的無(wú)窮垃圾也將在這一策略的行進(jìn)下被無(wú)情排除,甚至失去這個(gè)世界的大部分流量。除了優(yōu)質(zhì)內(nèi)容的貢獻(xiàn)者,網(wǎng)絡(luò)世界將進(jìn)入“強(qiáng)者恒強(qiáng)、弱者恒亡”的新時(shí)代。
當(dāng)搜索引擎通過(guò)每一個(gè)人而不是獨(dú)立的網(wǎng)頁(yè)聯(lián)系到整個(gè)網(wǎng)絡(luò),也就等同于搜索引擎囊括到了這個(gè)世界存在的基本力量——每一個(gè)人。通過(guò)“所有人”而不是“所有網(wǎng)頁(yè)”來(lái)展現(xiàn)這個(gè)世界,才是搜索引擎的最終形態(tài)。從此搜索引擎將走出被蠅營(yíng)狗茍喧囂的垃圾場(chǎng),全面擁抱最澄澈負(fù)責(zé)的真實(shí)世界。
當(dāng)然這樣的操作在后期一定會(huì)需要海量的算力資源,也許會(huì)遠(yuǎn)超過(guò)BAT算力的總和。所以這時(shí)我們還需要另外一大利器來(lái)解決這一問(wèn)題——鈔能力是豬都能想到的辦法,立竿見(jiàn)影卻又惹人厭煩。所以除了收費(fèi)策略,區(qū)塊鏈技術(shù)才是真正的幕后大佬。盡管上述的一系列計(jì)算過(guò)程都無(wú)比繁雜,但其中的大部分并不需要時(shí)效性。這就意味著搜索引擎完全可以將計(jì)算工作“外包”出去,用全世界計(jì)算機(jī)的富余算力為這一體系保駕護(hù)航。大部分用戶(hù)將通過(guò)“挖礦掛機(jī)”貢獻(xiàn)出自己多余的算力,沖抵搜索引擎的高昂成本。
如此一來(lái),搜索引擎將取代比特幣成為世界上規(guī)模最大的網(wǎng)絡(luò)計(jì)算集群,具備自己獨(dú)立的主題與規(guī)則,代表整個(gè)國(guó)家和星球級(jí)別的公共意志。沒(méi)有任何外部算力能夠與之抗衡,亦沒(méi)有任何私有組織有力量去擾動(dòng)。搜索引擎從互聯(lián)網(wǎng)誕生之初就是整個(gè)互聯(lián)網(wǎng)世界的核心與中樞,這一點(diǎn)從30年前Archie誕生的那天起就已注定。盡管今天某些引擎自己作死褪去了不少光環(huán),但王者必將重新歸來(lái)。