国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 學(xué)習(xí)搜索引擎的優(yōu)化:5個(gè)頂級語義搜索引擎

學(xué)習(xí)搜索引擎的優(yōu)化:5個(gè)頂級語義搜索引擎

時(shí)間:2023-03-08 01:08:01 | 來源:電子商務(wù)

時(shí)間:2023-03-08 01:08:01 來源:電子商務(wù)

在搜索引擎的圈圈里,”語義“是一個(gè)帶有魔幻光環(huán)的字眼。對它的大肆渲染會讓你猜想說這可能是第二次搜索的高潮。這些宣傳讓我覺得有些許懷疑,我也一直在等待著這個(gè)技術(shù)變得成熟。這個(gè)時(shí)刻到了,我現(xiàn)在很高興給大家介紹一下5個(gè)頂級的語義搜索引擎。

什么是語義搜索呢?

一個(gè)語義搜索引擎試圖通過上下文來解讀搜索結(jié)果的。它可以自動識別文本的概念結(jié)構(gòu)。例如,如果你搜索“選舉”,語義搜索引擎可能會獲取包含“投票”,“競選”和“選票”的文本信息,但是“選舉”這個(gè)詞可能根本沒有出現(xiàn)在這些信息來源中。(編者注: 也就是說語義搜索可以對關(guān)鍵詞的相關(guān)詞和類似詞進(jìn)行解讀,從而擴(kuò)大搜索信息的準(zhǔn)確性和相關(guān)性。)

在語義搜索的過程中,有一個(gè)重要組成部分,那就是針對查詢的信息和網(wǎng)絡(luò)上的內(nèi)容,進(jìn)行 消歧(消除模棱兩可的情況)。這意味著,搜索引擎通過自然語言處理 - - 當(dāng)你搜索“美洲虎" (捷豹轎車), 尋找會知道你要找一輛車還是一個(gè)大型貓科動物 。(編者注:目前普遍的搜索引擎所做到的基本上是對于關(guān)鍵詞的關(guān)注度,哪個(gè)關(guān)鍵詞搜索的人多,基本上哪種結(jié)果會出現(xiàn)在前列。)

下面要給你介紹的這些搜索引擎都多少采用了語義分析來篩選和詮釋數(shù)據(jù)。但是,你也將會看到,這幾個(gè)搜索引擎采用了不同的方式并且展示了五種不同的產(chǎn)品。

什么時(shí)候使用語義搜索引擎呢?

語義搜索擁有一種能夠提高傳統(tǒng)網(wǎng)頁搜索體驗(yàn)的能力,但是它卻起不到替代性的作用。網(wǎng)絡(luò)上大部分的搜索問題都是很隨性的瀏覽,對結(jié)果的要求也不精益求精,所以語義搜索的用處不大,倒是有針對性的研究搜索,會得益于語義搜索的結(jié)果。

現(xiàn)在來看看我們這個(gè)5個(gè)最牛的語義搜索的名單,來看看他們將如果提高你的搜索體驗(yàn)。Hakia是一個(gè)通用語義搜索引擎,和下面要介紹的Powerset,Cognition不同,其搜索結(jié)果是像維基百科一樣的語料庫。

Hakia的搜索結(jié)果是通過Tabs(標(biāo)簽)來組織的:網(wǎng)頁結(jié)果,可靠站點(diǎn),圖像和新聞,可靠站點(diǎn)涉及的結(jié)果是那些經(jīng)過Hakia邀請的圖書館員和其他信息專家認(rèn)證的。(編者注:美國的圖書館員都是非常有學(xué)問和學(xué)歷的信息專家,每個(gè)學(xué)科分支都有專門的圖書館員,他們擅長信息分類檢索,每年在華盛頓都有圖書館協(xié)會的會議,全國各地的圖書員會聚集在一起探討新的信息分類,科技檢索。很多現(xiàn)今的技術(shù)和搜索模式都是他們最先開始倡導(dǎo)和開發(fā)的。)

相對于一些簡單的搜索問題(比較典型的是那些流行的問題和缺少歧義的搜索問題),HaKia會給出一個(gè)類似于簡歷一樣的東西。這是一個(gè)各種基于主題的相關(guān)信息匯總。每個(gè)“簡歷”都由一些信息的鏈接匯成索引,并且給出了快速引用,在頁面上即時(shí)呈現(xiàn)。

這些“簡歷”的內(nèi)容會根據(jù)搜索問題的特性變化(例如:個(gè)人檔案,文獻(xiàn)目錄,大事件,可以是關(guān)于個(gè)人的,政府,經(jīng)濟(jì),文化,也可以是關(guān)于國家的信息。) 這個(gè)“簡歷”對于我來說是我最喜歡Hakia的特色,特別是我搜索一些話題的時(shí)候。

Hakia通常會給你推薦一些相關(guān)的搜索,這對研究來說都是挺棒的支持。

舉個(gè)例子,如果我搜索奧巴馬,HaKia 會推薦我是否對他老婆,希拉里,民主黨,共和黨薩拉培林,約翰麥卡恩等等人也感興趣。

但是有一些問題HaKia也會給出質(zhì)量比較差的結(jié)果,不過HaKia還是在測試階段,相信會有快速提高的。enseBot是一款將搜索結(jié)果提煉總結(jié)為一個(gè)精煉的文摘形式的搜索引擎。它試圖去理解這些搜索結(jié)果的界面的意義。從這個(gè)出發(fā)點(diǎn)來看,它使用的是文本挖掘,試圖分析網(wǎng)頁并鑒定他們關(guān)鍵的語義概念。

Sensebot從這個(gè)方式幫助你迅速的掌握哪些相關(guān)的信息到底是什么。從這個(gè)角度來看你不需要自己去尋找大量的網(wǎng)頁,甚至梳理出現(xiàn)的結(jié)果中不完整的專家的定義(甚至不需要理會任何定義。)

這個(gè)精煉的總結(jié)的作用是幫助消化你搜索的主題,將各種搜索結(jié)果的相關(guān)、重要內(nèi)容匯聚在一起。它還提供給你由各種相關(guān)概念以及一個(gè)被認(rèn)為是定義總結(jié)了你的搜索問題的語句的表單匯聚成的標(biāo)簽云。每個(gè)語句后面還包括了它們的出處的鏈接。

也不是所有的總結(jié)都是信息廣泛或者容易理解的,但卻是極有可能被改進(jìn)的。Hakia,SenseBot都還在測試階段。這些振奮人心的先進(jìn)科技每天都在與時(shí)俱進(jìn)。

Powerset現(xiàn)在不是一個(gè)正規(guī)的網(wǎng)頁互聯(lián)網(wǎng)搜索引擎。它在相對小型,有結(jié)果的語料庫中能發(fā)揮最大的xiao,該技術(shù)提供了對信息資料的全面把我。您可以在維基百科上進(jìn)行測試,但是你會發(fā)現(xiàn)Powerset更擅長這方面的搜索,它對用于研究目的搜索而構(gòu)建信息和表述的方式,是基于維基百科的巨大改善。你可以在搜索欄輸入關(guān)鍵詞,短語,或者一個(gè)簡單的問題。Powerset通常會直接在搜索結(jié)果的界面上直接回答問題。我最喜歡的一個(gè)特色就是Powerset把多個(gè)文章中的信息綜合在一起。

"Factz"是往往會出現(xiàn)在搜索結(jié)果中一個(gè)盒子,它是一個(gè)囊括基于可用信息建議出來的參考資料。例如,當(dāng)我搜索奧巴馬,Powerset提供了一些奧巴馬對羅伯特蓋茨,中東,巴基斯坦,貿(mào)易的看法的信息的鏈接。點(diǎn)擊搜索結(jié)果中一個(gè)鏈接,將顯示出一個(gè)小的對話框,里面會有奧巴馬的在提到文章中發(fā)言的引用,還有被引用話語的原文鏈接。

DeepDyve (編者注: Deepdyve是目前比較有發(fā)展前途的一個(gè)語義搜索,編者在去年就注意到這家公司,還聯(lián)系上了這家公司的幾個(gè)程序員,發(fā)現(xiàn)有很多中國人在這里工作。)

DeepDyve是一個(gè)非常強(qiáng)大,專業(yè)的研究工具,提供給大眾免費(fèi)的服務(wù)。(編者注:Deepdyve的搜索服務(wù)是免費(fèi)的,但是如果你要閱讀搜索出來的學(xué)術(shù)期刊,還是要付費(fèi)的。)

這是一個(gè)研究引擎幫助你進(jìn)入專業(yè)內(nèi)容的“深層網(wǎng)絡(luò)”:那是互聯(lián)網(wǎng)中沒有被傳統(tǒng)的搜索引擎索引或收錄的信息(比如一些專業(yè)數(shù)據(jù)庫,期刊等)。學(xué)者,研究員,學(xué)生,技術(shù)專家,商業(yè)等Deepdyve的用戶和其他信息消費(fèi)者可以在以下分類中搜索維基百科和“深層網(wǎng)絡(luò)“的信息: 生命科學(xué),醫(yī)學(xué),物理科學(xué),人文和社會科學(xué),商業(yè)和金融,專利,法律,清潔能源科技,電子工程。

研究網(wǎng)站的搜索引擎往往依賴于布爾語言或硬編碼的分類(編者注:邏輯運(yùn)算計(jì)算機(jī)語言),這些語言是有門檻和一定學(xué)習(xí)曲線的,一般人出來那些從業(yè)者是很難使用它們的。 Deepdyve是目前擁有呈現(xiàn)這些有價(jià)值的信息來源的教簡易界面的服務(wù)搜索引擎。你的搜索問題可以是任何獨(dú)立單詞甚至25000的字的問題構(gòu)成的。這個(gè)搜索的結(jié)果會以一種復(fù)雜的方式呈現(xiàn),包括了許多高級的選項(xiàng):提煉,分離,存儲你的搜索。即使有復(fù)雜型的存在,這個(gè)搜索結(jié)果還是相對來說很容易瀏覽的。

Cognition 的搜索業(yè)務(wù)是基于語義地圖,在它成立的24年后,Cognition得以自稱是如今可用的最全最精的英語搜索地圖

你可以使用Cognition的技術(shù)來搜索下面四個(gè)載體內(nèi)的信息。

· Public.Resource.org(目前一共有675,704個(gè)聯(lián)邦案例法文件,1,858卷,全部都是XHTML格式的文件。) 這次發(fā)布的信息由自1950年開始高等法院和上訴法院的決定組成。

· MEDLINE(醫(yī)療文獻(xiàn)分析及在線檢索系統(tǒng))摘要庫:此數(shù)據(jù)庫內(nèi)的摘要來自于世界文獻(xiàn)數(shù)據(jù)庫內(nèi)的生命科學(xué)和生物醫(yī)藥科學(xué)信息。它囊括了醫(yī)藥,護(hù)理,醫(yī)藥學(xué),牙醫(yī)學(xué),獸醫(yī)學(xué),和健康關(guān)懷的信息,還有一些和醫(yī)學(xué)沒有直接聯(lián)系的領(lǐng)域的信息,例如分子進(jìn)化論。(目前有18,005,903個(gè)文件)。

· 全部英文版本的維基百科內(nèi)容

· 最全面的新英語翻譯內(nèi)容,包涵文本和諸如福音書theGospels of Matthew, Luke, John and Mark的譯者筆記。

我們在維基百科內(nèi)測試了Cognition.在這個(gè)擁有大量文本的資料庫中,Cognition在對復(fù)雜問題的意思分類上表現(xiàn)的尤為出色。

· 詞匯:比如區(qū)別“古老的禮拜堂 和古老的廟宇”undefined

· 意思區(qū)分:“罷工的工人” 對比“加州的石油黃金”undefined

· 分類 :例如“拉丁美洲的印第安部落” 或是“ 北美洲樹木疾病”undefined

這些Cognition使用的去解決搜索問題的技術(shù)是給人以深刻的印象,Cognition給使用者提供了一種友好的方式去更有價(jià)值地的控制意義和分類。undefined,我認(rèn)為我對Cognition搜索結(jié)果的表述還不是很完善,但是我殷切地希望Conition團(tuán)隊(duì)也可以借鑒一下Hakia或者Powerset的經(jīng)驗(yàn)。undefined

關(guān)鍵詞:索引,學(xué)習(xí)

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉