時(shí)間:2022-11-28 06:30:01 | 來(lái)源:信息時(shí)代
時(shí)間:2022-11-28 06:30:01 來(lái)源:信息時(shí)代
網(wǎng)絡(luò)信息檢索 : 根據(jù)相似匹配度量模式,在一個(gè)巨大的、動(dòng)態(tài)的、無(wú)結(jié)構(gòu)的、分布的網(wǎng)絡(luò)環(huán)境中,將用戶(hù)查詢(xún)請(qǐng)求與網(wǎng)絡(luò)中的文檔進(jìn)行比較,把查找到的相似度高的一組信息反饋給用戶(hù)的一種信息檢索,也稱(chēng)Web信息檢索。
Web是Internet上信息組織的一種重要形式。Web信息資源是指在超文本(hypertext)傳輸協(xié)議HTTP的基礎(chǔ)上,采用超文本、超媒體(hypermedia)技術(shù),將文本、圖像、圖形、聲音以及視頻集成在一個(gè)頁(yè)面上,并以直觀的圖形用戶(hù)界面提供信息的資源形式。Web信息具有大規(guī)模、分布性、無(wú)結(jié)構(gòu)性、動(dòng)態(tài)性和非規(guī)范性的特點(diǎn)。這些特點(diǎn)對(duì)檢索Web信息帶來(lái)了新的挑戰(zhàn)。例如,具有挑戰(zhàn)性的問(wèn)題之一就是,在構(gòu)建數(shù)字圖書(shū)館時(shí),用戶(hù)如何通過(guò)網(wǎng)絡(luò)快速而有效地檢索出符合用戶(hù)需求的多媒體文檔,并且其信息存儲(chǔ)和用戶(hù)訪問(wèn)不受時(shí)間和地域限制。
Web信息必須以文檔的形式或數(shù)據(jù)庫(kù)的形式有序地組織起來(lái),才便于用戶(hù)搜索和查詢(xún)。按信息組織形式不同,Internet上Web信息的檢索方式主要有下面三種基本形式: 基于超鏈的信息瀏覽、基于目錄索引的信息查詢(xún)、基于搜索引擎的信息檢索。
基于超鏈的信息瀏覽是指通過(guò)超文本/超媒體鏈來(lái)瀏覽Internet,檢索感興趣的信息。聯(lián)機(jī)數(shù)據(jù)庫(kù)檢索中心、期刊報(bào)紙雜志等電子出版物、圖書(shū)館、高校、企業(yè)、政府、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、網(wǎng)上出版物等網(wǎng)絡(luò)機(jī)構(gòu)都有唯一明確的網(wǎng)址。利用瀏覽器可以方便、快捷地獲取感興趣的信息。另外,同一主題或相關(guān)的信息因超級(jí)鏈接構(gòu)成了龐大的無(wú)形的跳躍式的信息網(wǎng),用戶(hù)可以從一個(gè)超文本/超媒體文檔入手,沿著嵌在其中的、自己感興趣的超鏈去搜索信息。這種信息獲取方式在很大程度上取決于超文本文檔所提供的超鏈,搜索的結(jié)果帶有偶然性和片面性。在搜索的過(guò)程中也經(jīng)常遇到線索中斷和偏離用戶(hù)感興趣的主題的情況,降低搜索的效率和效果。另外,這是一種通過(guò)URL獲取Web信息的方式,前提是首先必須知道存放Web信息資源的服務(wù)器地址,即IP地址或域名地址。若不知所要查找的資源地址也難以按鏈搜索信息。
基于目錄索引的信息查詢(xún)是指為了使用戶(hù)能夠全面地掌握Internet上信息資源的分布,根據(jù)信息的主題將網(wǎng)上的資源進(jìn)行分類(lèi),以目錄的形式組織和表現(xiàn)。經(jīng)過(guò)目錄處理的信息資源按照類(lèi)別組織成樹(shù)狀,從根結(jié)點(diǎn)逐層向下從一般類(lèi)別到特殊的分類(lèi)和各級(jí)子類(lèi),用戶(hù)根據(jù)目錄一層一層地查找到所需資源的網(wǎng)址,進(jìn)而到相應(yīng)的網(wǎng)址去查找信息。
搜索引擎作為Web資源的主要檢索工具越來(lái)越受到人們的廣泛關(guān)注。利用搜索引擎檢索信息時(shí),用戶(hù)可以通過(guò)瀏覽器輸入查詢(xún)請(qǐng)求,搜索引擎在事先建立的索引庫(kù)中檢索,然后向用戶(hù)提供感興趣的信息所在的網(wǎng)址。自 1994年以來(lái),已經(jīng)有眾多的Web搜索引擎在Internet上運(yùn)行,Web搜索引擎逐漸成為Web信息檢索利用的主要方式之一。
隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的進(jìn)步,在20世紀(jì)80~90年代,Internet得到蓬勃發(fā)展,成為全球最大的信息資源庫(kù)。Internet的迅速發(fā)展和普及導(dǎo)致網(wǎng)上信息成指數(shù)地增長(zhǎng),也極大地促進(jìn)了信息檢索技術(shù)的發(fā)展和應(yīng)用,信息檢索的對(duì)象不僅僅是可以集中管理的相對(duì)穩(wěn)定的文檔庫(kù),而是開(kāi)放的、動(dòng)態(tài)的、分布的、管理松散的網(wǎng)絡(luò)多媒體信息內(nèi)容。
Web信息檢索的主要目的就是為了使用戶(hù)快速高效地從Internet上搜索到自己感興趣的信息。為此,如何收集分散在Internet上各個(gè)站點(diǎn)的信息;如何分析收集的信息進(jìn)行結(jié)構(gòu)化; 如何建立信息檢索接口使用戶(hù)能得到這些結(jié)構(gòu)化的信息等任務(wù)的完成則是Web信息檢索面臨的主要努力目標(biāo)。
1990年左右,Internet資源的迅猛增長(zhǎng)使主管Internet技術(shù)問(wèn)題工程工作小組(internet engineering task force,IETF)與另外兩個(gè)網(wǎng)絡(luò)機(jī)構(gòu),即歐洲科研網(wǎng)絡(luò)協(xié)會(huì)(association of european research networks)和網(wǎng)絡(luò)信息聯(lián)盟(coalition for networked information)聯(lián)合組建了“網(wǎng)絡(luò)信息檢索工作小組”(network information retrieval working group)。這個(gè)小組的主要任務(wù)是: 收集和發(fā)布有關(guān)網(wǎng)絡(luò)信息檢索工具及其研究團(tuán)體的信息;鼓勵(lì)合作開(kāi)發(fā)網(wǎng)絡(luò)信息檢索工具;協(xié)調(diào)網(wǎng)絡(luò)信息檢索工具開(kāi)發(fā)單位、有關(guān)聯(lián)網(wǎng)機(jī)構(gòu)和網(wǎng)絡(luò)信息檢索工具的生產(chǎn)銷(xiāo)售廠商的行動(dòng)。該小組每季度舉行一次會(huì)議,任何機(jī)構(gòu)都可申請(qǐng)加入。
客戶(hù)&案例
營(yíng)銷(xiāo)資訊
關(guān)于我們
客戶(hù)&案例
營(yíng)銷(xiāo)資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。