国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 信息時代 > 信息檢索模型(數(shù)據(jù)庫)

信息檢索模型(數(shù)據(jù)庫)

時間:2022-12-02 10:30:01 | 來源:信息時代

時間:2022-12-02 10:30:01 來源:信息時代

    信息檢索模型 : 對文檔和查詢進(jìn)行表示以及對它們之間的相關(guān)性進(jìn)行描述的模型。它由三元組F[D,Q,R(qi,dj)]表示。其中D是文檔的表示,Q是查詢的表示。R(qi,dj)是一個排序函數(shù),該函數(shù)輸出一個與查詢qi∈Q和文檔表示dj∈D關(guān)聯(lián)的實數(shù)。這樣就在文檔之間根據(jù)查詢qi定義了一個按相關(guān)性高低排序的順序。通過構(gòu)建檢索模型,可以度量用戶查詢請求與文檔集之間的相關(guān)性,并根據(jù)相關(guān)性對檢索結(jié)果排序。
由于早期的(或是傳統(tǒng)的)信息檢索是對純文本信息進(jìn)行檢索,各種信息檢索模型也是在檢索文本文檔的基礎(chǔ)上發(fā)展成熟的。為了實現(xiàn)信息檢索,用戶查詢和文檔集合都需要轉(zhuǎn)換成某種內(nèi)部表示形式。檢索系統(tǒng)根據(jù)查詢表示,對文檔集合中的所有文檔進(jìn)行相似性匹配,獲取與用戶查詢相關(guān)的文檔。
按照相似匹配度量模式的不同,可以分為兩大類,全文(full-text)檢索和內(nèi)容型(content-based)檢索。全文檢索是以從文檔中找出與查詢表示的字符串完全一致的部分為目的,檢索結(jié)果返回包含查詢字符串的文檔及其位置。在內(nèi)容型檢索中,不必像全文檢索那樣進(jìn)行完全一致匹配,而是著眼于找出與查詢語義相似的文檔。
全文檢索模型又可以分為兩種類型: 一個字符一個字符地與文檔中字符匹配的順序檢索(sequential search),和采用事先由文檔(字符或是詞匯)建立的索引(index)進(jìn)行索引檢索(index search)。實現(xiàn)全文檢索的模型有: 布爾模型(boolean model)、基于半無限字符串模型(semi-infinite string)、字符串匹配模型等。
在內(nèi)容型檢索中,需要提取一組描述文檔內(nèi)容的詞匯,稱為索引項(term),用索引項的出現(xiàn)次數(shù)等來表示文檔和查詢請求。計算文檔和查詢請求間的相似度并依據(jù)大小排序輸出檢索結(jié)果。實現(xiàn)內(nèi)容型檢索的模型有: 向量空間模型(vector space model)、概率模型(probabilistic model)、網(wǎng)絡(luò)模型(network model)等。
表1是幾種信息檢索模型不同的內(nèi)部表示及匹配方法對照表,在實際應(yīng)用中,不同模型可以混合使用以求得最佳檢索效果。此外,對于各種模型都有不同的改進(jìn)模式。例如,布爾模型為二元邏輯,沒有對索引項采用加權(quán)處理,檢索出的文檔與查詢請求要么相關(guān)要么不相關(guān),無法進(jìn)行相關(guān)性排序。擴(kuò)展布爾模型則在布爾模型的基礎(chǔ)上,結(jié)合向量空間模型的局部匹配、索引項加權(quán)等思想實現(xiàn)了檢索結(jié)果的相關(guān)性排序。改進(jìn)的模型還有模糊布爾模型、廣義向量空間模型和潛在語義索引模型、神經(jīng)網(wǎng)絡(luò)模型、推理網(wǎng)絡(luò)模型等。

表1 信息檢索模型不同的內(nèi)部表示及匹配方法對照表


檢索
模型
文檔內(nèi)
部表示
檢索查詢
內(nèi)部表示
匹配
方法
向量空間模型索引項
權(quán)重向量
索引項
權(quán)重向量
向量間相
似度計算
布爾模型簽名文件簽名文件邏輯運(yùn)算+
順序查找
倒排文件檢索詞邏輯
表達(dá)式
邏輯
運(yùn)算
基于半無限字符串
(semi-infinite string)
的模型
PATRICIA TRIE字符串樹查找
PAT數(shù)組字符串二分查找
字符串匹配字符串間
的比較

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉