(1)流式文檔:一種最簡單的文檔結(jié)構(gòu)。它在文字上沒有排列順序" />
時間:2022-11-07 02:30:01 | 來源:信息時代
時間:2022-11-07 02:30:01 來源:信息時代
情報數(shù)據(jù)庫的文檔結(jié)構(gòu) : 情報數(shù)據(jù)庫中每條記錄的編排方式,主要有四種文檔結(jié)構(gòu),即流式文檔、順排文檔、索引文檔和倒排文檔。
(1)流式文檔:一種最簡單的文檔結(jié)構(gòu)。它在文字上沒有排列順序,連續(xù)地存放數(shù)據(jù)記錄,不考慮各記錄間的相互關(guān)系。表1所示即為一個流式文檔。由于這種文檔結(jié)構(gòu)中記錄的排列順序可以任意,因而,當(dāng)把新記錄插入該類文檔時,可以把新記錄增加到文檔的最后,無需改變文檔中原有記錄的順序。在流式文檔中無法預(yù)先知道目標(biāo)記錄所在位置,檢索系統(tǒng)需要順序查找整個文檔,因而檢索效率較低,平均需要匹配(n+1)/2次才能檢索到目標(biāo)記錄,這里n代表文檔中記錄的數(shù)目。
表1 流式文檔
位置號 | 作者 | 題名 | 主題詞 |
1 | 張立公 | 計算機(jī)情報技術(shù)導(dǎo)論 | 計算機(jī),情報學(xué) |
2 | 賴茂生 | 計算機(jī)情報檢索 | 計算機(jī),情報檢索 |
… | |||
M | 康耀紅 | 現(xiàn)代情報檢索理論 | 情報檢索,方法論 |
… | |||
P | 張琪玉 | 情報語言學(xué)基礎(chǔ) | 情報檢索,語言學(xué) |
新記錄 | 鄒志仁 | 信息學(xué)概論 | 情報學(xué) |
表2 順排文檔
位置號 | 作者 | 題名 | 主題詞 |
1 | 康耀紅 | 現(xiàn)代情報檢索理論 | 情報檢索,方法論 |
2 | 賴茂生 | 計算機(jī)情報檢索 | 計算機(jī),情報檢索 |
… | |||
新記錄H | 鄒志仁 | 信息學(xué)概論 | 情報學(xué) |
… | |||
J | 張立公 | 計算機(jī)情報技術(shù)導(dǎo)論 | 計算機(jī),情報學(xué) |
K | 張琪玉 | 情報語言學(xué)基礎(chǔ) | 情報檢索,語言學(xué) |
… |
表3 順排文檔的索引
作者姓名音序 | 文獻(xiàn)位置 |
… | … |
Kang | 1 |
Lai | 2 |
… | … |
Zhang | J |
… | … |
表4 主題詞倒排文檔
主題詞 | 記錄號 |
方法論 | 1 |
計算機(jī) | 2,J |
情報檢索 | 1,2,K |
情報學(xué) | H,J |
語言學(xué) | K |
… |
表5 作者倒排文檔
作者 | 記錄號 |
康耀紅 | 1 |
賴茂生 | 2 |
鄒志仁 | H |
張立公 | J |
張琪玉 | K |
… |
微信公眾號
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。