知識(shí)庫(kù)系統(tǒng)結(jié)構(gòu)(數(shù)據(jù)庫(kù))
時(shí)間:2022-12-11 02:30:01 | 來(lái)源:信息時(shí)代
時(shí)間:2022-12-11 02:30:01 來(lái)源:信息時(shí)代
知識(shí)庫(kù)系統(tǒng)結(jié)構(gòu) : 知識(shí)在知識(shí)庫(kù)系統(tǒng)中的邏輯表示和物理存儲(chǔ)結(jié)構(gòu),具體應(yīng)由知識(shí)表示、知識(shí)管理及外部接口等部件構(gòu)成。知識(shí)庫(kù)系統(tǒng)一般采用概念—事實(shí)—規(guī)則的知識(shí)表示體系,概念給出了知識(shí)最基本的內(nèi)容,它處在知識(shí)的最底層; 事實(shí)由概念組成,它建立了概念間的聯(lián)系; 規(guī)則由事實(shí)組成,它建立了事實(shí)間的聯(lián)系。因此,概念—事實(shí)—規(guī)則建立了從概念到事實(shí)再到規(guī)則之間的層次構(gòu)造關(guān)系。事實(shí)上數(shù)據(jù)庫(kù)也是一種沒(méi)有規(guī)則的特殊的知識(shí)庫(kù),數(shù)據(jù)庫(kù)的屬性和元組較好地表示了知識(shí)結(jié)構(gòu)中的概念和事實(shí),但沒(méi)有考慮到規(guī)則的表達(dá)。在數(shù)據(jù)庫(kù)中需要建立數(shù)據(jù)模式以規(guī)范數(shù)據(jù)的邏輯結(jié)構(gòu)和物理結(jié)構(gòu),在知識(shí)庫(kù)中則要建立知識(shí)模式以規(guī)范知識(shí)的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)。
與傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)不同,知識(shí)庫(kù)系統(tǒng)的管理對(duì)象不再是簡(jiǎn)單的數(shù)據(jù),而是內(nèi)容更為復(fù)雜、形式更為多樣的“知識(shí)”。它有自己的知識(shí)來(lái)源、知識(shí)獲取渠道、管理系統(tǒng)和特定的用戶。在整個(gè)知識(shí)庫(kù)系統(tǒng)中,每個(gè)部分有著不同的作用。目前普遍認(rèn)為知識(shí)庫(kù)系統(tǒng)是一種資源的集成,一般由知識(shí)庫(kù)、知識(shí)庫(kù)管理系統(tǒng)、用戶接口、知識(shí)獲取接口等基本部件組成,如圖1所示。
圖1 知識(shí)庫(kù)系統(tǒng)一般結(jié)構(gòu)
(1)知識(shí)源是知識(shí)的出處,不管是內(nèi)部知識(shí)還是外部知識(shí),顯性知識(shí)還是隱性知識(shí),都可以作為知識(shí)的來(lái)源。
(2)用戶接口是一種良好的人機(jī)接口,向用戶提供使用知識(shí)庫(kù)的手段。通過(guò)它,用戶可以對(duì)知識(shí)進(jìn)行查詢、檢索、增、刪、改等操作。它通常是一種知識(shí)查詢語(yǔ)言。
(3)知識(shí)獲取接口是完成從知識(shí)源抽取知識(shí),通過(guò)向某一種知識(shí)表示語(yǔ)言轉(zhuǎn)換,并實(shí)現(xiàn)知識(shí)同化的功能部件。知識(shí)的形式是多種多樣的,如果不對(duì)它進(jìn)行統(tǒng)一規(guī)范的表示,就很難進(jìn)行有效的管理。作為用戶建立知識(shí)庫(kù)的接口,知識(shí)獲取接口能使用戶比較方便地把外部的知識(shí)安裝到知識(shí)庫(kù)中。
(4)知識(shí)庫(kù)管理系統(tǒng)是對(duì)知識(shí)庫(kù)進(jìn)行管理、控制,完成對(duì)知識(shí)庫(kù)的各類操作,并向用戶提供查詢、檢索手段的計(jì)算機(jī)軟件系統(tǒng)。它包括系統(tǒng)的維護(hù)與診斷、系統(tǒng)日常事務(wù)管理、各種實(shí)用程序的管理、出錯(cuò)處理、知識(shí)庫(kù)系統(tǒng)的安全控制和用戶的使用權(quán)限管理等。也有學(xué)者從實(shí)現(xiàn)知識(shí)推理這個(gè)角度認(rèn)為知識(shí)庫(kù)管理系統(tǒng)還應(yīng)該包含一個(gè)推理機(jī)構(gòu),它可以完成對(duì)知識(shí)的操縱,包括知識(shí)的演繹檢索,利用知識(shí)解釋輸入的數(shù)據(jù)或事實(shí),推導(dǎo)出用戶所需的結(jié)論等。
(5)知識(shí)庫(kù)是知識(shí)的存儲(chǔ)機(jī)構(gòu),它是按一定要求存儲(chǔ)在計(jì)算機(jī)中相互關(guān)聯(lián)的某種事實(shí)、規(guī)則的集合,是經(jīng)過(guò)分類、組織和序化的知識(shí)集合,是構(gòu)造知識(shí)庫(kù)系統(tǒng)的核心和基礎(chǔ),其中包含了概念、事實(shí)和規(guī)則。知識(shí)庫(kù)不同于傳統(tǒng)數(shù)據(jù)庫(kù),它是在傳統(tǒng)數(shù)據(jù)庫(kù)的基礎(chǔ)上,有針對(duì)性、有目的地從中抽取知識(shí)點(diǎn),按一定的知識(shí)體系進(jìn)行整理和分析而組織起來(lái)的,需要建立知識(shí)表示模式以規(guī)范知識(shí)的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)。目前的一種存儲(chǔ)結(jié)構(gòu)是可以把一個(gè)規(guī)則中的前件或后件稱作知識(shí)結(jié)點(diǎn),前件知識(shí)結(jié)點(diǎn)定義為內(nèi)部結(jié)點(diǎn),后件知識(shí)結(jié)點(diǎn)定義為出口結(jié)點(diǎn); 結(jié)點(diǎn)和結(jié)點(diǎn)之間的關(guān)系就構(gòu)成了知識(shí)單元。
圖2 知識(shí)庫(kù)知識(shí)單元圖結(jié)構(gòu)示意圖
圖2是知識(shí)庫(kù)知識(shí)單元圖的結(jié)構(gòu)示意圖,其中,U→U
1構(gòu)成的知識(shí)單元中,知識(shí)結(jié)點(diǎn)U
1為規(guī)則中的前件,知識(shí)結(jié)點(diǎn)U為規(guī)則中的后件,以此類推。U所代表的是某一領(lǐng)域知識(shí)的規(guī)則體系,該規(guī)則體系中的規(guī)則構(gòu)成層次結(jié)構(gòu),但也不排除網(wǎng)狀結(jié)構(gòu); E代表的則是類似于U的另一規(guī)則體系。
知識(shí)庫(kù)的第一級(jí)邏輯存儲(chǔ)結(jié)構(gòu)可以用圖矩陣表示。知識(shí)庫(kù)中所有的知識(shí)結(jié)點(diǎn)以其關(guān)鍵字的鍵值為權(quán)值從小到大順次排列形成知識(shí)結(jié)點(diǎn)行向量和列向量,構(gòu)成圖矩陣(如表1所示)。
表1 圖2對(duì)應(yīng)的圖矩陣
| | U | U1 | U2 | U3 | U4 | U5 | U6 | U7 | U8 | U9 |
| | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
U | 1 | | | | | | | | | | K1,10 |
U1 | 2 | K2,1 | | | | | | | | | |
U2 | 3 | K3,1 | | | | | | K3,7 | K3,8 | | |
U3 | 4 | K4,1 | | | | | | | K4,8 | | |
U4 | 5 | K5,1 | | | | | | | | | |
U5 | 6 | | K6,2 | | | | | | | | |
U6 | 7 | | K7,2 | | | | | | | | |
U7 | 8 | | | | | K8,5 | | | | | |
U8 | 9 | | | | | K9,5 | | | | | |
U9 | 10 | | | | | K10,5 | | | | | |
知識(shí)庫(kù)的二級(jí)邏輯結(jié)構(gòu)可以用二維鏈表表示。圖矩陣是一個(gè)二維關(guān)系,各種知識(shí)表示在該矩陣中都能給出簡(jiǎn)單直觀的表示形式。但該矩陣是一個(gè)稀疏矩陣,矩陣中非零元素的位置也沒(méi)有固定的規(guī)律可循,對(duì)于規(guī)則和知識(shí)點(diǎn)數(shù)量龐大的知識(shí)庫(kù)而言,容易造成計(jì)算資源浪費(fèi)。采用二維鏈表的數(shù)據(jù)結(jié)構(gòu)直接存儲(chǔ)圖矩陣的非零元素可提高效率(如圖3所示)。
圖3 表1圖矩陣對(duì)應(yīng)的二維鏈表結(jié)構(gòu)
圖矩陣中一個(gè)非零項(xiàng)對(duì)應(yīng)一個(gè)鏈結(jié)點(diǎn),鏈結(jié)點(diǎn)中定義一個(gè)左指針、一個(gè)右指針,它聯(lián)系圖矩陣中行向和列向鏈結(jié)點(diǎn)。編程實(shí)現(xiàn)時(shí)鏈結(jié)點(diǎn)對(duì)應(yīng)一個(gè)基類,基類中定義了規(guī)則中條件事實(shí)項(xiàng)、結(jié)論事實(shí)項(xiàng)(即知識(shí)結(jié)點(diǎn))間連接關(guān)系的數(shù)據(jù)結(jié)構(gòu)和關(guān)于鏈結(jié)點(diǎn)的各種操作。一個(gè)規(guī)則對(duì)應(yīng)一個(gè)超類,該超類中定義了規(guī)則之間關(guān)聯(lián)關(guān)系的數(shù)據(jù)結(jié)構(gòu)和對(duì)規(guī)則所進(jìn)行的各種操作。有同一結(jié)論事實(shí)項(xiàng)的各規(guī)則構(gòu)成二維鏈表中的各列結(jié)點(diǎn)鏈,列鏈結(jié)點(diǎn)對(duì)應(yīng)一個(gè)更高級(jí)別的超類,該超類中定義了列鏈結(jié)點(diǎn)之間關(guān)聯(lián)關(guān)系的數(shù)據(jù)結(jié)構(gòu)和關(guān)于列的各種操作。
知識(shí)庫(kù)管理系統(tǒng)必須支持對(duì)知識(shí)庫(kù)中規(guī)則的快速查詢以及存取、增刪等操作,并且能對(duì)規(guī)則的各條件事實(shí)項(xiàng)和結(jié)論事實(shí)項(xiàng)進(jìn)行編輯、修改。因此二維鏈表中的各列鏈被作為一個(gè)記錄進(jìn)行連續(xù)存儲(chǔ)(如圖4所示),鏈結(jié)點(diǎn)作為記錄的不等長(zhǎng)數(shù)據(jù)項(xiàng)存儲(chǔ)。為了便于對(duì)知識(shí)結(jié)點(diǎn)主要信息的搜索,記錄的關(guān)鍵字值和指針與記錄的其他信息分開(kāi)存入主文件中,采用適當(dāng)?shù)奈募M織方法進(jìn)行文件組織。
記錄關(guān)鍵字 | 鏈結(jié)1 | 鏈結(jié)2 | … | 鏈結(jié)i | … | 鏈結(jié)j |
圖4 某鏈節(jié)列記錄構(gòu)造