數(shù)字圖書(shū)館已經(jīng)形成一個(gè)新的學(xué)科,其成員來(lái)自不同學(xué)科,是學(xué)科綜" />
時(shí)間:2022-11-22 16:30:01 | 來(lái)源:信息時(shí)代
時(shí)間:2022-11-22 16:30:01 來(lái)源:信息時(shí)代
數(shù)字圖書(shū)館技術(shù) : 對(duì)數(shù)字圖書(shū)館應(yīng)用的技術(shù),包括內(nèi)容創(chuàng)建與獲取技術(shù)、存儲(chǔ)和管理技術(shù)、互操作技術(shù)及數(shù)字產(chǎn)權(quán)管理技術(shù)等。
數(shù)字圖書(shū)館已經(jīng)形成一個(gè)新的學(xué)科,其成員來(lái)自不同學(xué)科,是學(xué)科綜合化的典型代表。因此,數(shù)字圖書(shū)館建設(shè)所使用的技術(shù)也是多學(xué)科的。數(shù)字圖書(shū)館使用的技術(shù)主要有以下幾個(gè)方面:
(1) 內(nèi)容的創(chuàng)建和獲取: 是資源的數(shù)字化工作。數(shù)字化技術(shù)是指把原始的聲音、文字、圖像等信息,用間斷的電磁脈沖(用0和1代表)來(lái)獲取、存儲(chǔ)、處理和傳遞。目前創(chuàng)建與獲取數(shù)字化資源的方式主要有以下幾種:①錄入: 即采用計(jì)算機(jī)進(jìn)行文字錄入,這種方式是新文本產(chǎn)生的主要形式。②掃描: 它是能夠快速地將大量印刷型資源進(jìn)行數(shù)字化的技術(shù)。具體做法是采用光學(xué)掃描儀與數(shù)字相機(jī)等,將現(xiàn)有的紙質(zhì)文獻(xiàn)經(jīng)模數(shù)轉(zhuǎn)換成位圖,以便計(jì)算機(jī)處理。③數(shù)字化文件壓縮存儲(chǔ): 數(shù)字圖書(shū)館數(shù)據(jù)規(guī)模是海量的,數(shù)字媒介的主要存儲(chǔ)方式有光碟、文件服務(wù)器和磁盤(pán)陣列等。數(shù)字圖書(shū)館中占比重大的是多媒體數(shù)據(jù),需要對(duì)多媒體數(shù)據(jù)壓縮保存,借助于數(shù)據(jù)庫(kù)技術(shù)進(jìn)行管理,以提高信息的可用性。④光學(xué)字符識(shí)別(OCR):使用計(jì)算機(jī)軟件將掃描的圖像文獻(xiàn)轉(zhuǎn)換成字符文本的方法。轉(zhuǎn)換成文本的最大好處是能夠全文檢索。
(2)存儲(chǔ)和管理:是數(shù)字圖書(shū)館的核心技術(shù)。存儲(chǔ)方式?jīng)Q定了應(yīng)用方式,存儲(chǔ)方案決定整個(gè)系統(tǒng)的擴(kuò)展性和靈活性。數(shù)字圖書(shū)館技術(shù)的信息管理包括自動(dòng)索引、建檔、特征抽取和翻譯功能。利用先進(jìn)的組織和篩選工具進(jìn)行歸類(lèi),讓用戶(hù)能夠以他們的本國(guó)語(yǔ)言進(jìn)行特定信息的查詢(xún)。數(shù)字圖書(shū)館將關(guān)系數(shù)據(jù)庫(kù)技術(shù)、對(duì)象技術(shù)和多媒體等多種技術(shù)的功能集合在一起,使用關(guān)系數(shù)據(jù)庫(kù)來(lái)管理表格,進(jìn)行數(shù)據(jù)的索引和查詢(xún); 通過(guò)對(duì)象服務(wù)器運(yùn)用集成的分級(jí)存儲(chǔ)管理方法,連接磁盤(pán)、磁帶、光碟等外存儲(chǔ)器。
元數(shù)據(jù)是建設(shè)全球數(shù)字圖書(shū)館的基礎(chǔ)性關(guān)鍵問(wèn)題,是對(duì)數(shù)字圖書(shū)館中的數(shù)字化資源進(jìn)行管理首先要解決的內(nèi)容。元數(shù)據(jù)的主要研究問(wèn)題有: 元數(shù)據(jù)和資源相聯(lián)系的模型; 服務(wù)中介元數(shù)據(jù); 元數(shù)據(jù)的生成和管理; 與信息體系結(jié)構(gòu)標(biāo)準(zhǔn)的集成; 構(gòu)建注冊(cè)系統(tǒng); 人和機(jī)器都可以理解的表達(dá)模式; 核心元數(shù)據(jù)集(dublin core是現(xiàn)在研究比較多的有關(guān)資源描述的核心元數(shù)據(jù)集); 互操作性和復(fù)雜性; 復(fù)雜數(shù)字資源(如聲頻、視頻資源、動(dòng)態(tài)變化的對(duì)象)元數(shù)據(jù);評(píng)測(cè)和衡量各種元數(shù)據(jù)標(biāo)準(zhǔn)和提案的可應(yīng)用性、成本、效益; 相關(guān)政策規(guī)范制定等。
(3)查詢(xún)和訪(fǎng)問(wèn):數(shù)字圖書(shū)館的目標(biāo)是提供分布式存儲(chǔ)信息的知識(shí)化組織和智能化訪(fǎng)問(wèn)。數(shù)字圖書(shū)館的訪(fǎng)問(wèn)工具主要包括文本和圖像分析工具以及數(shù)字化音頻和視頻信息的查詢(xún)工具。用戶(hù)在使用自由文本查詢(xún)工具進(jìn)行查詢(xún)時(shí),查詢(xún)結(jié)果是一個(gè)按序列值排列的文件列表,相關(guān)概率最大的文件排在最前面。數(shù)字圖書(shū)館查詢(xún)方案還利用自然語(yǔ)言處理技術(shù)和按語(yǔ)言語(yǔ)義統(tǒng)計(jì)對(duì)文檔排序技術(shù),提供基于概念的正文檢索系統(tǒng)。圖像內(nèi)容查詢(xún)是圖像信息查詢(xún)的全新研究領(lǐng)域,用戶(hù)可按照?qǐng)D像的顏色、灰度、紋理和位置進(jìn)行查詢(xún)。查詢(xún)要求將以圖形方式表達(dá),如從顏色表中選取顏色,或從例圖中選擇圖像的紋理等。
在數(shù)字圖書(shū)館中,高效的分布式檢索形成全新信息應(yīng)用類(lèi)型、信息類(lèi)型、用戶(hù)交互方式和商業(yè)模式。分布式查詢(xún)的研究主要集中在以下幾個(gè)方面:①提高搜索引擎的高效性; ②提高多種格式文獻(xiàn)的分布式索引(以harvest系統(tǒng)為代表); ③探索對(duì)分布式資源進(jìn)行有效查詢(xún)的新協(xié)議和技術(shù),如Stanford大學(xué)的元搜索;④元搜索(meta-searching)協(xié)議:如斯坦福大學(xué)數(shù)字圖書(shū)館項(xiàng)目提出的聯(lián)邦搜索協(xié)議(STARTS),基于內(nèi)容的路由技術(shù)(GIOSS),Cornell大學(xué)的全球數(shù)字圖書(shū)館Dienst。
(4)交互式用戶(hù)界面:是數(shù)字圖書(shū)館的重要組成部分,是系統(tǒng)展現(xiàn)在用戶(hù)面前的窗口。數(shù)字圖書(shū)館的用戶(hù)界面,要讓用戶(hù)使用時(shí)得心應(yīng)手,能夠友好、直觀(guān)、方便,并具有個(gè)性化、智能化的特性,充分利用圖形、語(yǔ)音,將其融為一體,設(shè)計(jì)出比較好的界面。
(5)互操作:研究不同的數(shù)字圖書(shū)館資源和服務(wù)的集成。互操作是構(gòu)建大型數(shù)字圖書(shū)館的基礎(chǔ)性問(wèn)題,互操作研究的主要問(wèn)題有: 建立一個(gè)全球統(tǒng)一的數(shù)據(jù)視圖,用以表達(dá)集成的數(shù)據(jù)和所提供的服務(wù)結(jié)構(gòu)和語(yǔ)義; 協(xié)調(diào)和控制,精化資源描述語(yǔ)言,應(yīng)付動(dòng)態(tài)的變化: 一致性問(wèn)題,即如何為不同的自治服務(wù)提供事務(wù)執(zhí)行的保證; 查詢(xún)處理,不同信息資源的查詢(xún)規(guī)范化、查詢(xún)?cè)u(píng)價(jià)和查詢(xún)路由,相關(guān)性反饋; 實(shí)現(xiàn)機(jī)制,如CORBA、DCOM等。
OAI(open archive initiative)的開(kāi)放文檔元數(shù)據(jù)采集協(xié)議(open archive metadata harvesting protocol,OAIMH)是數(shù)字圖書(shū)館在元數(shù)據(jù)互操作領(lǐng)域的重要協(xié)議。OAI是一個(gè)旨在促進(jìn)網(wǎng)絡(luò)信息資源開(kāi)發(fā)、發(fā)布與共享的合作組織。1999年10月由圖書(shū)館和信息資源委員會(huì)(CLIR)、數(shù)字圖書(shū)館聯(lián)盟(DLF)等組織發(fā)起,在新墨西哥州的Santa Fe召開(kāi)的會(huì)議上第一次提出了OAI的設(shè)想。OAIMH的目標(biāo)是通過(guò)元數(shù)據(jù)采集模式實(shí)現(xiàn)在Web上發(fā)布信息的不同組織之間的互操作,為其提供一個(gè)與應(yīng)用無(wú)關(guān)的元數(shù)據(jù)互操作框架。
(6)多語(yǔ)言信息訪(fǎng)問(wèn):是數(shù)字圖書(shū)館中一個(gè)突出問(wèn)題。其研究可以分為三類(lèi): 用戶(hù)需求、技術(shù)和資源。構(gòu)建必需的體系結(jié)構(gòu),以研究用戶(hù)與多語(yǔ)言信息交互的方式,研究如何幫助用戶(hù)克服語(yǔ)言障礙。多語(yǔ)言信息訪(fǎng)問(wèn)不是一個(gè)簡(jiǎn)單的由“信息檢索+機(jī)器翻譯+資源”構(gòu)成的通道。技術(shù)研究領(lǐng)域包括: 多語(yǔ)言索引工具、用戶(hù)查詢(xún)處理、文檔聚類(lèi)、檢索結(jié)果的自動(dòng)總結(jié)、可視化工具、多語(yǔ)言的多媒體訪(fǎng)問(wèn)等。開(kāi)發(fā)系列的優(yōu)秀多語(yǔ)言資源對(duì)于實(shí)現(xiàn)實(shí)用系統(tǒng)至關(guān)重要。
(7)與知識(shí)產(chǎn)權(quán)和經(jīng)濟(jì)有關(guān)的問(wèn)題:是擁有高質(zhì)量?jī)?nèi)容的數(shù)字圖書(shū)館大范圍應(yīng)用的最大障礙,合理的經(jīng)濟(jì)模型是在分布的、自治的數(shù)字圖書(shū)館中獲取、傳播資源和激勵(lì)高質(zhì)量資源生產(chǎn)的基礎(chǔ)。知識(shí)產(chǎn)權(quán)和經(jīng)濟(jì)問(wèn)題是數(shù)字圖書(shū)館研究中相當(dāng)復(fù)雜的問(wèn)題。知識(shí)產(chǎn)權(quán)和經(jīng)濟(jì)的問(wèn)題可分為三個(gè)方面: ①法律和社會(huì)政策方面,制訂網(wǎng)絡(luò)環(huán)境下適用于電子資源的知識(shí)產(chǎn)權(quán)和經(jīng)濟(jì)管理法規(guī)和機(jī)制; ②數(shù)字圖書(shū)館的體系結(jié)構(gòu)設(shè)計(jì)方面,制訂支持相關(guān)知識(shí)產(chǎn)權(quán)和經(jīng)濟(jì)的政策框架; ③內(nèi)容和服務(wù)方面,為內(nèi)容和服務(wù)的提供者提供知識(shí)產(chǎn)權(quán)保障、場(chǎng)景的信息融合。
數(shù)字圖書(shū)館的數(shù)字產(chǎn)權(quán)管理(digital rights management,DRM),包含對(duì)各種有形和無(wú)形資源產(chǎn)權(quán)使用的描述、標(biāo)識(shí)、交易、保護(hù)、監(jiān)測(cè)和跟蹤。具有知識(shí)產(chǎn)權(quán)管理的數(shù)字圖書(shū)館是一種數(shù)字化的產(chǎn)權(quán)管理系統(tǒng)(digital asset management system ,DAMS),擁有高質(zhì)量的資源,為教育及其他領(lǐng)域提供高質(zhì)量的服務(wù)。
客戶(hù)&案例
營(yíng)銷(xiāo)資訊
關(guān)于我們
客戶(hù)&案例
營(yíng)銷(xiāo)資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。