基于網(wǎng)格的面向?qū)I(yè)內(nèi)容的Web信息檢索體系結(jié)構(gòu)
(作者未知) 2009/10/18
(接上頁)可以對信息進(jìn)行自我描述的語言,它允許開發(fā)人員通過創(chuàng)建格式文件DTD(Document Type Definitions)定制標(biāo)記來描述自己的數(shù)據(jù),DTD規(guī)范是一個(gè)用來定義XML文件的語法、句法和數(shù)據(jù)結(jié)構(gòu)的標(biāo)準(zhǔn)。 XML使用普通文本,因此具有跨平臺的優(yōu)點(diǎn),XML的優(yōu)點(diǎn)在于
(1)簡單、規(guī)范性:XML文檔基于文本標(biāo)簽,有一套嚴(yán)謹(jǐn)而簡潔的語法結(jié)構(gòu),便于計(jì)算機(jī)、用戶理解;
(2)可擴(kuò)展性:用戶可以自定義具有特定意義的標(biāo)簽,自定義的標(biāo)簽可以在任何組織、客戶、應(yīng)用之間共享;
(3)自描述性:自描述性使其非常適用不同應(yīng)用間的數(shù)據(jù)交換,而且這種交換是不以預(yù)先定義一組數(shù)據(jù)結(jié)構(gòu)為前提,因此具有很強(qiáng)的開放性;
(4)互操作性:XML可以把所有信息都存于文檔中傳輸,而遠(yuǎn)程的應(yīng)用程序又可以從中提取需要的信息。XML數(shù)據(jù)是不依賴于某個(gè)特定的平臺的應(yīng)用,因此它為基于特定專業(yè)內(nèi)容的表達(dá)提供了一種極好的手段,可以作為表示專業(yè)內(nèi)容的語言。
目前人們研制Web信息集成系統(tǒng)其基本方法可分成兩類:存入倉庫法(the ware-housing approach)和虛擬法(the virtual approach),可使用這兩類方法利用XML在數(shù)據(jù)組織和交換方面的優(yōu)越性,采用格式文件DTD和XML文檔表示基于專業(yè)內(nèi)容的集成模式和集成模式與資源之間的映射,建立基于XML的Web信息集成系統(tǒng),其結(jié)構(gòu)與獲取信息的工作過程參見[2]。
2.2 網(wǎng)格中間件的設(shè)計(jì)
圖3所示的網(wǎng)格中間件的主要功能是
(1)消除不同用戶與集群系統(tǒng)之間數(shù)據(jù)表達(dá)的差異,使信息資源數(shù)據(jù)對用戶來說是透明的;
(2)管理、維護(hù)Web上分布的各集群系統(tǒng),網(wǎng)格中間件以關(guān)系數(shù)據(jù)庫方式記錄所有集群系統(tǒng)及其所包含的專業(yè)的邏輯信息,對關(guān)系數(shù)據(jù)庫的操作可維護(hù)集群系統(tǒng)的分布式邏輯,使本結(jié)構(gòu)在可變性和擴(kuò)充性上具有柔性;
(3)接受用戶的信息請求任務(wù),能快速定位于滿足要求的集群系統(tǒng),通過對關(guān)系數(shù)據(jù)庫的查詢實(shí)現(xiàn)用戶信息請求任務(wù)與集群系統(tǒng)的對應(yīng)關(guān)系。
內(nèi)部主要功能模塊說明如下:
(1)接收Agent模塊:主要用于登記、接收、管理各種信息資源請求任務(wù),并提供安全認(rèn)證和授權(quán)。
(2)關(guān)系數(shù)據(jù)庫及數(shù)據(jù)服務(wù)Agent: 關(guān)系數(shù)據(jù)庫記錄了所有集群系統(tǒng)及其所包含的專業(yè)內(nèi)容的邏輯信息。數(shù)據(jù)服務(wù)Agent提供集群系統(tǒng)對關(guān)系數(shù)據(jù)庫的使用權(quán)限和對數(shù)據(jù)記錄的增加、刪除、檢索和修改等操作。
(3)格式轉(zhuǎn)換Agent模塊:提供用戶信息資源請求文檔與各集群系統(tǒng)中文檔的格式轉(zhuǎn)換功能。由于XML是自定義的,各用戶對同一數(shù)據(jù)有不同的表示(對信息資源描述存在差異)由于XML文檔中這種格式差異體現(xiàn)在與之相關(guān)的DTD/Schema上,因此經(jīng)過格式轉(zhuǎn)換,可使信息資源的格式對用戶是透明的。
(4)XML文檔Agent模塊:提取格式轉(zhuǎn)換后的XML文檔中各個(gè)標(biāo)簽,通過查詢網(wǎng)格中間件中的關(guān)系數(shù)據(jù)庫,實(shí)現(xiàn)用戶信息請求任務(wù)與集群系統(tǒng)的對應(yīng)關(guān)系,并得到滿足條件的集群系統(tǒng)的相關(guān)信息,獲取各集群系統(tǒng)的接口參數(shù)。
(5)發(fā)送Agent模塊:將轉(zhuǎn)換過的信息資源請求XML文檔發(fā)送到相應(yīng)的集群系統(tǒng)中。
其中Agent技術(shù)是解決分布式智能的關(guān)鍵技術(shù),Agent是指能夠自主地、連續(xù)地在一動(dòng)態(tài)變化的、存在于其它系統(tǒng)中運(yùn)行的、且不斷于環(huán)境交互的實(shí)體。在系統(tǒng)中引入Agent可使系統(tǒng)具有人的特征,代表用戶完成用戶的任務(wù),并能動(dòng)態(tài)適應(yīng)環(huán)境的變化更好地滿足用戶的需求,提高信息檢索的能力。
3、工作過程
要使本體系結(jié)構(gòu)具有高協(xié)作性和互操作性,用戶、網(wǎng)格中間件、集群系統(tǒng)以及其它Agent等實(shí)體之間的通信是整個(gè)系統(tǒng)運(yùn)轉(zhuǎn)的關(guān)鍵。由于XML為基于特定專業(yè)內(nèi)容的表達(dá)提供了一種極好的手段,XML是一種元語言,其嚴(yán)格的定義和規(guī)則集使人和機(jī)器都能更容易的閱讀文檔,因此本文將XML集成到各部分的通信語言中,在用戶發(fā)出的信息檢索請求文檔、網(wǎng)格中間件、集群系統(tǒng)之間的通信均利用XML定義,這樣做增強(qiáng)了通信的語義信息和靈活性并可以在多種平臺使用,并且基于XML的通信語言其通信內(nèi)容的表達(dá)比其它方法更容易開發(fā)語法分析器。
具體的工作過程如下:
(1)請求、定位過程:由網(wǎng)格用戶層向網(wǎng)格中間件發(fā)送用戶的信息檢索請求文檔,描述網(wǎng)格接口參數(shù)、信息請求內(nèi)容等,在接受Agent進(jìn)行身份確認(rèn)及權(quán)限確認(rèn)后,經(jīng)文檔格式轉(zhuǎn)換Agent模塊、文檔分析Agent模塊、發(fā)送Agent模塊處理后,定位于某些特定的集群系統(tǒng)服務(wù)器。
(2)應(yīng)答、處理過程:集群系統(tǒng)服務(wù)器經(jīng)驗(yàn)證、調(diào)(未完,下一頁)
|