WEB中圖像的檢索技術(shù)研究
資源天下 2018/10/29 17:23:28
(接上頁)可以從已知的鏈接開始收集網(wǎng)頁數(shù)據(jù),只有小部分Web網(wǎng)頁和這些已知的網(wǎng)頁有鏈接;現(xiàn)在為止還沒有一個(gè)搜索引擎可以隨網(wǎng)頁內(nèi)容的更新而比較及時(shí)地更新索引;
(2)覆蓋面:地理上的覆蓋面和主題的覆蓋面;
(3)索引更新頻率:不同類型的搜索引擎,索引更新頻率相差非常大,有的是幾月,有的是一年。索引更新頻率一般有兩種定義,一種用的比較少的定義是新的網(wǎng)頁能被收進(jìn)索引數(shù)據(jù)庫中,另外一種是同一頁多長(zhǎng)時(shí)間才會(huì)被檢查一次,有必要時(shí)會(huì)更新索引。有的搜索引擎會(huì)對(duì)時(shí)常更新的網(wǎng)頁和訪問人數(shù)多的網(wǎng)頁進(jìn)行更加頻繁的重建索引;
(4)采集過程:采集可分為寬度優(yōu)先、深度優(yōu)先兩種算法;一般認(rèn)為寬度優(yōu)先對(duì)擴(kuò)大內(nèi)容覆蓋面有幫助,深度優(yōu)先算法可以提供更多細(xì)節(jié)資料;
(5)索引算法:有的搜索引擎只會(huì)處理元標(biāo)記和一小部分文檔內(nèi)容,而另外有一些搜索引擎則是會(huì)對(duì)全文進(jìn)行索引;
(6)結(jié)果顯示:有的搜索引擎只會(huì)顯示網(wǎng)頁標(biāo)題,有些的話則有更詳細(xì)的一些信息,比如說網(wǎng)頁的內(nèi)容,更新日期等;
(7)查詢算法:一個(gè)優(yōu)秀的查詢算法是非常重要的,最基本的布爾查詢,短語查詢,有些搜索引擎還會(huì)提供指定屬性的查詢,比如說可以指定對(duì)網(wǎng)頁作者、主題進(jìn)行查詢。另外有些搜索引擎還采用了相關(guān)度的反饋、概念查詢等算法;
(8)用戶界面:大多數(shù)搜索引擎都提供了簡(jiǎn)單和高級(jí)查詢兩個(gè)界面。并有必要的幫助和示范。
1.3 圖像檢索的發(fā)展方向
圖像檢索技術(shù)給了用戶一個(gè)在互聯(lián)網(wǎng)上搜索感興趣圖片資源的有效手段,依靠文本和依靠?jī)?nèi)容是圖像檢索發(fā)展的兩個(gè)分支,不過從當(dāng)前圖像檢索研究的趨勢(shì)來看,尤其是結(jié)合網(wǎng)絡(luò)環(huán)境下圖片的特征——嵌入在具有文本內(nèi)容的Web文檔中,出現(xiàn)了三個(gè)不同的研究著重點(diǎn)。
(1)基于文本的檢索研究
依靠文本,對(duì)圖像進(jìn)行檢索。試圖把傳統(tǒng)的文本檢索技術(shù)用于對(duì)多媒體信息的檢索上,因?yàn)榛谖谋镜臋z索技術(shù)發(fā)展已經(jīng)很成熟。如網(wǎng)頁排名方法、位置方法、概率方法、摘要方法、詞性標(biāo)注法、分類或聚類方法等,不僅技術(shù)發(fā)展比較成熟,同時(shí)分析和實(shí)現(xiàn)的難度比較小小。但是由于受控詞匯本身的局限,容易產(chǎn)生歧義,更新慢,所以不太好應(yīng)對(duì)網(wǎng)絡(luò)上日新月異的各類圖像。
(2)基于內(nèi)容的檢索研究
依靠于圖像內(nèi)容,對(duì)圖片進(jìn)行分析和檢索。相對(duì)而言,盡管圖像檢索已經(jīng)出現(xiàn)了諸如直方圖、顏色矩等多種表征圖像特點(diǎn)的方法,但是如果要突破對(duì)低層次特征的分析,實(shí)現(xiàn)更加高語義上的檢索,實(shí)現(xiàn)難度比較大,進(jìn)展緩慢。但是,基于內(nèi)容的圖像檢索建立在多媒體信息內(nèi)容語義上,可以更為客觀地反映媒體本質(zhì)的特征。
(3)基于文本內(nèi)容結(jié)合的檢索研究
融合文本和內(nèi)容,二者雖然側(cè)重不同但卻互相補(bǔ)充。假如能將二者結(jié)合起來取長(zhǎng)補(bǔ)短,則網(wǎng)絡(luò)圖像檢索技術(shù)必然有新的進(jìn)展,F(xiàn)有的圖像搜索引擎在信息的自動(dòng)加工和標(biāo)引方面都有提高空間,需要開發(fā)出計(jì)算機(jī)自動(dòng)識(shí)別、標(biāo)引圖像的算法和技術(shù),用以完善現(xiàn)有的檢索功能,并與已有成熟的圖像庫檢索技術(shù)相融合,這是今后需要研究的一個(gè)課題。并且,圖像庫檢索技術(shù)也應(yīng)當(dāng)面向網(wǎng)絡(luò),利用網(wǎng)絡(luò)技術(shù)進(jìn)行改造,提供新的萬維網(wǎng)訪問界面以代替原來的應(yīng)用系統(tǒng)界面。同時(shí)把巨大的圖像庫資源利用網(wǎng)絡(luò)實(shí)現(xiàn)共享
(4)對(duì)基于內(nèi)容編碼技術(shù)的研究
可以這么說,三個(gè)方向都是相互影響相互促進(jìn)的,任何一個(gè)方向的進(jìn)展都能夠促進(jìn)圖像檢索技術(shù)向前精進(jìn)一步。
當(dāng)今,國(guó)際上還沒有通用基于內(nèi)容的編碼標(biāo)準(zhǔn)。20世紀(jì)90年代初,國(guó)際上就已經(jīng)開始對(duì)基于內(nèi)容的圖像信息檢索這一方面的研究。從最基本的顏色檢索,到綜合利用多種圖像特征進(jìn)行檢索,很多原型系統(tǒng)已經(jīng)推出,其中,有部分已投入到實(shí)際應(yīng)用中以檢驗(yàn)其有效性。與此同時(shí),MPEG-7標(biāo)準(zhǔn)作為基于內(nèi)容的多媒體編碼標(biāo)準(zhǔn)也正在規(guī)劃制定當(dāng)中,將要成為國(guó)際標(biāo)準(zhǔn)中的一員。所以,應(yīng)盡快對(duì)MPEG-7標(biāo)準(zhǔn)進(jìn)行研究,分析其編碼的性質(zhì),在此基礎(chǔ)上進(jìn)一步研究基于內(nèi)容檢索的系統(tǒng),使我國(guó)基于內(nèi)容的圖像檢索能夠盡快走向?qū)嶋H應(yīng)用的階段。
(5)對(duì)用戶查詢接口的研究
這涉及到用戶對(duì)圖像內(nèi)容感知表達(dá)、交互方式設(shè)計(jì)、用戶要如何形成并提交查詢等方面,F(xiàn)代多媒體信息系統(tǒng)一個(gè)重要的特征就是信息獲取過程中的可交互性,人在系統(tǒng)中是主導(dǎo)地位。除開提供示例和描繪查詢基本接口以外,用戶的查詢接口應(yīng)當(dāng)提供豐富的交互能力,使用戶在主動(dòng)的交互過程中表達(dá)對(duì)圖像語義的感知,調(diào)整查詢參數(shù)及其組合,最終能夠獲得滿意的查詢結(jié)果。用戶的查詢接口應(yīng)該是簡(jiǎn)單直觀易用的,底層特征選擇對(duì)用戶是透明的。這里會(huì)涉及到如何把用戶的查詢表達(dá)轉(zhuǎn)換成可以執(zhí)行檢索的特征矢量,如何從交互過程中獲取用戶的內(nèi)容感知,方便選擇合適的檢索特征等問題。
一個(gè)優(yōu)秀的搜(未完,下一頁)
附件下載:WEB中圖像的檢索技術(shù)研究
|
|
相關(guān)專業(yè)論文
|
|
推薦專業(yè)論文
|
|
|
|