基于奇異值分解的文本檢索
|
資料類(lèi)別
|
電子電工畢業(yè)論文(設(shè)計(jì)) |
|
課程(專業(yè))
|
電子通信 |
關(guān)鍵詞
|
電子琴|(zhì)EDA|Verilog HDL File|音調(diào)發(fā)生|QuartusII|單片機(jī) |
適用年級(jí)
|
本科 |
身份要求
|
普通會(huì)員 |
金 幣
|
80 。金幣如何獲得?) |
文件格式
|
word+PPT |
文件大小
|
1172K |
發(fā)布時(shí)間
|
2012-06-07 16:53:00 |
預(yù)覽文件
|
0932956.jpg(只能預(yù)覽部分內(nèi)容) |
下載次數(shù)
|
2 |
發(fā)布人 |
lpf2176 |
內(nèi)容簡(jiǎn)介:
本科畢業(yè)設(shè)計(jì) 基于奇異值分解的文本檢索
文本檢索|奇異值分解|向量|相似性|單片機(jī)
文件格式:word+PPT
一套完整的畢業(yè)設(shè)計(jì),包括任務(wù)書(shū)、開(kāi)題報(bào)告、論文正文、外文翻譯、答辯PPT。
有預(yù)覽文件請(qǐng)查看。
論文正文共30頁(yè)。共18755個(gè)字符數(shù)(不計(jì)空格)。整套壓縮包大小:1.14MB。
中英文翻譯 On the Use of the Singular Value Decomposition for TextRetrieval(使用奇異值分解對(duì)文本檢索)
摘要
文本檢索的任務(wù)主要是研究如何從給定的無(wú)結(jié)構(gòu)或半結(jié)構(gòu)化文檔集中找出與用戶相關(guān)的文檔子集,并依據(jù)相關(guān)度排序把檢索結(jié)果返回給用戶。文本檢索在近年取得了很大進(jìn)展,典型的有K 近鄰、決策樹(shù)、樸素貝葉斯和支持向量機(jī)以及兩步分類(lèi)策略、潛在語(yǔ)義分析、潛在語(yǔ)義索引等。本設(shè)計(jì)提出的是基于奇異值分解的文本檢索。其基本思想是用向量之間的距離來(lái)逼近文本之間的語(yǔ)義相似性,將文本和檢索簡(jiǎn)化為詞項(xiàng)及權(quán)重集合的向量表示,從而把檢索操作變成向量空間上的向量運(yùn)算。這種方法的主要優(yōu)勢(shì)在于簡(jiǎn)便快捷,適合于大規(guī)模語(yǔ)料庫(kù)的文本檢索。在上述研究的基礎(chǔ)上,用MATLAB語(yǔ)言設(shè)計(jì)了相應(yīng)程序,并采集文本進(jìn)行了測(cè)試,仿真結(jié)果表明,該方法能解決傳統(tǒng)文本檢索搜索時(shí)間慢、空間占用量大的問(wèn)題。
關(guān)鍵詞:文本檢索,奇異值分解,向量,相似性
Text retrieval based on singular value Decomposition
Abstract
Text retrieval tasks mainly studies how the given unstructured or semi-structured document sets to identify subsets of a document associated with the user, and on the basis of relevance ranking the search results are returned to the user. Recently,great progress has obtained in text retrieval, a typical K nearest neighbor, decision tree, naive Bayes and support vector machine and two steps categorization strategy, latent semantic analysis,Latent semantic indexing,The design is based on the singular value text retrieval,The basic idea is to use the vector distance between the approximation of text semantic similarity between text and retrieval, simplified to term and weight set vector representation, thus the retrieval operation into a vector space vector operation。This method is a key advantage of convenient, suitable for a large corpus of text retrieval. On the basis of the above research, designed the corresponding program, and collecting the text were tested, the simulation results show that, this method can solve the traditional text retrieval search time, space is big problem.
Key words:Text retrieval, Singular value,Vector, Similarity
目錄
摘 要 I
Abstract II
第一章 引言 1
1.1 選題的依據(jù)及意義 1
1.2 國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)(含文獻(xiàn)綜述) 2
1.3 本論文研究目標(biāo)和內(nèi)容 3
1.4 論文結(jié)構(gòu) 3
第二章 相關(guān)原理和方法 4
2.1 Matlab的簡(jiǎn)介 4
2.2 奇異值分解 4
2.3 文本檢索 6
第三章 基于奇異值分解的文本檢索 7
3.1 總體方案設(shè)計(jì) 7
3.2 奇異值分解算法 7
3.2.1 特征提取 9
3.2.2 相似度計(jì)算 11
第四章 實(shí)驗(yàn)結(jié)果和分析 12
4.1 實(shí)驗(yàn)數(shù)據(jù) 12
4.2 實(shí)驗(yàn)結(jié)果分析 14
4.3 評(píng)估指標(biāo) 15
第五章 結(jié)束語(yǔ) 16
參考文獻(xiàn)(References) 17
致謝 18
相關(guān)說(shuō)明:
1. 如您下載的資料不止一份,建議您注冊(cè)成為本站會(huì)員。會(huì)員請(qǐng)登錄后下載。
2. 會(huì)員購(gòu)買(mǎi)金幣50元以下,0.7元/個(gè),50元以上,0.5元/個(gè)。具體請(qǐng)看:下載與付款。
3. 會(huì)員48小時(shí)內(nèi)下載同一文件,不重復(fù)扣金幣。
4. 下載后請(qǐng)用WinRAR或 WinZIP解壓縮后使用。
5. 如仍有其他下載問(wèn)題,請(qǐng)看常見(jiàn)問(wèn)題解答。
下載地址:
|
|
相關(guān)畢業(yè)論文(設(shè)計(jì)) |
|
推薦畢業(yè)論文(設(shè)計(jì)) |
|
|
|
|