博士學位論文 空間數(shù)據挖掘中若干關鍵技術研究
|
資料類別
|
化工建筑畢業(yè)論文(設計) |
|
課程(專業(yè))
|
地球探測與信息技術 |
關鍵詞
|
關聯(lián)規(guī)則|EM算法 |
適用年級
|
研究生 |
身份要求
|
普通會員 |
金 幣
|
60 。金幣如何獲得?) |
文件格式
|
kdh |
文件大小
|
7830K |
發(fā)布時間
|
2012-03-08 12:08:00 |
預覽文件
|
無 |
下載次數(shù)
|
1 |
發(fā)布人 |
kj008 |
內容簡介:
博士學位論文 科學數(shù)據網格中數(shù)據挖掘技術研究,共124頁。
【摘要】 空間數(shù)據挖掘(Spatial Data Mining,SDM)是指從空間數(shù)據庫中抽取隱含知識、空間關系或非顯式存儲在數(shù)據庫中有意義的特征或模式。該技術在理解空間數(shù)據、獲取空間與非空間數(shù)據間內在關系方面具有重要意義。由于近年來空間地理信息系統(tǒng)(Geography Information System,GIS)廣泛地應用到各個行業(yè)中,積累大量與空間位置相關的空間數(shù)據,因此空間數(shù)據挖掘研究己成為當前研究的重要課題。本論文正是在這種背景下,在系統(tǒng)地討論空間數(shù)據挖掘的基本理論的基礎上,對空間數(shù)據挖掘的若干關鍵技術進行重點研究,論文研究成果可歸納如下:1.在總結已有研究工作的基礎上,研究了位置-屬性一體化的實體信息模型,并分析了3種空間距離測度,可以作為空間計算的基礎準則;通過對空間權重矩陣進行拓展,介紹了空間實體關聯(lián)矩陣的概念,并分析建立方法,為空間數(shù)據挖掘提供了新的基礎工具。2.描述了基于模型聚類的混合模型和基本的期望最大化算法(ExpectationMaximization,EM)算法,盡管EM算法具有普遍性,但是它在實際應用中還是常常受到計算效率的限制。EM算法每一步的迭代中需要遍歷所有的樣本點。如果數(shù)據集非常大,則計算強度也會增加。因此,提出了基于隨機子樣本的節(jié)省計算的遞增EM(IncreasingEM,IEM)算法,該算法運行在子集而不是完全樣本集上,每一次迭代中,只有較少的樣本點需要被估計,這使得算法在運行時間上具有可觀的改善。通過EM高效的似然判斷條件和增量因子,可以對樣本子集的容量自動選擇。IEM算法提高了計算效率,并且不需要犧牲似然估計的精確度。3.由于EM算法不適合空間聚類對空間信息的要求,而鄰域EM(Neighborhood EM,NEM)算法雖然結合了空間懲罰項,但是NEM在E-step步需要大量的迭代。為了既能滿足空間信息的要求,又能避免過多的計算量,利用IEM的思想,提出了EM與NEM二者相結合的混合遞增NEM(Mixed Increasing EM,MNEM)算法,算法首先在隨機子樣本中進行EM訓練,直到似然判斷條件下降,根據增量因子進行樣本更新,然后樣本轉向NEM訓練一次,如此進行循環(huán)遞增的交叉訓練,使得計算量降低,性能提高。4.在包含被相關屬性集合所描述的謂詞的空間數(shù)據庫里,進行多概念級空間關聯(lián)規(guī)則挖掘。一個多級關聯(lián)規(guī)則模式是一個頻繁謂詞集合,在這個集合里,所有構成謂詞的項目分別有一個確定的概念層次。本文提出了在空間數(shù)據庫中挖掘多概念級空間關聯(lián)規(guī)則的新算法,該數(shù)據庫中存儲了經過空間查詢和空間計算所獲得的空間謂詞,并且依據關系表R的空間關系建立母元素表和頻繁類匹配表,這使得多概念級空間關聯(lián)規(guī)則挖掘更加方便和有效。5.方位信息是圖像數(shù)據庫中最重要的信息類型之一,而9DLT(Nine DirectionLower-Triangular Martix)表達形式是方位表達的基本方法,據此提出了一種在圖像數(shù)據庫中根據空間方位關系挖掘空間關聯(lián)規(guī)則的(9DLT Image Mining,9DIM)算法,在這里每幅圖像都被初始化為9DLT字符串,形成類似于事務數(shù)據庫的圖像模式數(shù)據庫,每個9DLT字符串(圖像)代表一個事務。以圖像對象之間的關系模式,建立頻繁k-1(k>2)模式庫,并由頻繁k-1模式庫構造頻繁k模式樹的方式,依次可以發(fā)掘到所有對象間的頻繁模式。比Apriori算法更加有效。
【關鍵詞】 空間數(shù)據挖掘; 聚類; 關聯(lián)規(guī)則; EM算法; 高斯混合模型;
相關說明:
1. 如您下載的資料不止一份,建議您注冊成為本站會員。會員請登錄后下載。
2. 會員購買金幣50元以下,0.7元/個,50元以上,0.5元/個。具體請看:下載與付款。
3. 會員48小時內下載同一文件,不重復扣金幣。
4. 下載后請用WinRAR或 WinZIP解壓縮后使用。
5. 如仍有其他下載問題,請看常見問題解答。
下載地址:
|
|
相關畢業(yè)論文(設計) |
|
推薦畢業(yè)論文(設計) |
|
|
|
|