基于數(shù)據(jù)挖掘技術(shù)的保險行業(yè)決策分析研究
(作者未知) 2011/6/23
(接上頁)模式樹的建立可以避免多次掃描事務數(shù)據(jù)庫;同時利用count域有效的保留了項集的數(shù)目,避免大量產(chǎn)生頻繁項集,對于減小空間時間復雜度起到了一定的作用。通過樹形結(jié)構(gòu)可以避免產(chǎn)生大量冗余規(guī)則。
通過對模式樹的剪枝,可以減除在模式樹產(chǎn)生過程中產(chǎn)生的大量冗余分枝,起到了減小空間復雜度的作用,同時可以利用輸出模式B產(chǎn)生規(guī)則,避免了多項集的頻繁出現(xiàn),減小了時間復雜度。
4 結(jié)束語
本項目中通過模式樹結(jié)構(gòu)改進了Apriori算法,彌補了Apriori算法存在的缺陷。此種方法既能夠?qū)priori算法從時間復雜度和空間復雜度上進行改進,同時又避免了中間規(guī)則的產(chǎn)生。本研究表明,通過利用一個模式樹結(jié)構(gòu)來降低Apriori算法的存儲復雜度,并同時減少冗余規(guī)則的出現(xiàn),這對于Apriori算法的改進是一種有效的措施。
參考文獻
[1]鄧納姆.數(shù)據(jù)挖掘教程[M].郭崇慧,田鳳占,靳曉明,等譯.北京:清華大學出版社,2005.
[2]蘇新寧,楊建林,江念南,等.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M].北京:清華大學出版社,2006.
[3]GAL C S, KANTOR P B, SHAPIRA B. Security Informatics and Terrorism: Patrolling the Web. Amsterdam: IOS Press,2008.
[4]BORGES J, LEVENE M. Evaluating Variable Length Markov Chain Models for Analysis of User Web Navigation Sessions.IEEE Transactions on Knowledge and Data Engineering.2007,19(4): 441-452.
|