人工智能在模式識別方面的應(yīng)用
丁麗 2012/3/11
摘 要: 隨著信息技術(shù)的飛速發(fā)展,人工智能的應(yīng)用越來越廣泛,其中模式識別是人工智能應(yīng)用的一個方面。文章介紹了人工智能在模式識別方面的應(yīng)用。
關(guān)鍵詞: 人工智能; 模式識別; 漢字識別; 數(shù)字識別; 語音識別; 指紋模式識別; 三維人臉識別; 數(shù)字信號處理器
1 引言
計算機硬件的迅速發(fā)展,計算機應(yīng)用領(lǐng)域的不斷開拓,迫切地要求計算機能夠更有效地感知諸如聲音、文字、圖像、溫度、震動等人類賴以發(fā)展自身、改造環(huán)境所運用的信息資料。但就一般意義來說,目前一般計算機卻無法直接感知它們鍵盤、鼠標(biāo)等外部設(shè)備,對于這樣五花八門的外部世界顯得無能為力。縱然電視攝像機、圖文掃描儀、話筒等設(shè)備業(yè)已解決了上述非電信號的轉(zhuǎn)換,并與計算機聯(lián)機,但由于識別技術(shù)不高,而未能使計算機真正知道采錄后的究竟是什么信息。計算機對外部世界感知能力的低下,成為開拓計算機應(yīng)用的瓶頸,也與其高超的運算能力形成強烈的對比。于是,著眼于拓寬計算機的應(yīng)用領(lǐng)域,提高其感知外部信息能力的學(xué)科——模式識別,便得到迅速發(fā)展。
人工智能所研究的模式識別是指用計算機代替人類或幫助人類感知模式,是對人類感知外界功能的模擬, 研究的是計算機模式識別系統(tǒng),也就是使一個計算機系統(tǒng)具有模擬人類通過感官接受外界信息、識別和理解周圍環(huán)境的感知能力,F(xiàn)將人工智能在模式識別方面的一些具體和最新的應(yīng)用列舉如下。
2 人工智能
人工智能(Artificial Intelligence)是相對人的自然智能而言,即用人工的方法和技術(shù),模仿、延伸和擴展人的智能,實現(xiàn)某些“機器思維”。作為一門學(xué)科,人工智能研究智能行為的計算模型,研制具有感知、推理、學(xué)習(xí)、聯(lián)想、決策等思維活動的計算系統(tǒng),解決需要人類專家才能處理的復(fù)雜問題。人工智能就其本質(zhì)而言,是對人的思維的信息過程的模擬。
3 模式識別
模式識別就是通過計算機用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀。這里,我們把環(huán)境與客體統(tǒng)稱為“模式”,隨著計算機技術(shù)的發(fā)展,人類有可能研究復(fù)雜的信息處理過程。用計算機實現(xiàn)模式(文字、聲音 、人物、物體等) 的自動識別,是開發(fā)智能機器的一個最關(guān)鍵的突破口,也為人類認(rèn)識自身智能提供線索。信息處理過程的一個重要形式是生命體對環(huán)境及客體的識別。對人類來說,特別重要的是對光學(xué)信息(通過視覺器官來獲得)和聲學(xué)信息(通過聽覺器官來獲得) 的識別。這是模式識別的兩個重要方面。市場上可見到的代表性產(chǎn)品有光學(xué)字符識別系統(tǒng)(Optical Character Recognition,OCR) 、語音識別系統(tǒng)等。
所謂模式識別,可以理解為根據(jù)識別對象特征的觀察值將其分到某個類別中的過程。利用計算機進行模式識別在2O世紀(jì)6O年代初迅速發(fā)展并成為一門新學(xué)。
4 人工智能在模式識別方面的應(yīng)用
4.1 數(shù)字識別,漢字識別與語音識別
手寫體數(shù)字識別在郵政編碼識別、銀行業(yè)務(wù)等方面有重要應(yīng)用,由于字體變化大,對識別率要求高,所以有較大困難。手寫體數(shù)字識別使用的技術(shù)是人工智能中的神經(jīng)網(wǎng)絡(luò)技術(shù),神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)能力和快速并行實現(xiàn)的特點,可以用于解決這一問題 。
相比而言,漢字的識別是更加困難的一件事。常用漢字共有6763個,分為兩級,第一級3755 ,第二級包括3008個,在使用的過程中有時還可能會用到其他的外國的字符以及特殊的符號。每個字符都對應(yīng)著一個類別。即開頭有變化,發(fā)生畸變或受到干擾等影響的同一字屬于一類,相對于只有l(wèi)0 個的數(shù)字而言,漢字的數(shù)量因為大于6000,而且又有印刷體和手寫體之分,因此,要用計算機進行精確的分類,其困難的程度也比數(shù)字識別大多了。所以,手寫體漢字的識別是一個很困難的模式識別問題。解決的辦法,同樣需要神經(jīng)網(wǎng)絡(luò)技術(shù)的支持,而且還要從不同地區(qū)搜集大量的手寫體漢字作為樣本集對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。其運算量也是驚人的。幸運的是,現(xiàn)在已經(jīng)有了一些印刷體漢字識別軟件,如清華紫光OCR軟件,就可以識別掃描圖片中的漢字,雖然準(zhǔn)確率還不是100%,但是這說明在漢字識別方面畢竟已經(jīng)取得了一些進展。中科院自動化研究所漢王公司開發(fā)成功的“漢王筆”是一套在一塊手寫板上書寫。從而把漢字輸入計算機的聯(lián)機手寫漢字識別系統(tǒng)。
語音識別就是讓計算機能聽懂人說的話, 一個重要的例子就是七國語言(英、日、意、韓、法、德、中)口語自動翻譯系統(tǒng)。其中,中文部分的實驗平臺設(shè)立在中國科學(xué)院自動化所的模式識別國家重點實驗室,這是口語翻譯研究跨人世界領(lǐng)先水平的標(biāo)志。該系統(tǒng)實現(xiàn)后,人們出國預(yù)定旅館、購買機票、在餐館對話和兌換外幣時,只要利用電話網(wǎng)絡(luò)和國際互聯(lián)網(wǎng),就可用手機、電話等與“老”通話。 (未完,下一頁)
|
|
相關(guān)專業(yè)論文
|
|
推薦專業(yè)論文
|
|
|
|