基于短時能量和過零率分析的語音端點檢測方法研究
(作者未知) 2011/5/17
摘 要:短時能量分析和過零率分析作為語音信號時域分析中最基本的方法,應用相當廣泛,特別是在語音信號端點檢測方面。由于在語音信號端點檢測方面這兩種方法通常是獨立使用的,在端點檢測的時候很容易漏掉重要的信息。本文將這兩種方法結合起來,利用MATLAB 工具對其進行了分析。實驗結果表明,檢測的效果好于分別使用其中一種方法的情況。
關鍵詞:端點檢測,短時能量過零率門限
1 引言
近年來,在語音信號處理領域,關于語音信號中端點檢測及判定的研究越來越重要。作為語音識別的前提工作,有效的端點檢測方法不僅可以減少數據的存儲量和處理時間,而且可以排除無聲段的噪聲干擾,使語音識別更為準確。目前的語音信號端點檢測算法比較多,有短時能量,短時過零率分析,自相關法等等,其中以短時能量和短時過零率用的最多。大多文獻和教材都是把它們分別進行介紹,由于它們各有其優(yōu)缺點,分別使用作為語音端點檢測的手段難免會漏掉很多有用的信息,因此,筆者將這兩種方法結合起來進行分析,在判斷清濁音及靜音方面可以起到互補的作用,從語音信號的短時能量和過零率分析的特點出發(fā),加以門限值來分析將兩種方法相結合應用的效果,最后通過Matlab 進行了仿真。
2 語音信號短時能量和過零率的特征
語音一般分為無聲段,清音段和濁音段。一般把濁音認為是一個以基音周期為周期的斜三角脈沖串,把清音模擬成隨機白噪聲。由于語音信號是一個非平穩(wěn)態(tài)過程,不能用處理平穩(wěn)信號的信號處理技術對其進行分析處理。但由于語音信號本身的特點,在10~30ms的短時間范圍內,其特性可以看作是一個準穩(wěn)態(tài)過程,即具有短時性。因此采用短時能量和過零率來對語音進行端點檢測是可行的。
......
附件下載:點擊下載查閱全文
|