《電子技術應用》
您所在的位置:首頁 > 其他 > 業界動態 > 基于MAP算法和高階倒譜歸整的電話語音識別方法

基于MAP算法和高階倒譜歸整的電話語音識別方法

2008-07-21
作者:徐 潔, 楊鼎才

  摘 要:介紹一種融合最大" title="最大">最大后驗概率算法和改進的高階" title="高階">高階倒譜歸整的抗噪聲語音識別" title="語音識別">語音識別方法。將最大后驗概率算法用于特征空間來估計電話通道特性(通道差的估計),用分段高階倒譜歸整進行后續補償,可以同時減少電話語音中卷積噪聲和加性噪聲的影響。實驗結果驗證了該方法的有效性,與傳統的倒譜均值減相比,訓練庫中識別率從46.3%提高到87.5%。
  關鍵詞: 電話語音識別 高階倒譜規整 最大后驗概率估計 分段


  電話語音識別借助通信平臺,實現了語音技術的更廣泛應用,人們通過最便捷的電話方式可以查詢到遠端數據庫中的所需信息,給日常生活帶來了極大的方便。然而由于電話網絡中各種噪聲的影響,使得語音識別系統的性能大幅度下降。電話語音的噪聲主要分為兩部分:背景噪聲和電噪聲的影響為加性噪聲;由電話話筒和傳輸線引起的通道影響,即卷積噪聲。盡可能地減少這兩種噪聲在電話語音中的影響,提高電話語音的魯棒性" title="魯棒性">魯棒性是系統達到實用化的關鍵。
  針對電話語音魯棒性的研究,前人已經作了很多工作,提出的一些方法如倒譜均值減[1](CMS)、CDCN[2](Codeword-Dependent Cepstral Normalization)、相對譜RASTA[3](RelAtive SpecTral)處理技術等,對減少測試環境與訓練環境的失配都有一定的效果。但隨著噪聲的增強,以上方法對系統性能的提高都非常有限。
  基于最大后驗概率(MAP)算法的自適應方法利用Bayes理論,通過對模型參數進行修正,顯示了相當好的性能。為了減小模型計算的復雜度,該文也將MAP算法用于特征空間,用該算法估計電話通道影響。高階倒譜歸整是將倒譜均值減的均值歸一擴展到更高階階矩歸一。研究發現,當歸一化較高階數的階矩時,失配進一步減少,帶噪語音信號的概率密度函數更接近干凈語音的概率密度函數,特征參數更具有魯棒性。
  本文提出了一種基于最大后驗概率算法的估計通道影響方法,并用改進的高階倒譜歸整作后續補償,將兩者結合同時提高系統對加性噪聲和卷積噪聲的魯棒性。實驗表明這種方法能有效地提高電話語音識別系統的識別率。
1 算法描述
1.1 通道估計理論

  假設Y(n)表示實際的電話語音倒譜矢量,X(n)表示純凈語音的倒譜矢量,h表示通道響應的倒譜失量。在不考慮背景噪聲的情況下有:
  Y(n)=X(n)+h????????????????? (1)

1.2 MAP算法[4~5]
  在MAP算法中,后驗概率由似然函數和先驗概率組成。由于引入了通道的先驗統計特性" title="統計特性">統計特性,理論上MAP算法比最大似然估計算法(ML)估計得要準確。因此,用MAP估計通道向量與均值的差,把(4)式中的△表示為△MAP,同時,為了表示方便,將Y(n)-用Z來表示。
  運用MAP算法求△MAP,用公式表示為:
  
  其中P(△h|Z)是后驗概率,直接從(5)式中估計△MAP是很困難的,然而(5)式等價為:
  
  為計算方便,將(6)式取對數,得到:

1.3 分段高階倒譜歸整
  研究發現,加性噪聲對語音的影響不僅表現在均值的增加、方差的減少上,它還改變了倒譜的更高階階矩。為了更好地補償帶噪語音的統計特性,Yong Ho Suk等人提出了三階倒譜歸整[6]CTN(Cepstrum Third-order Normalisation),將歸一化的階矩提高到三階。在此基礎上,提出了分段三階倒譜歸整SCTN(Segmental Cepstrum Third-order Normalization),通過一個一定幀長的滑動窗的作用,使倒譜特征在不同的噪聲環境下具有相同的分段統計特性。設滑動窗幀長為N,具體計算方法為:
  (1)計算一階倒譜歸整,即每幀特征向量減去N幀的均值,若當前處于第n幀,則計算以下N幀的均值:
  
  (2)除以N幀的均方差,使歸一化后倒譜矢量有相同的方差。
  

  (3)根據三階倒譜歸整的定義,將(9)式代入(10)式:
  
  其中a、c可以根據(10)式的一階矩為零、二階矩為一常數、三階矩為零來確定。因為筆者認為語音信號倒譜系數的概率密度函數是準高斯分布的,根據隨機信號的知識,倒譜的奇數階矩為零,而偶數階矩為某個特定的常數。最后得到:
  
1.4 融合算法
  將MAP算法與分段三階倒譜歸整進行融合,融合過程如圖1所示。


  電話語音Y(n)首先進行倒譜均值減得到Y(n)-,然后通過Viterbi譯碼得到最優狀態序列,同時根據通道的先驗概率,用(8)式計算△MAP,代入(4)式,再進行(10)式運算得到最后的特征矢量,由第二次Viterbi譯碼得到識別結果。其中△h的先驗統計特性由訓練庫數據得到。
2 實驗結果與分析
  本實驗的訓練數據和識別數據采用PKU-SRSC語音數據庫中的窄帶電話語音,內容為5s的數字串,包括訓練集和測試集。系統采用自左向右的連續隱馬爾可夫模型。模型用4個狀態來表示,每個狀態由3個高斯混和元組成。系統的前端提取特征為MFCC及其一階差分,幀長256點,幀移80點,信號的采樣頻率8000Hz,每幀14維MFCC及其一階差分共28維。基線系統的特征在前端提取后進行倒譜均值減得到。
  表1列出了基線系統,以及采用RASTA、三階倒譜歸整、MAP方法和MAP分別與三階倒譜歸整、分段三階倒譜歸整相結合的方法的識別率比較。其中分段三階倒譜歸整滑動窗長度為80幀。


  從表1中可以看出,將MAP算法用于特征空間對電話通道影響進行補償,可大幅度提高電話語音識別系統的識別率,同時與通常的MAP用于模型空間相比,大大減少了運算量和復雜度。采用MAP與三階倒譜歸整相結合的方法比單獨采用各種補償算法時的識別率都高,在訓練庫中識別率達到80.0%,在識別庫中識別率為73.8%。進一步研究,MAP與分段三階倒譜歸整相結合時,與基線系統的CMS方法相比,在訓練庫中識別率提高了47.1%,在識別庫中識別率提高了48.5%。
  用實驗選擇了分段歸整時的滑動窗長度,圖2給出了在不同N值時系統的識別率,其中橫軸的500幀表示整句語音的長度。可以看出當N=80時具有較高的識別率。


參考文獻
1 Furui S. Cepstral analysis technique for automatic speaker verification. IEEE Trans on Acoustics, Speech and Signal Processing, 1981;29(4):254~272
2 Alejandro Acero, Richard M.Stern. Environmental robustness in automatic speech recognition. IEEE International Confer-ence on Acoustics, Speech and Signal Processing,1990;2:849~852
3 Hermansky H, Morgan H. RASTA processing of speech. IEEE Trans on Speech and Audio Processing, 1994;2(4):578~589
4 Jen-Tzung Chien, Hsiao-Chuan Wang, Lee-Min Lee. Esti-mation of channel bias for telephone speech recognition. International Conference on Spoken Language Processing, ICSLP, 1996;3:1840~1843
5 R.A Bates, M.Ostendorf. Reducing the effects of linear channel distortion on continuous speech recognition. IEEE Transactions on Speech and Audio Processing,1999;7(5):594~597
6 Yong Ho Suk, Seung Ho Choi, Hwang Soo Lee. Cepstrum third-order normalization method for noisy speech recogni-tion. Electronics Letters, 1999;35(7):527~528

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 亚洲福利在线视频 | 深夜福利网站在线观看 | 日本a在线天堂 | 1024手机基地在线看手机 | 狠狠干狠狠色 | 欧美性视屏 | 国产黄色高清视频 | 天天cao在线 | 日韩黄色中文字幕 | 亚洲高清国产品国语在线观看 | 欧美一级大片在线观看 | 欧美一区二区亚洲 | 国产精品久久久久久久久免费观看 | 午夜国产理论 | 黄色成人免费观看 | 日本视频免费高清一本18 | 亚洲日韩aⅴ在线视频 | 欧美香蕉视频 | 人人艹人人干 | 午夜欧美福利视频 | 欧美视频一区二区三区精品 | 欧美日韩一区二区在线观看 | 日韩在线小视频 | 天堂中文字幕 | 带肉很污的甜宠文bl | 亚洲第一福利视频导航 | 国产在线视频网站 | 天天插天天插 | 成人久久18免费游戏网站 | 久久综合久久综合久久综合 | 国产欧美日韩综合 | 亚洲丰满熟妇毛片在线播放 | 亚洲视频在线观看不卡 | 亚洲成人午夜影院 | 色婷婷狠狠久久综合五月 | 国产精品久久久久久久9999 | 亚洲欧美日韩国产精品影院 | 在线观看日韩欧美 | 国产成人精品男人免费 | 免费毛片视频网站 | 日本精品视频一区二区 |