《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > 類語音調制解調器的設計與實現

類語音調制解調器的設計與實現

2009-07-14
作者:楊典兵, 羅興國, 許明艷

??? 摘? 要: 針對端對端保密通信中語音信號因加密隨機化而不能被聲碼器正確解碼的問題,提出了一種類語音調制解調算法,將加密語音數據調制成類語音信號后進行傳送。介紹了算法中增益、基音周期和聲道相關參數的碼本設計方法以及參數的提取、量化和搜索的方法,并利用VC進行仿真,通過對數據進行比對實現增益、基音及聲道參數的有效還原。?

??? 關鍵詞: 類語音調制解調;增益;基音;聲道參數

?

??? 目前的第二代和第三代移動通信系統中采取的安全措施能在一定程度上保護用戶身份的隱私性和空中接口中傳輸信息的機密性。然而,這種通信機密性僅僅保障無線接入信道,語音信號在核心電路交換網中完全以PCM或者ADPCM語音的形式“裸露”傳送,存在被竊聽的風險。為了降低這種風險,進一步保證端對端通信的安全性,有必要在語音信號進入現有通信系統之前對其進行加密[1-2]。?

??? 語音進入通信系統后,終端和網絡中的聲碼器會對語音信號進行壓縮/解壓縮處理,以便有效地利用語音信道帶寬。聲碼器的工作基于人類語音的特征,語音信號在加密處理后的隨機化特性,將不滿足語音編解碼所需的語音特征,從而不被聲碼器準確轉換[1-3]。?

??? 本文提出一種類語音調制解調方法,該方法能將加密處理后的語音數據比特流或者其他數據調制成類語音波形,使波形具有聲碼器轉換所需的語音特征。這樣,類語音波形就能夠通過聲碼器的壓縮/解壓縮處理過程且具有較小誤比特率。加密后的數據可以在語音通道上進行傳輸,盡管此時傳輸的是加密過的信號,但給第三方的感覺是一種未加密的語音數據,從而避免引起第三方的關注,實現身份掩護功能,有效地實現終端用戶信息的安全傳輸。?

1 系統描述?

??? 圖1描述的是一個端對端保密移動通信路徑。語音信號通過低速語音壓縮編碼后進行加密,加密后的語音數據輸入類語音調制器,調制器將其轉換成一種類語音波形后通過終端上的聲碼器進行壓縮,得到的比特流被發送到通信信道。接收終端上的解碼器接收比特流后將其轉換回一個類語音波形。類語音解調器應能夠有效識別由于通信網絡中的轉換而在解碼器與發射端調制器之間產生的波形誤差,提取出原始的加密數據,然后進行解密和解碼,得到原始的語音。?

?

?

??? 類語音調制解調器,其功能是實現碼流與類語音信號的轉換,而類語音信號要具有語音信號的特性,其算法原理與聲碼器算法類似,因此類語音調制解調算法的研究基于對聲碼器算法的研究。重點通過研究現有的10階線性預測聲碼器LPC-10算法和混合激勵線性預測聲碼器MELP算法,實現類語音調制解調算法。?

2 調制器設計?

??? 從本質上講調制器是一個語音合成器,輸入比特流通過語音合成模塊轉換為類語音波形。這個類語音波形與輸入原始語音波形不同,但兩者之間具有重要的關系,即類語音波形能從加密后的輸入語音數據比特流唯一地產生。?

??? 調制器使用的語音產生模型參數和相應的波形具有兩個重要的特點:?

??? (1)盡管網絡引入失真,但接收到相應波形時,解調器能準確識別相應于輸入數據的初始描述參數,這些所選參數能夠表示人類語音信號的重要特性。典型的語音參數包括基音周期、頻譜特性及語音信號的能量等[4]。?

??? (2)每一組與其他組之間必須有較大的不同,即在一個有效參數組內,沒有一個選定的波形與其他波形類似。為了達到這個目的,輸入語音信號首先使用一種低速聲碼器進行壓縮[5],這樣可以極大地降低比特速率。這就允許接收端語音解碼器解碼產生的各個有效類語音波形之間存在一定數量的冗余(隨著輸入比特速率的降低,用來生成每個類語音波形的比特數量也隨之減少,同時減少了有效組內的波形總數[6])。?

??? 圖2、圖3對應于一個20 ms幀的調制過程,其中10 bit用于LSF參數,5 bit基音周期,5 bit增益,總共1 kb/s。這個映射過程將數據比特映射成類語音參數,然后通過類語音合成器合成為類語音信號。?

?

?

?

2.1 基音周期碼本的設計?

??? 在解調端利用AMDF(短時平均幅度差函數)來提取基音周期,信號間的相關性越強,越利于準確提取基音周期。反之,基音周期的大小反應了信號延遲時間的長短,延遲時間越長,信號間的相關性越小,計算出現誤差的可能性就越大。較小的基音值可以得到較好的類語音波形,同時可以簡化解調端的設計。?

??? 為了保證解調器的性能,選用低延時的32個周期值作為類語音信號的基音周期,5 bit編碼。圖4、圖5分別顯示了基音值在20~76之間和基音值在20~156之間合成的類語音波形。?

?

?

?

??? 由圖4、圖5可知,基音值較小時可以合成較好的類語音波形,以便于后端的處理。?

??? 表1是基音范圍為20~156之間調制(合成)時的基音值和解調(編碼)時的基音值。?

?

?

??? 由上表可知:基音值較小時有利于解調端的準確提取,通過簡單的基音提取算法簡化解調端。測試結果表明基音值最佳取值區間為20~76。?

2.2 聲道參數選擇與碼本設計?

??? 語音參數編碼算法的聲道參數包括預測系數PC(Prediction Coefficient)、反射系數RC(Reflection Coefficient)和線譜頻率LSF(Line Spectrum Frequency)等幾種不同的描述方法。其中線譜頻率是頻域參數,具有有序性、有界性的特點,誤差相對獨立,某個頻率點上的LSF偏差只對該頻率附近的語音頻譜產生影響,而對其他LSF頻率上的語音頻譜影響不大,從而具有更好的量化特性。此外,用LSF構成合成濾波器能保證穩定性,可滿足調制器性能要求,因此,選用線譜頻率LSF作為聲道參數。?

??? 本文采用自相關法計算預測系數并轉換成線譜頻率LSF。綜合考慮量化效率、碼本存儲量、計算量及復雜度,采用分裂矢量量化[7]的方法,把10維的LSF矢量分成(5,5)兩個矢量,每矢量5 bit編碼,分別量化。?

??? 采用歐氏失真作為失真測度:? ?

?????

其中,d2(x,y)的下標2表示平方誤差,xi和yi分別表示矢量x和y的分量。?

??? 對每個矢量分別采用LBG算法[8]設計碼本,從大量的隨機對話句子中選取10 000幀濁音作為訓練序列。碼本尺寸為32。?

2.3 增益碼本的設計?

??? LPC-10增益碼表中不僅有0幅值元素,而且低幅值元素的量化間距很小。為了更好地承載信息并增加抗誤碼性能,需要對增益碼本進行優化改進,設置最小增益值(如10),增大相鄰元素間的量化距離,避免了因幅度過小而無法還原信息的情況。碼本尺寸32,5 bit編碼。?

2.4 類語音合成?

??? 根據語音參數分別構造激勵信號和聲道濾波器后,以基音周期為基本單位進行語音合成。合成濾波器傳遞函數如下:?

?????

其中ai為預測系數,由LSF轉換得到。?

??? LPC-10算法對語音的合成以基音周期為基本單位,根據基音周期的不同,每幀合成的類語音樣點數可能等于180點,也可能小于180點。當合成樣點數小于180點時,不足的差值樣點數補充到下一個合成幀,使得待合成的語音幀幀長動態變化。?

??? 為了保證解調器端的有效同步,在以基音周期為基本單位合成類語音的基礎上,當每幀合成的樣點數小于180點時,用最后一個基音合成單元的樣點數補齊,保證每幀輸出180個樣點。?

??? 類語音合成器的激勵采用固定的一串隨機序列作為激勵,有利于簡化調制算法,也便于參數的提取??紤]到合成的類語音僅僅是作為待調制信息的載體,不需要以自然度、可懂度等語音性能評價指標來衡量,因此為了保證解調器的解調性能,在類語音合成輸出時不進行三幀平滑、濾波和延遲處理。?

3 解調器設計?

??? 解調器對接收到的類語音信號分幀,以幀為處理單元,采用現有的信號處理技術從類語音波形中提取上述參數。這些提取出來的參數與碼本相比較,其中最匹配的向量可以用來恢復原始數據。這個過程如圖6所示。?

?

?

3.1 基音周期的提取 ?

??? 語音信號經過逆濾波器得到殘差,將殘差進行三電平削波,不進行4:1的抽取,直接計算AMDF。計算AMDF的公式為[3]:?

?????

其中,τ的取值可以為20,21,22,…40,42,44,…76。?

??? LPC-10算法的基音搜索過程比較復雜,涉及到嗓音起始時間計算、清/濁音檢測、濁音窗設定、基音及清/濁標志校正等多個處理過程。本算法在調制端合成類語音時,將所有的語音參數幀均合成為濁音信號。因此,在解調端不需要進行嗓音起始時間的判斷和清/濁檢測及校正,直接進行基音周期的提取,降低了計算復雜度。?

??? 根據AMDF的最小值確定基音周期。為了防止出現實際基音周期的整數倍值,還需要進行基音周期的跟蹤搜索。?

3.2 線譜頻率的提取和量化?

??? LPC-10算法采用了協方差法計算預測系數,無法保證求解參數的穩定性。在進行調制解調器設計時,改用自相關法,加哈明窗改進算法性能,并對預測系數進行15 Hz頻帶擴展(擴展因子r=0.994),保證了提取參數的穩定性。?

??? 將頻帶擴展后的10個預測系數轉換成10個線譜頻率LSF,對LSF進行升序排列,以保證LSF的單調性和有序性;對LSF進行最小間隔檢測,以保證LSF的最小間隔大于50 Hz。對10維LSF進行(5,5)分裂矢量量化,獲取2組量化索引號。碼本尺寸32,索引號5 bit編碼,共計10 bit。?

3.3 增益的提取與量化?

??? 取當前幀基音周期的整數倍計算增益RMS,計算公式為:?

?????

式中, Si為經過預加重的數字語音,M是分析幀的長度。對計算所得的RMS值進行量化,獲得增益索引,5 bit編碼。?

??? 表2顯示了調制端、解調端的增益所對應的量化增益值,由表中可得增益G較為穩定,可以采用這種方法提取和還原增益參數G。?

?

?

??? 軟件仿真的結果表明,本文設計的類語音調制解調器能實現類語音信號的調制和解調且具有較低的誤碼率。但本文的工作僅限理想環境下的實現,如果考慮信道誤碼、丟包等因素,還有待進一步研究。?

參考文獻?

[1] KATUGAMPALA N N, VILLETTE S, KONDOZ A M.Secure voice over GSM and other low bit rate system.Secure Gsm and Beyond:End to End Security for Mob,11,Feb,2003.?

[2] KATUGAMPALA N N, AL-NAIMI K T, VILLETE S, et al.Real time data transmission over GSM voice channel for?secure voice & data applications. Secure Mobile Communications Forum, 23, Sept, 2004.?

[3] LO C, CHEN Y. Secure communication mechanisms for?GSM networks. IEEE Transactions on Consumer Electronics,1999,45(4):1074-1079. ?

[4] 李軍林,杜松,崔慧娟,等. 0.8 kb/s高質量聲碼器算法.清華大學學報(自然科學版), 2003,43(1).?

[5] STEFANOVIC M, CHO Y D, VILLETTE S, et al. A 2.4/1.2 kb/s speech coder with noise pre-processor.proceedings EUSIPCO 2000, Tampere, Finland: 4-8. ?

[6] KONDOZ A. Digital speech:coding for low bit rate communication systems. J.Wiley, New York. 1994.?

[7] 王炳錫.語音編碼.西安:西安電子科技大學出版社,2002.?

[8] 吳家安.語音編碼技術及應用.北京:機械工業出版社,2005.

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 色噜噜狠狠色综合免费视频 | 日本综合欧美一区二区三区 | 看毛片看毛片 | 蜜月mv国产精品 | 久青草中文字幕精品视频 | 19xxxxxxxxx日本69 18在线网站 | 天天靠天天擦天天摸 | 日日日天天射天天干视频 | 高清性色生活片97 | 黄色一级免费片 | 精品中文字幕一区二区三区四区 | 射久久 | 午夜爽爽爽男女免费观看影院 | 天天插综合网 | 99热综合在线 | 欧美天堂色 | 免费在线观看一级毛片 | 波多野结衣免费免费视频一区 | 欧美日韩亚洲国内综合网俺 | 免费人成视网站在线不卡 | 亚洲午夜高清 | 久久国产成人 | 91精品成人免费国产片 | 欧美人妖猛交 | 三级三级三级网站网址 | 国产一区二区久久久 | 国产91精品系列在线观看 | a级片免费观看视频 | 丁香婷婷综合五月综合色啪 | 国产凹凸在线观看一区二区 | 日韩视频高清 | 干干操| 最新亚洲精品国自产在线 | 中文字幕日本精品一区二区三区 | 羞羞视频免费网站欧美 | 成人日b视频 | a毛片在线看片免费 | 日韩福利片午夜在线观看资源 | 国产一级毛片国产 | 欧美成人午夜做受视频 | 日韩伦理片在线观看光棍影院 |