一.引言
二.電氣(混合)回聲
2.1 電氣(混合)回聲基本上是線性的
2.2 電氣(混合)回聲是穩(wěn)定的
三.聲學(xué)回聲
3.1 無線通信中感覺到聲學(xué)回聲的原因
3.2 數(shù)字無線應(yīng)用中的聲學(xué)回聲是非線性的
3.3 數(shù)字無線應(yīng)用中的聲學(xué)回聲是不穩(wěn)定的
四.控制數(shù)字無線網(wǎng)絡(luò)中的聲學(xué)回聲
4.1 主要考慮因素
4.2 方法
五.信號分類錯誤
5.1 錯誤類型1
5.2 錯誤類型2
5.3 錯誤類型3
六.聲學(xué)回聲的恰當(dāng)處理
6.1 使用降噪功能減少錯誤類型1出現(xiàn)的可能性
6.2 使用智能語音檢測降低錯誤類型1出現(xiàn)的可能性
6.3 減少錯誤類型2出現(xiàn)的可能性
6.4 降低錯誤類型3出現(xiàn)的可能性
一.引言
在本文中,討論了無線通信領(lǐng)域中聲學(xué)回聲的特性,并給出了對其進(jìn)行恰當(dāng)控制的方法。我們分析了聲學(xué)回聲和電氣回聲(混合回聲)的性質(zhì),解釋了為什么需要采用不同的技術(shù)來控制并消除每種信號衰落。在本文中,還對幾家回聲消除器產(chǎn)品廠家實際采用的實施方法進(jìn)行了評述,推導(dǎo)出了為什么某些回聲消除器完全無法實現(xiàn)其目標(biāo),或缺乏恰當(dāng)解決方案所需關(guān)鍵組件的原因。在本文的結(jié)論中,介紹了在NMS通信公司的回聲消除器設(shè)計中采用的方法,并闡述了該方法所基于的理論基礎(chǔ)。
二.電氣(混合)回聲
回聲消除器首先是在為長途應(yīng)用而設(shè)計的網(wǎng)絡(luò)中引入的。長途應(yīng)用中包含過量的傳播延遲,這種現(xiàn)象突顯出了將雙線連接轉(zhuǎn)換為四線系統(tǒng)的混合線路的不完整性。這種混合線路的不完整性被描述為"信號泄漏"或因阻抗失配而導(dǎo)致的信號反射,稱為網(wǎng)絡(luò)電氣回聲(也稱為混合回聲)。在圖1中,描述了這種現(xiàn)象。
符合ITU G.168(2000)標(biāo)準(zhǔn)的回聲消除器能夠消除電氣(混合)回聲。這類設(shè)備在其運(yùn)行當(dāng)中采用了"兩段式"方法。在第1階段,使用線性卷積處理消除了大部分回聲。在第2階段,采用了非線性處理器(NLP)以消除殘存的回聲,這一部分相對較小。對殘存回聲信號的辨識是一件很簡單的任務(wù),這是因為它的功率電平明顯低于原始的語音信號。
2.1 電氣(混合)回聲基本上是線性的
線性意味著,可以構(gòu)建一個簡單的數(shù)學(xué)模型(基于最小二乘法)來描述特定的回聲信號。首先對描述回聲信號的數(shù)學(xué)表示取反,然后將其加到實際返回的回聲信號上。結(jié)果為兩個完全相反(幾乎)信號之和,從而將回聲消除。由于技術(shù)方面的限制,數(shù)學(xué)模型存在缺陷。這種不完整性根植于源信號的來回轉(zhuǎn)換或"A"法則格式,而不是數(shù)學(xué)模型。使用非線性處理器(NLP),可以將源自這種不完整性的殘余回聲消除掉,NLP能像開關(guān)一樣有效地工作,形成一個單向連接,阻斷任何信號(包括殘余的回聲信號)正向通過該連接,如圖2所示。
圖2 電氣(混合)回聲的處理
2.2 電氣(混合)回聲是穩(wěn)定的
穩(wěn)定意味著,與語音信號相關(guān)的脈沖響應(yīng)是不變的,在一個特定呼叫的全過程中,在回聲消除器內(nèi)創(chuàng)建的數(shù)學(xué)模型只會出現(xiàn)很微小的漂移。這種行為要求回聲消除器存在一種自我訓(xùn)練機(jī)制,能根據(jù)特定的頻率作出響應(yīng)。訓(xùn)練是一項耗時的進(jìn)程,對于每一個呼叫,短可以少于100毫秒,長會超過1秒。訓(xùn)練時間通常稱為呼叫啟動過程中的會聚時間。
源自接收器(耳機(jī))的聲波,通過位于聲音路徑上的固體物體反射進(jìn)入手機(jī)的麥克風(fēng)(話筒)中,或揚(yáng)聲器電話中,這就形成了聲學(xué)回聲。請參見圖3。
3.1 無線通信中感覺到聲學(xué)回聲的原因
在無線和有線應(yīng)用中都會出現(xiàn)聲學(xué)回聲。暴露在回聲狀況下的大多數(shù)有線配置均配備了電氣回聲消除器,因此,有線應(yīng)用中的聲學(xué)回聲是通過標(biāo)準(zhǔn)的回波消除算法和相關(guān)的NLP技術(shù)來控制的。直到最近才在數(shù)字無線應(yīng)用中采用了回聲消除器來消除在PSTN(公共交換電話網(wǎng)絡(luò))端生成的回聲(即電氣回聲)。在數(shù)字無線情形下,PSTN用戶不會經(jīng)歷聲學(xué)回聲或電氣回聲。該假設(shè)基于如下根本原因:
。1) 無線電話標(biāo)準(zhǔn)要求設(shè)備制造商在聲學(xué)回聲路徑上設(shè)計足夠大的衰減;
(2) 在數(shù)字無線環(huán)境中不存在PSTN網(wǎng)絡(luò)中的"二-四線"混合,因此,數(shù)字
無線設(shè)備不會產(chǎn)生電氣(混合)回聲。
不幸的是,很多無線電話廠商未能遵從正式標(biāo)準(zhǔn)的規(guī)定:在數(shù)字移動電話接收器(耳機(jī))和麥克風(fēng)(話筒)之間應(yīng)具有恰當(dāng)?shù)母綦x措施。作為其結(jié)果,聲學(xué)回聲成為了無線服務(wù)提供商需關(guān)心的一項事宜。此外,因語音壓縮技術(shù)以及語音壓縮算法的非線性而引入的較長的處理延遲時間(往返延遲大于200毫秒),使得在數(shù)字無線應(yīng)用中,聲學(xué)回聲問題更加明顯。
3.2 數(shù)字無線應(yīng)用中的聲學(xué)回聲是非線性的
在無線電話話筒處進(jìn)入的聲學(xué)回聲隨后將被送至聲碼器(語音編碼器),聲碼器將按照處理有效語音信號的相同方式處理聲學(xué)回聲信號。也就是說,聲學(xué)回聲信號將被語音壓縮技術(shù)處理,該技術(shù)改變了信號的特征,與此同時,還在源信號和聲學(xué)回聲的處理結(jié)果之間創(chuàng)建了一種非線性關(guān)聯(lián)。
非線性意味著,在數(shù)字無線環(huán)境中實施相對簡單的數(shù)學(xué)模型(基于最小二乘法估算,就像在線性電氣回聲消除中所采用的那樣),將其作為消除或減少聲學(xué)回聲的手段完全不適合。這是一種錯誤的方法,它會引入額外的、不希望出現(xiàn)的副作用(以信號失真,回聲增加,和噪音形式出現(xiàn))。這就是在處理聲學(xué)回聲時需要面對的情形。因此,試圖使用采用了標(biāo)準(zhǔn)線性卷積算法的回聲消除器來控制無線聲學(xué)回聲既昂貴且效率低下①。
3.3 數(shù)字無線應(yīng)用中的聲學(xué)回聲是不穩(wěn)定的
由于聲學(xué)回聲是聲波自固態(tài)物體反彈而導(dǎo)致的結(jié)果,改變這些固態(tài)物體與無線電話耳機(jī)的相對位置會改變聲學(xué)回聲的特性。例如,頭部或手部的移動,邊走邊講話,以及在會話過程中公共場所內(nèi)人員或物體的移動,都會產(chǎn)生不同的,不穩(wěn)定的聲學(xué)回聲效應(yīng)。
不穩(wěn)定性意味著,與語音信號相關(guān)的脈沖響應(yīng)(即回聲)從本質(zhì)上講是一種"移動的對象"。因此,在呼叫全過程中,標(biāo)準(zhǔn)電氣回聲消除器中采用的數(shù)學(xué)模型會不斷改變回聲的特征。因而,針對特定頻率響應(yīng)的訓(xùn)練技術(shù)即無效率且毫無用處。此外,訓(xùn)練是一項耗時的進(jìn)程,對于每一次呼叫,其時間從少于100毫秒到超過1秒。在這種情況下,截止回聲消除器完成訓(xùn)練時(即收斂時),它可能還停留在某一信號上,無法對當(dāng)前的聲學(xué)回聲作出響應(yīng)。其結(jié)果是,該方法可能會弊大于利(即,引入討厭的信號失真,降低語音質(zhì)量,帶來噪音等)。
總之,試圖使用采用了標(biāo)準(zhǔn)線性技術(shù)的回聲消除器來控制無線聲學(xué)回聲既昂貴且效率低下。
四.控制數(shù)字無線網(wǎng)絡(luò)中的聲學(xué)回聲
4.1 主要考慮因素
控制非線性、非穩(wěn)態(tài)聲學(xué)回聲的首選是采用非線性方法。然而,非線性方法--如在通常的回聲消除器中采用的傳統(tǒng)非線性處理器(NLP)--會帶來信號失真的副作用,形式為語音消波②,并會因噪音脈動③干擾導(dǎo)致背景音頻發(fā)生變化。因此,對于有效的非線性方法來說,必須采取進(jìn)一步的措施,將這些副作用降低到最小程度,與此同時,它還應(yīng)能識別出聲學(xué)回聲信號并將其從語音信號(或任何其他有效信號)上分離,允許后者通過連接線路。
控制聲學(xué)回聲的另一個重要參數(shù)是定時。傳統(tǒng)的非線性處理器(NLP)采用了相對較短的回聲路徑時延,平均值介于10~64毫秒。通過回聲消除器中標(biāo)準(zhǔn)線性處理器的卷積操作,能夠簡化電氣(混合)回聲消除器內(nèi)的NLP定時操作。在沒有卷積處理器,而且在時延的可能范圍內(nèi)存在明顯變化的情況下,有效的聲學(xué)回聲控制必須能夠在削弱返回信號前估算出聲學(xué)回聲路徑時延。因此,定時錯誤會導(dǎo)致棘手的信號消波效應(yīng),后者會降低語音質(zhì)量。
4.2 方法
在無線網(wǎng)絡(luò)中減少聲學(xué)回聲而不導(dǎo)致副作用的方法取決于:聲學(xué)回聲控制器辨別有效語音和聲學(xué)回聲信號特征的能力(即,能夠阻斷聲學(xué)回聲信號,并允許有效語音信號通過)。準(zhǔn)確的信號識別是正確操作的關(guān)鍵所在,不正確的信號分類(稱為錯誤類型1,錯誤類型2,和錯誤類型3)會對通信質(zhì)量造成不利影響。
聲學(xué)回聲的一般頻譜特征類似于語音的頻譜特征。類似地,聲學(xué)回聲路徑中的非線性特征會引起回聲和原始語音音節(jié)之間的不一致。因此,有效語音和對應(yīng)的聲學(xué)回聲之間的電平差異(振幅差異)提供了相應(yīng)的信息,使用該類信息,可將聲學(xué)回聲從主流語音中分離出來。在圖4中,給出了識別某一信號是有效信號還是聲學(xué)回聲信號所采用的邏輯方法的概念視圖。
圖4 確定聲學(xué)回聲
對于將聲學(xué)回聲信號從有效的語音信號中識別出來的邏輯方法來說,有兩種主要的相關(guān)事宜。下面,我們以問題的形式介紹了這兩種事宜:
1.為了將錯誤判斷的概率降至最低程度,所應(yīng)采用的恰當(dāng)?shù)拈撝倒β孰娖绞鞘裁矗?br>
2.怎樣才能測量出語音和聲學(xué)回聲的功率電平,而不引入測量缺陷?④
為了解決上述事宜,標(biāo)準(zhǔn)方法(業(yè)內(nèi))是采用相對較低的功率電平閾值設(shè)置,以便將回聲從語音中分離出來,與此同時,忽略引入測量本身的失真信號(由背景噪音電平導(dǎo)致)。這是一種脆弱的方法,無法令人接受。該方法的主要缺點(diǎn)在于其較高的錯誤率,其導(dǎo)因在于對信號的錯誤分類(即,錯誤地將聲學(xué)回聲信號解釋為語音信號,反之亦然)。下面,詳細(xì)介紹了支持該觀點(diǎn)的基本原理。
一家主要的回波消除器廠家采用了該方法,其方式是在單一線路上采用了全雙向回波消除器。(引"三-3.2") | |
在不存在標(biāo)準(zhǔn)線性回聲的場合下使用NLP時,它會變?yōu)槠胀ǖ幕芈曇种破鳌T谙乱还?jié),討論了與這類信號處理相關(guān)的性能事宜。(引"四-4.1") | |
當(dāng)標(biāo)準(zhǔn)NLP(作為對線性回波消除器的補(bǔ)充)打開語音通道以截斷殘余的回聲信號時,它會"插入"(或"泵入")匹配、舒適的噪音,以便使特定呼叫的背景噪音保持連貫。一家主要的回波消除器廠商采用了噪音泵入方法來遮蔽聲回聲。這種聲回聲控制并不能令人滿意,這是因為它會導(dǎo)致背景噪音的明顯變化,使聽者(即用戶)分心并導(dǎo)致不適。(引"四-4.1") | |
測量缺陷是因背景噪音而導(dǎo)致的,它傾向于放大所探測到的信號水平(功率)。(引"四-4.2") |