一.引言
二.電氣(混合)回聲
2.1 電氣(混合)回聲基本上是線性的
2.2 電氣(混合)回聲是穩(wěn)定的
三.聲學回聲
3.1 無線通信中感覺到聲學回聲的原因
3.2 數(shù)字無線應用中的聲學回聲是非線性的
3.3 數(shù)字無線應用中的聲學回聲是不穩(wěn)定的
四.控制數(shù)字無線網(wǎng)絡中的聲學回聲
4.1 主要考慮因素
4.2 方法
五.信號分類錯誤
5.1 錯誤類型1
5.2 錯誤類型2
5.3 錯誤類型3
六.聲學回聲的恰當處理
6.1 使用降噪功能減少錯誤類型1出現(xiàn)的可能性
6.2 使用智能語音檢測降低錯誤類型1出現(xiàn)的可能性
6.3 減少錯誤類型2出現(xiàn)的可能性
6.4 降低錯誤類型3出現(xiàn)的可能性
本節(jié)所描述的信號分類錯誤均基于實際的聲學回聲控制實施實例,這些實例是由眾多回聲消除器設備廠商提供的。下面,我們描述了在聲學回聲控制方面常見的三種不正確方法,并分析了其錯誤的原因所在。
5.1.1 設置:
常用的閾值設置具有固定的相對功率電平,以便將聲學回聲信號與語音信號分離開(在聲學回聲控制器內(nèi)),該設置介于15~19 dB之間。它基于這樣的假定:大多數(shù)聲學回聲信號的功率電平比原始的語音信號源低15~19
dB(對用于電氣回聲消除器中的標準NLP功能,這是流行的設置)。
5.1.2 潛在結果:
假定實際聲學回聲信號的強度大于閾值設置。例如,假定回聲信號的功率電平僅比原來的語音信號源低10~12 dB。在這種情況下,聲學回聲信號將被誤認為雙對話語音信號(即,聲學回聲控制器會得出不正確的結論,認為呼叫中的兩個用戶正在同時說話),從而不阻斷該聲學回聲信號,如圖5所示。
5.1.3 合理性:
盡管回聲信號的功率電平確實有可能比原始的語音信號源低15~19 dB,但與聲學回聲信號一起傳輸?shù)闹車h(huán)境噪音(背景線路噪音電平)會增大返回信號的功率(請參見圖5)。因此,這種情況會導致聲學回聲控制器內(nèi)的錯誤解釋(即,將聲學回聲信號錯誤地分類為雙對話語音信號),允許聲學回聲信號通過,從而降低了通信質量。
表1:PacketMedia的功能和能力
5.2 錯誤類型2
NMS PacketMedia平臺為開發(fā)基于IP的增值業(yè)務提供功能強大的、硬件和軟件加速器整合。使用額外的加速器以及它們相關的開發(fā)環(huán)境,在開發(fā)時、在性能上以及最重要的可升級能力方面,提供明顯的優(yōu)勢。
5.2.1 設置:
在該方法中,閾值設置具有固定的相對功率電平,以便將聲學回聲信號與語音信號分離開(在聲學回聲控制器內(nèi)),該設置介于10~12 dB之間。它基于這樣的假定:大多數(shù)聲學回聲信號的功率電平至少比原來的語音信號源低10~12
dB(考慮到引起不適并導致通信質量降低的典型聲學回聲信號的功率電平,這是一個更為現(xiàn)實的假定)。
5.2.2 潛在結果:
在某一呼叫過程中,假定無線一端用戶的語音功率電平比另一端用戶的語音功率電平低10 dB,或無線發(fā)送端的噪音水平低于接收端的噪音水平。無論在那種情形下,聲學回聲控制器都很可能將雙對話語音信號誤認為回聲,阻斷(抑制)來自無線端的實際語音信號,從而導致嚴重的語音消波,如圖6所示。
5.2.3 合理性:
發(fā)送方向和接收方向的線路電平并非在任何時侯都是等同的。對于采用了基于平衡和等同線路電平的算法的回聲控制器來說,很容易發(fā)生錯誤,從而導致嚴重的語音消波并降低語音質量。
圖6 錯誤類型2,將雙對話語音誤認為回聲
5.3 錯誤類型3
5.3.1 設置:
在這種情況下,對聲學回聲控制器的非線性處理器(NLP)進行了編程,使之在預設的"操作時間"啟動。
5.3.2 潛在結果:
如果規(guī)定的NLP"操作時間"未能與實際的回聲路徑時延同步,就會降低語音質量。不會消除聲學回聲信號,此外,還能有可能導致嚴重的語音信號消波。
5.3.3 合理性:
想象一個自動門打開和關閉的情形,它能檢測到人員的跑近(參見圖7)。如果自動門僅在預先設定好的時間間隔內(nèi)打開(根據(jù)檢測到奔跑者出現(xiàn)的時間,從相當一段距離處開始),那么當奔跑者試圖通過自動門時,自動門已關閉的可能性很大。也就是說,自動門可能會在奔跑者面前關閉,尤其是當自動門的定時設置是基于平均奔跑速度時,更是如此。在這個類比中,奔跑者代表實際的語音信號,自動門代表負責阻斷聲學回聲信號的NLP機制。顯然,NLP能在恰當?shù)臅r間發(fā)揮其功能至關重要。同樣,如果NLP功能是基于平均時間間隔的話,將無法實現(xiàn)令人滿意的性能。一個更有效的方法是,以動態(tài)方式調整NLP的功能,從而使得其定時機制能與每一次呼叫的唯一特性相符。
圖7 錯誤類型3,依賴預設置的NLP操作定時
6.1 使用降噪功能減少錯誤類型1出現(xiàn)的可能性
與聲學回聲信號一起傳輸?shù)沫h(huán)境噪音(背景線路的噪音功率電平)能夠增強返回信號的功率,從而使聲學回聲控制器得出錯誤的解釋,并觸發(fā)錯誤的行動(例如,錯誤地將聲學回聲信號解釋為有效的語音信號)。然而,在聲學回聲控制功能發(fā)揮作用前,在回波信號上應用降噪(NR)功能,能夠使聲學回聲控制器更加準確地確定出回波信號的功率電平。也就是說,可以消除因噪音附著而導致的失真,如圖8所示。通過使聲學回聲控制器具備獲取準確讀數(shù)的能力,就能顯著降低將聲學回聲信號誤認為有效語音信號的可能性。注意,在分析該方法時,請比對圖5和圖8。
圖8 使用NR減少錯誤類型1發(fā)生的可能性
6.2 使用智能語音檢測降低錯誤類型1出現(xiàn)的可能性
當通信鏈路的的另一端被設計為傳輸可變強度的信號時,"錯誤類型1"的影響會急劇增大。在這種情況下,根據(jù)功率電平的絕對差異來決定阻斷/允許信號的聲學回聲控制器會增大"錯誤類型1"出現(xiàn)的可能性。也就是說,使用絕對功率電平差異時,將聲學回聲信號誤認為有效語音信號的概率很大。
然而,如果判斷過程是根據(jù)功率電平的相對差異來進行的(而不是絕對差異),測量結果將更為準確。通過在靜音期間測量兩個傳輸方向上的線路功率電平,就能得知相對的功率電平差異。使用在靜音期間獲得的信息,在分類信號前(即決定信號是聲學回聲還是有效語音),對呼叫兩端的功率電平差異進行修正,就能更加準確地了解相對信號強度。該方法稱為智能語音檢測,它能顯著降?quot;錯誤類型1"出現(xiàn)的可能性,如圖9所示。注意,在分析該方法時,請比對圖5和圖9。
圖9 使用智能語音檢測降低錯誤類型1出現(xiàn)的可能性
6.3 減少錯誤類型2出現(xiàn)的可能性
在圖10中,給出了通信網(wǎng)絡中"錯誤類型1"和"錯誤類型2"出現(xiàn)的概率。注意,其中兩條曲線是針對"錯誤類型1"的。虛線"錯誤類型1"曲線代表未采用語音增強措施(如降噪和智能語音檢測)的呼叫,實線"錯誤類型1"曲線代表經(jīng)過這些增強措施處理過的呼叫。這表明,經(jīng)過語音增強措施處理過的呼叫具有更好的性能表現(xiàn),以及較低的"錯誤類型1"出現(xiàn)概率(請參見圖8和圖9)。
降噪和智能語音檢測技術不僅能降低"錯誤類型1"出現(xiàn)的概率,還能幫助降低"錯誤類型2"出現(xiàn)的概率。但是,要想同時控制"錯誤類型1"和"錯誤類型2",總會導致"折衷"的設計方案,這是因為,較高的NLP設置會降低"錯誤類型2"出現(xiàn)的概率,但卻會增大"錯誤類型1"出現(xiàn)的概率(如圖10所示)。使用降噪和智能語音檢測技術,能夠更準確地判斷出從無線電話返回的相對信號強度,將NLP閾值設置在較高的電平上,以便阻止將聲學回聲信號發(fā)送給PSTN用戶(參見圖10中的實線"錯誤類型1"曲線)。同樣,這些較高的NLP閾值電平設置(如15~19
dB)能夠顯著降低將雙對話語音信號誤認為聲學回聲信號的概率,從而防止了"錯誤類型2"?傊,在"錯誤類型1"(實線曲線,具有語音增強特性)和"錯誤類型2"曲線的交叉點上,通過與之對應的NLP設置,可以獲得最佳的性能(請參見圖10)。
圖10 錯誤類型1和錯誤類型2的可能性:作為NLP閾值設置的函數(shù)
6.4 降低錯誤類型3出現(xiàn)的可能性
"錯誤類型3"指的是因不正確的NLP操作時間而導致的信號衰落,對于該類錯誤,可以通過實施動態(tài)的自適應回聲路徑時延估計程序解決它。在目前,NMS是能提供實時、動態(tài)聲學回聲路徑時延估算能力的唯一回聲消除器廠商,通過該項技術,能夠恰當?shù)毓芾鞱LP聲學回聲控制功能的操作時間。
有些時候,聲學回聲也被描述成一種間歇現(xiàn)象。它出現(xiàn)在大多數(shù)數(shù)字無線呼叫中,但在某些情形下,它會徹底消失。這與使用無線電話的環(huán)境有關(例如,嘈雜的公共區(qū)域,安靜的辦公場所,移動的車輛中,等等)。作為對客戶需要的響應,大多數(shù)知名的回聲消除器設備廠商均在它們提供的產(chǎn)品中包含了聲學回聲控制功能。然而,這些解決方案的有效性卻因廠商的不同存在很大的差異。
例如,一家回聲消除器設備廠商提供了一種"聲學回聲解決方案",該方案采用了線性卷積來控制標準的NLP功能。很清楚,使用線性卷積方法來消除數(shù)字無線通信中的聲學回聲是徒勞無益的嘗試,而且可能會在無意間為信號帶來有害的副作用。在這種配置下,消除聲學回聲信號的任務基本上是由NLP功能完成的。此外,這家特殊的廠商還有意將NLP閾值設置在相對較低的電平上,從而增大了"錯誤類型2"和嚴重語音消波出現(xiàn)的概率。
另一家主要的回聲消除器設備廠商則簡單地使用了不具備線性卷積特性的標準NLP,并將其作為它們的"控制聲學回聲的解決方案"。本文前面所闡述的相同事宜和問題也適用于這種配置。這兩種方法之間的主要區(qū)別是成本。取消線性卷積算法、僅僅依賴于NLP功能(典型實施是采用了數(shù)字信號處理器DSP)的確能降低成本,但卻無法有效地控制聲學回聲。
NMS通信公司的回聲消除器產(chǎn)品采用了復雜的算法和技術,以控制源自有線或無線網(wǎng)絡端點的聲學回聲。采用這些方法,能夠高度準確地讀取相對信號的強度。它明顯增強了判斷精度,降低了"錯誤類型1"和/或"錯誤類型2"出現(xiàn)的概率。因此,NMS通信公司的解決方案能更有效地消除聲學回聲現(xiàn)象,而且不會引發(fā)信號衰落或語音消波問題。此外,這種對NLP操作的動態(tài)自適應定時控制功能進一步消除了聲學回聲現(xiàn)象,并改善了聲音質量。
NMS通信①公司從事技術領先系統(tǒng)和組件的開發(fā)、營銷和支持業(yè)務,為通信行業(yè)的最新語音服務提供了多種無線和有線解決方案。NMS與其他技術、組件和集成廠家,以及眾多應用提供商建立了多種戰(zhàn)略合作關系,通過提供開發(fā)環(huán)境下獨一無二的技術,向客戶提供了價值。NMS公司為下一代通信解決方案,語音、視頻和數(shù)據(jù)的結合,以及Web與電話的連接提供了堅實的基礎,通過它們,NMS公司幫助其客戶將對明天高價值應用和服務的希望轉化成了今天的收入機會。NMS公司是世界頂尖的通信設備供應商、解決方案開發(fā)商、和服務提供商,使用NMS公司的產(chǎn)品和服務,他們就能以較低的成本,更快地將他們的應用和服務推向市場。
請訪問我們的站點:www.nmscommunications.com