高清語音的承諾
雖然語音服務就如同牛奶一樣是人們生活中不可缺少的一部分,但是語音質量仍然是信號是否成功傳輸?shù)囊粋重要衡量標準。在很多情況下,語音質量的細微提升都會產(chǎn)生重要的影響。如Sprint 公司在1986 年通過著名的“pin drop”品牌運動,實現(xiàn)了跨越東西海岸的遠距離光纖傳輸,改善了運營商遠距傳輸?shù)恼Z音服務。該運動在大眾當中形成了品牌意識,激發(fā)了用戶的興趣,同時,語音服務的改善也提升了公司的形象,增加了市場份額。
最近,另一種“令人厭煩”的商品電視機,由于數(shù)字傳輸技術和高清技術的引入而呈現(xiàn)出了新的活力(也由于銷售收入的巨大增長而受益)。用戶愿意購買昂貴的高清電視設備來享受更“逼真”的視覺效果,這表明提升用戶體驗非常重要。
而今天,一個類似的革新正以高清語音通信(或稱為高清語音)的形式聚集著力量。據(jù)預期,一旦寬帶音頻在移動用戶中獲得廣泛應用,高清語音將迅速普及。該白皮書將對這一高清語音進行探討。
高清語音是什么?
高清語音應用寬帶音頻連接更精確地再生成人的聲音,使語音更自然,一些早期的用戶把這一效果描述為:與電話線另一端的人“在同一房間”。另外,早期的用戶還認為,高清語音使他們能夠更容易通過聲音來辨別對方,也更容易理解濃重的地方口音。
采用高清語音使新用戶體驗到聲音質量明顯提高,其原因之一是傳統(tǒng)電話技術被過時的標準所限制。數(shù)字電話標準(比如:ITU-T G.711)是基于20 世紀60 年代的數(shù)字電路技術和20 世紀30 年代的麥克風技術。
在高清語音技術出現(xiàn)之前,G.711 一直是語音質量的標準,而移動電話的質量一般來說要低于G.711 標準的質量。
在實際的“聲音”傳輸中,這些局限的具體表現(xiàn)是什么?一個重要的觀點認為,原來的標準嚴格地把音頻范圍限制在300 赫茲到3400 赫茲之間,而局限由此產(chǎn)生:
·對于像“s”和“f”之類的摩擦音(需要更高頻率)較難識別
·區(qū)別“m”和“n”,“p”和“t”(仍然需要更高頻率)的發(fā)音是一大難題;
·對于元音(需要更低頻率)不能聽到基本的回聲。
因而,在這種情況下“電話談話”聽起來即刺耳又呆板,但是采用高清語音技術,即便使用移動電話,有限范圍頻率的局限都將不復存在。
移動高清語音發(fā)展可能超過高清VoIP
高清語音技術采用一直比較緩慢,這與應用VoIP 技術的商用電話系統(tǒng)采用的步調(diào)一致。雖然來自Avaya、Cisco、Grandstream、Gigaset、Polycom、Snom 以及其他一些公司的電話終端都支持寬帶音頻,并集成了很多高質量的音頻組件,但大部分企業(yè)IP 電話系統(tǒng)的運作仍然像VoIP 孤島。這些企業(yè)采用傳統(tǒng)的PSTN 網(wǎng)絡建立連接進行呼叫,而該網(wǎng)絡只支持過時的音頻標準,且只能傳送較窄的頻率范圍。因而,高清語音通常僅限于在企業(yè)內(nèi)部連接時使用。
另外,也可能是更重要的一點是,在企業(yè)內(nèi)部通常是IT 部門決定是否購買這些電信產(chǎn)品,而這些部門一般都承受著較大的預算壓力,因而不愿花錢提升企業(yè)在通信中的體驗,如語音質量的顯著提高等,即使由此增加的費用并不很高。
更廣泛地采用高清語音技術的最大希望仍在于個人用戶,在于用戶所顯示的頻繁購買(目前,大約每24個月一周期)新的、改進的移動設備的意愿。雖然由于移動網(wǎng)絡的升級,移動終端已經(jīng)開始支持高清語音,但是高清語音很可能希望找到愿意為更高標準的語音質量而付費的、對這一技術抱有熱望的公眾。隨著寬帶音頻在移動電話芯片里集成技術的不斷提高,相應的費用將大大降低。大量的移動用戶對高清語音技術的接受,將迅速擴大高清語音市場,其速度遠遠超過今天企業(yè)采用的緩慢步伐,從而大大增加高清語音早期接受者的人數(shù),并帶來世界范圍內(nèi)龐大的大眾市場。
移動高清語音一旦出現(xiàn),估計在12 到24 個月的時間里就會獲得廣泛的采用。移動電話顯著提升的話音質量,也可能使固定電話向移動電話的遷移更為迅速。
高清語音研究激發(fā)行業(yè)活力
在20 世紀90 年代早期,視頻電話業(yè)做出了驚人的發(fā)明。研究發(fā)現(xiàn),用戶視頻電話的感知力可通過犧牲視頻傳輸中用于提供寬帶音頻的比特位來提高!這項發(fā)明導致寬帶音頻(高清語音的基礎)成為廣泛被采用的H.320 視頻會議標準(也被稱為Px64)的一部分,并從此出現(xiàn)在了幾乎每個視頻會議系統(tǒng)中。2006 年,愛立信和T-Mobile 公司在德國[愛立信]實施了一個寬帶音頻移動服務的聯(lián)合實驗,實驗結果令人深受鼓舞——93%的實驗結果肯定了新的音頻質量,71%的實驗結果表明在音頻質量和清晰度方面有顯著提高。用戶認為,新的語音服務使噪音環(huán)境下的通話更為容易,并且該服務增強了通話中對私密性、辨別力以及舒適度等方面的感知力。
實施問題
移動寬帶音頻(高清語音)服務自從1998 年就被3GPP 完全標準化了。該服務使用AMR 多頻(AMR-WB或G.722.2)編碼,該編碼必須在手機、核心網(wǎng)絡網(wǎng)關以及GSM TRAU 單元(基站控制器的一部分)的支持下得以有效運作。雖然AMR-WB 與今天的標準(AMR-NB)相比需要更多的數(shù)字信號處理操作,然而額外的功率在手機所需要的功率中只占很小的一部分(因為無線電發(fā)送的需求),并且能在最新部署的核心網(wǎng)絡設備中通過軟件的升級而獲得支持。
移動運營商的核心網(wǎng)絡必須能夠支持TFO 和TrFO 信令。這種信令要么已經(jīng)存在于核心網(wǎng)絡設備中,要么能通過對新近部署的多數(shù)系統(tǒng)進行軟件升級而實現(xiàn)。
而最令人興奮的是,在這種情況下無需額外的無線電資源,這意味著無需重新構建無線資源。雖然AMR-WB使音頻帶寬加倍,然而它的比特率與AMR-NB 很相似,尤其在強制配置操作(置0)中。從結果看,在今天的無線網(wǎng)絡架構中AMR-NB 和AMR-WB 能夠和諧共存并同時運作。
高清移動服務推出
自從2006 年中期以來,法國電信組織一直在通過語音、數(shù)據(jù)與視頻三合一的傳輸網(wǎng)絡,為其電話用戶提供高清語音的可選服務。盡管最初的采用速度比較慢,但從那以后用戶對顯著提高的音頻質量反應非常積極。FT-Orange 公司目前正在通過廣告推廣其語音、數(shù)據(jù)與視頻三合一的服務,廣告對該語音服務清晰度和親切感的增加大加褒揚,但并沒有直接提到寬帶語音或者高清語音。
2009 年9 月在紐約舉行的高清通訊高峰會議上,F(xiàn)T-Orange 公司宣布它已經(jīng)在摩爾多瓦提供移動高清服務,并計劃于2010 年在英國、法國和比利時推出高清語音服務。其他移動運營商據(jù)說也都在打算推出自己的高清語音服務,但截至2009 年9 月還沒有官方的正式通告。