語音IM在帶寬方面無需擔憂
北電企業(yè)解決方案集團CTO兼副總裁 Phil Edholm 2007/12/24
在前一段時間的博客中,我提到語音IM(即時通信)和現有的文本IM相比,能夠突破文本信息及輸入文本動作的限制,可以帶有更多的信息,并且在很多場合使用起來更加方便。在這篇博客的評論中,有人提到一個我以前沒有想過的問題:既然文本傳輸在帶寬占用方面與語音相比具有很大的優(yōu)勢,而且語音識別技術日漸成熟,那么我們是否可以將語音轉換成文本進行傳輸,然后在另一端再轉換回語音呢?當然,這樣做將會丟失一些信息,如說話時的語氣。那么,我們做這種轉換是否有必要呢?
在回復這條評論時,我想到,人們可能是對語音信息望而生畏了,而沒有詳細考慮它的處理過程。對于像VoIP這種系統,在傳輸中需要注意兩點:一是確保數據包的優(yōu)先級,二是保證數據包的順序不亂。在數據網絡中,其流量相對而言是很小的。當網絡容量和計算能力都以指數級增長時,流量僅僅是線性增長的(打電話的總時間與每個用戶的平均電話時間及用戶數量成線性關系,但這兩項的增長率都很低)。因此,語言占用網絡資源的比例會越來越小,最終成為可以忽略不計的部分,那時它就不再是網絡規(guī)劃時技術或者經濟方面考慮的因素。這并不是說它們不重要,只是對容量和運營的規(guī)劃影響不大罷了。
盡管我們都知道文本消息對于現代網絡而言,其流量是可以忽略不計的,但語音IM又如何呢?它的需求是否真會改變網絡的運營狀態(tài)?我們從一個實際例子來看,文本和語音的帶寬占用區(qū)別究竟有多大?
我在PC上錄制了一段語音(英文原文:Now is the time for all good men to come to the aid
of their country.),時長5.25s。當PCM(脈碼調制)速率為64kbps時,它占用336kb,也就是42kB。而在文本文件中,它占用68B。這樣看來,壓縮比是相當大的,語音比文本大了將近620倍。但是,如果我們使用8kbps速率(在IM這種非實時情況下并不影響效果)的話,區(qū)別就縮小到了78倍。
我們假設,平均每個文本消息20個字符,每人每天發(fā)送100條消息,這樣,總的文本傳輸量是2000B,再加上網絡傳輸需要添加的約6000B管理負荷,總共是8000B。同樣的消息,如果使用壓縮的語音傳輸,每人每天需要傳輸的數據量是156kB,加上網絡傳輸需要的管理負荷(數據包越大,管理負荷所占比例越。偣布s175kB。由此可見,由于管理負荷的原因,實際傳輸時,語音的信息量約為文本的20倍。盡管175kB對于2G或者2.5G移動網絡而言是個大塊頭,但是無論是對局域網、家庭寬帶連接、無線局域網,還是3G移動網絡,它都是可以忽略不計的。假設人們在8小時之內發(fā)送各自的消息,平均每個人所占用的帶寬就不到50bps了。假設一個基站有100個用戶,那么用在這方面的帶寬也就是5kbps而已。而且,這還是非實時的流量,完全可以歸為SLA中最低的一級—盡力而為(Best
Effort)。盡管文本的需求顯然更低(僅僅250bps),但在這個充滿圖像、電話和視頻的世界里,這點差異是完全不用考慮的。
因此,我的結論是:語音IM完全不存在帶寬問題。
CTI論壇編輯
相關鏈接: