首頁>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

流媒體傳輸?shù)年P(guān)鍵問題研究

2007/02/07

   隨著視頻處理技術(shù)的發(fā)展,基于流媒體(stream media)傳輸?shù)囊曨l應(yīng)用得到了迅速的發(fā)展。

  目前,許多實(shí)驗(yàn)性的高速寬帶網(wǎng)絡(luò)都把視頻傳輸?shù)募夹g(shù)和應(yīng)用作為研究的重點(diǎn)課題。寬帶網(wǎng)絡(luò)的競(jìng)爭(zhēng)最終將是寬帶應(yīng)用的競(jìng)爭(zhēng),由此誕生的基于中速網(wǎng)絡(luò)的流媒體技術(shù)正日益受到人們的關(guān)注。它推動(dòng)了互聯(lián)網(wǎng)整體架構(gòu)的革新,轉(zhuǎn)變了傳統(tǒng)互聯(lián)網(wǎng)呆板的內(nèi)容表現(xiàn)形式,賦予寬帶應(yīng)用更多的娛樂性和互動(dòng)性,必將成為未來寬帶網(wǎng)絡(luò)的主流技術(shù)。

  流媒體依賴的傳輸平臺(tái)是IP網(wǎng)絡(luò),由于IP網(wǎng)絡(luò)的無連接包轉(zhuǎn)發(fā)機(jī)制主要應(yīng)對(duì)突發(fā)性的數(shù)據(jù)傳輸而設(shè)計(jì),不適用于對(duì)連續(xù)媒體流的傳輸。為了在Internet上有效的、高質(zhì)量的傳輸視頻流,需要多種技術(shù)的支持。本文將主要介紹流媒體傳輸中的一些關(guān)鍵技術(shù)。

一、視頻壓縮處理問題

  目前,視頻流傳輸中最為重要的編解碼標(biāo)準(zhǔn)有國(guó)際電聯(lián)的H.261、H.263、H.264,運(yùn)動(dòng)靜止圖像專家組的M-JPEG和國(guó)際標(biāo)準(zhǔn)化組織運(yùn)動(dòng)圖像專家組的MPEG系列標(biāo)準(zhǔn),此外,在互聯(lián)網(wǎng)上被廣泛應(yīng)用的還有Real-Networks的RealVideo、微軟公司的WMT以及Apple公司的QuickTime等。其中,Windows Media最新發(fā)布的windows media encoding utility v8.O beta包含了windows media audio 8(音頻)和windows media video 8(視頻)兩部分壓縮編碼系統(tǒng)。windows media video 8采用了的MPEG-4視頻壓縮技術(shù),實(shí)現(xiàn)了在500kbps傳送速率下提供接近于dvd質(zhì)量(near-DVD quality)的畫面(分辨率640×480,每秒24幀)。Windows media video 8為電影在線下載觀看做了優(yōu)化,支持true-vbr(真正動(dòng)態(tài)變量速率編碼)。Real Networks公司最新發(fā)布的real producer 8.5住制作rm文件上采用自己開發(fā)的real g2 codec,它具有很多先進(jìn)的設(shè)計(jì),例如,svt(scalable video technology),雙向編碼(two-encoding)。雙向編碼類似于vbr,它可通過預(yù)先掃描整個(gè)影片,根據(jù)帶寬的限制選擇最優(yōu)化壓縮碼率。

  ITU-T和ISO兩個(gè)國(guó)際標(biāo)準(zhǔn)化組織的有關(guān)視頻編碼的專家聯(lián)合組成JVT(Joint Video Team,視頻聯(lián)合工作組),其工作目的是制定一個(gè)新的視頻編碼標(biāo)準(zhǔn),該標(biāo)準(zhǔn)能實(shí)現(xiàn)視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò)適應(yīng)性等目標(biāo)。目前,JVT的工作己被ITU-T接納,新的視頻壓縮編碼標(biāo)準(zhǔn)被稱為H.264標(biāo)準(zhǔn),該標(biāo)準(zhǔn)也被ISO接納,稱為AVC(Advanced Video Coding)標(biāo)準(zhǔn),是MPEG-4的第1O部分。

  H.264比H.263和MPEG-4節(jié)約50%的碼率,而且對(duì)網(wǎng)絡(luò)傳輸具有更好的支持功能。它引入了面向IP包的編碼機(jī)制,有利于網(wǎng)絡(luò)中的分組傳輸,支持網(wǎng)絡(luò)中視頻的流媒體傳輸。H.264具有較強(qiáng)的抗誤碼特性,可適應(yīng)丟包率高、干擾嚴(yán)重的無線信道中的視頻傳輸。H.264支持不同網(wǎng)絡(luò)資源下的分級(jí)編碼傳輸,從而獲得平穩(wěn)的圖像質(zhì)量。H.264標(biāo)準(zhǔn)使運(yùn)動(dòng)圖像壓縮技術(shù)上升到了一個(gè)更高的階段,在較低帶寬上提供高質(zhì)量的圖像傳輸是H.264的應(yīng)用亮點(diǎn)。H.264的推廣應(yīng)用為流媒體業(yè)務(wù)的推廣提供技術(shù)保證。

二、媒體同步問題

  在流媒體業(yè)務(wù)中需要保持一個(gè)數(shù)據(jù)流或者不同媒體流之間的時(shí)間關(guān)系,即媒體同步是一個(gè)重要的要求,包括媒體間同步和媒體內(nèi)同步。因?yàn)閭鬏數(shù)亩嗝襟w信息在時(shí)空上都是相互約束、相互關(guān)聯(lián)的,多媒體通信系統(tǒng)必須正確反應(yīng)這種約束關(guān)系,以保證聲音與圖像的同步。

  媒體同步通常有三種類型:(1)流內(nèi)(intra-stream)同步;(2)流間(inter-stream)同步;(3)對(duì)象間(inter-object)同步。由于網(wǎng)絡(luò)時(shí)延導(dǎo)致媒體流失步,媒體同步機(jī)制可以確保客戶端正確地恢復(fù)媒體流的同步,即通過某種方式在媒體內(nèi)或者媒體間說明其時(shí)間關(guān)系。說明時(shí)問關(guān)系的方法有:基于間隔的方法、基于軸的方法、基于控制流的方法和基于事件的方法。對(duì)于連續(xù)媒體,應(yīng)用最為廣泛的說明方法是基于軸的說明或時(shí)間戳。

  目前流媒體同步最主要的技術(shù)有:Microsoft的Windows Media Tools、SMIL語言和Microsoft Producer。Windows Media Technology是Microsoft公司提出的在IP網(wǎng)上傳播多媒體流信息的解決方案。整個(gè)方案由三個(gè)主要部分構(gòu)成:(1)Media Tools;(2)Media Server:(3)Media Player。SMIL(Synchronized Multimedia Integration Language)通常稱作同步多媒體集成語言,是由3W(World Wide Web Consortium)組織規(guī)定的多媒體操縱語言?梢詫(shí)現(xiàn)多個(gè)流和文本信息在播放時(shí)的時(shí)間同步控制和空間位置布置。SMIL語言屬于擴(kuò)展型標(biāo)記語言XML(Extension Mark-up Language)的范疇,基于XML語法,是一種標(biāo)記文本語言,包含URL資源管理、基于CSS的頁面編排控制、HTML超媒體鏈接。Microsoft Producer是Microsoft PowerPoint 2002或PowerPoint 2003版的附件,它使用戶更容易采集和同步音頻、視頻、幻燈片以及圖像,創(chuàng)建內(nèi)容豐富、圖文并茂的媒體演示,并可以在任何地方的網(wǎng)頁瀏覽器中進(jìn)行預(yù)覽和發(fā)布。

三、媒體QoS問題

  目前,運(yùn)營(yíng)網(wǎng)絡(luò)提供盡力而為(best effort service)的傳送服務(wù),業(yè)務(wù)量盡快傳送,沒有明確的時(shí)間和可靠性保障。流媒體需要有較高的QoS(quality of service)要求,QoS通常用帶寬、時(shí)延、時(shí)延抖動(dòng)和分組丟失率來衡量。

  流媒體依賴的傳輸平臺(tái)是IP網(wǎng)絡(luò),而IP QoS用下列指標(biāo)來表示:傳輸服務(wù)的可靠性、延時(shí)、延時(shí)抖動(dòng)、吞吐量、丟包率。目前的IP QoS主要有3種體系結(jié)構(gòu):(1)MPLS;(2)IntServ;(3)DiffServ。IntServ、DiffServ是被IETF定義的兩種QoS體系。IntServ借用傳統(tǒng)電路交換思想,在基于IP的呼叫兩端,先通過信令建立一條虛連接鏈路,然后呼叫雙方的報(bào)文都經(jīng)此鏈路傳遞,從而達(dá)到保證傳輸質(zhì)量的目的。IntServ基本思想存于以資源預(yù)留的方式實(shí)現(xiàn)QoS保障,而DiffServ則是傳統(tǒng)路由思想的延伸,實(shí)現(xiàn)簡(jiǎn)單。它把流經(jīng)路由器的數(shù)據(jù)包按照一定的優(yōu)先級(jí)分類,然后按照優(yōu)先級(jí)順序?qū)?shù)據(jù)包轉(zhuǎn)發(fā)至下一跳路由器。多協(xié)議標(biāo)簽交換(MPLS)將靈活的3層IP選路和高速的2層交換技術(shù)完美地結(jié)合起來,從而彌補(bǔ)了傳統(tǒng)IP網(wǎng)絡(luò)的許多缺陷。它引入了“顯式路由”機(jī)制,對(duì)QoS提供了更為可靠的保證。

  多協(xié)議標(biāo)簽轉(zhuǎn)換MPLS支持特殊路由,到達(dá)同一目的地的數(shù)據(jù)包沿不同路徑進(jìn)行轉(zhuǎn)發(fā)。MPLS網(wǎng)絡(luò)主要由標(biāo)簽交換邊緣路由器LER和標(biāo)簽交換路由器LSR組成,IntServ試圖為每一路呼叫都建立一條虛鏈路。當(dāng)網(wǎng)絡(luò)規(guī)模大到一定程度時(shí),維護(hù)鏈路狀態(tài)的工作將使核心網(wǎng)路由器不堪重負(fù)。DiffServ只著眼于網(wǎng)絡(luò)中的單個(gè)路由器,缺乏全網(wǎng)觀念。一旦網(wǎng)絡(luò)發(fā)生擁塞,采用DiffServ,報(bào)文會(huì)被阻塞。

  通過應(yīng)用層質(zhì)量控制技術(shù)來改善視頻傳輸?shù)馁|(zhì)量,主要包括擁塞控制和差錯(cuò)控制等幾方面。采用質(zhì)量控制的主要的原因是目前的Internet只提供Best-effort的服務(wù),沒有質(zhì)量保證。因此,需要通過應(yīng)用層的機(jī)制來實(shí)現(xiàn)質(zhì)量的控制。擁塞控制的目的是避免因?yàn)榫W(wǎng)絡(luò)擁塞導(dǎo)致包丟失而造成的質(zhì)量下降。

  對(duì)于視頻流,擁塞控制的主要方法是速率控制。速率控制的目的是基于預(yù)測(cè)的網(wǎng)絡(luò)帶寬決定發(fā)送的速率。有兩種基本的速率控制手段:基于發(fā)送端的速率控制和基于接受端的速率控制。前者主要基于反饋信息進(jìn)行速率調(diào)節(jié),可以適用于單播的方式或組播的方式。對(duì)于單播的方式,有兩種速率控制方法,基于探測(cè)的方法(probe-based)和基于模型的方法(model-based);谔綔y(cè)的方法通過不斷調(diào)整速率使得包的丟失率低于一個(gè)固定的概率值。基于模型的方法直接利用TCP的吞吐率模型計(jì)算速率。因此,模型法也被稱為TCP友好的速率控制方法。對(duì)于單通道的組播,只能采用基于探測(cè)的方法。在基于接受方的速率控制中,發(fā)送方不參與速率控制,而由接受方通過增加和減少通道的數(shù)量來進(jìn)行速率的調(diào)整。通常,這種方法用于采用可擴(kuò)展編碼的組播的情況,組播的視頻流分為多層,每個(gè)層對(duì)應(yīng)組播樹的一個(gè)通道。接受方通過增加減少通道獲得不同的質(zhì)量;诮邮芊降乃俾士刂埔部梢苑譃榛谔綔y(cè)的方法和基于模型的方法。除了基于發(fā)送方的速率控制和基于接受方的速率控制方法以外,還有一個(gè)稱為混合性速率控制的方法,兼有二者的特點(diǎn),即接受方增加減少通道,而發(fā)送方同時(shí)根據(jù)反饋調(diào)整各個(gè)通道的速率;旌纤俾士刂品椒ǖ囊粋(gè)例子是目標(biāo)集分組的方法。

  擁塞控制的目的是減少包的丟失,但是無法避免包的丟失。在這種情況下可能需要一定的差錯(cuò)控制機(jī)制。差錯(cuò)控制機(jī)制包括:

(1)FEC:FEC的目的是通過增加冗余信息使得包丟失后能夠通過其他包恢復(fù)出正確的信息;

(2)延遲約束的重傳。通常流的播放有時(shí)間限制,因此,僅有當(dāng)重傳的時(shí)間小于正常的播放時(shí)間時(shí),重傳才是有價(jià)值的;

(3)錯(cuò)誤彈性編碼(Error-Resilient Encoding):在編碼中通過適當(dāng)?shù)目刂疲沟冒l(fā)生數(shù)據(jù)的丟失后能夠最大限度的減少對(duì)質(zhì)量的影響。在Internet環(huán)境下,最典型的方法是多描述編碼(MDC)。MDC把原始的視頻序列壓縮成多位流,每個(gè)流對(duì)應(yīng)一種描述,都可以提供可接受的視覺質(zhì)量。多個(gè)描述結(jié)合起來提供更好的質(zhì)量。該方法的優(yōu)點(diǎn)是實(shí)現(xiàn)了對(duì)數(shù)據(jù)丟失的健壯性和增強(qiáng)的質(zhì)量。其缺點(diǎn)是相比單描述編碼(SDC),它在壓縮的效率上受到影響。而且由于在多描述之間必須加入一定的相關(guān)性信息,這進(jìn)一步降低了壓縮的效率。

(4)錯(cuò)誤的取消(cancealment):錯(cuò)誤的取消是指當(dāng)錯(cuò)誤已經(jīng)發(fā)生后,接受端通過一定的方法盡量削弱對(duì)人的視覺影響。主要的方法是時(shí)間和空間的插值(Interpolation)。近年來的研究還包括最大平滑恢復(fù),運(yùn)動(dòng)補(bǔ)償時(shí)間預(yù)測(cè)等。

  Real Networks采用了大量的應(yīng)用層質(zhì)量控制技術(shù)來提高流傳輸?shù)馁|(zhì)量。在RealVideo采用了抗損壞(damage-resistant)的編碼和FEC技術(shù)來減少包丟失的影響,RealVideo支持兩種編碼:RealVideo standard和RealVideo fractal。前者可以支持從1Ok到500k的編碼速率,而且特別為28.8k和56k進(jìn)行了優(yōu)化。為了適應(yīng)網(wǎng)絡(luò)速率的變化,Real Networks采用了Sure Stream技術(shù),該技術(shù)可以避免速率使用機(jī)制不能對(duì)每個(gè)速率進(jìn)行優(yōu)化的缺點(diǎn)。具體的方法是:首先在一個(gè)文件中同時(shí)存儲(chǔ)用不同速率編碼的媒體流,其次,通過在服務(wù)器和客戶之間監(jiān)測(cè)帶寬的變化來動(dòng)態(tài)的決定使用那個(gè)速率的流。這個(gè)技術(shù)的主要缺點(diǎn)在于不能適應(yīng)速率的連續(xù)控制。

中國(guó)信息產(chǎn)業(yè)網(wǎng)(www.cnii.com.cn)



相關(guān)鏈接:
基于Wi-Fi的可視電話設(shè)計(jì)方案分析 2007-02-06
視頻通信——最生動(dòng)的通信 2007-02-05
會(huì)議室視頻終端和桌面型視頻終端的區(qū)別 2007-02-05
買視頻會(huì)議系統(tǒng)注意什么 2007-01-30
如何計(jì)算視頻會(huì)議系統(tǒng)的價(jià)格 2007-01-30

分類信息: