下一代互聯(lián)網(wǎng)關(guān)鍵技術(shù)IP QoS
姜明 2004/03/15
1.IP QoS產(chǎn)生的背景
互聯(lián)網(wǎng)源于美國國防部的ARPANET計劃。在上世紀60年代中期,正是冷戰(zhàn)的高峰,美國國防部希望有一個命令和控制網(wǎng)絡(luò)能夠在核戰(zhàn)爭的條件下幸免于難,而傳統(tǒng)的電路交換的電話網(wǎng)絡(luò)則顯得太脆弱。國防部指定其下屬的高級研究計劃局(ARPA)解決這個問題,此后誕生的一個新型網(wǎng)絡(luò)便稱為ARPANET。當ARPANET與美國國家科學基金會(NSF)建成的NSFNET互聯(lián)以后,其上的用戶數(shù)以指數(shù)增長,并且開始與加拿大、歐洲和太平洋地區(qū)的網(wǎng)絡(luò)連接。到了80年代中期,人們開始把互聯(lián)的網(wǎng)絡(luò)稱為互聯(lián)網(wǎng)。
早在70年代中期,ARPA為了實現(xiàn)異種網(wǎng)之間的互聯(lián)與互通,推出了TCP/IP體系結(jié)構(gòu)和協(xié)議規(guī)范。時至今日,TCP/IP協(xié)議也成為最流行的網(wǎng)際互聯(lián)協(xié)議。它不是國際標準化組織制定的,卻已成為網(wǎng)際互聯(lián)事實上的標準,并由單純的TCP/IP協(xié)議發(fā)展成為一系列以IP為基礎(chǔ)的TCP/IP協(xié)議簇。TCP/IP協(xié)議簇為互聯(lián)網(wǎng)提供了基本的通信機制。
隨著互聯(lián)網(wǎng)的指數(shù)增長,其體系結(jié)構(gòu)也由ARPANET基于集中控制模型的網(wǎng)絡(luò)體系結(jié)構(gòu)演變?yōu)橛蒊SP運營的分散的基于自治系統(tǒng)(Autonomous
systems AS)模型的體系結(jié)構(gòu)。互聯(lián)網(wǎng)目前幾乎覆蓋了全球的每一個角落,其飛速發(fā)展充分說明了TCP/IP協(xié)議取得了巨大的成功。
但是互聯(lián)網(wǎng)發(fā)展的速度和規(guī)模,也遠遠出乎于二十多年前互聯(lián)網(wǎng)的先驅(qū)們制定TCP/IP協(xié)議時的意料之外,他們從未想過互聯(lián)網(wǎng)會發(fā)展到如此的規(guī)模,并且仍在飛速增長。隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)同人們的生活和工作已經(jīng)密切相關(guān)。同時伴隨互聯(lián)網(wǎng)用戶數(shù)膨脹所出現(xiàn)的問題也越來越嚴重。除了我們眾所周知的IP地址匱乏外,另外一個嚴重問題就是缺乏服務(wù)質(zhì)量(Quality
of Service QoS)保障。
現(xiàn)有的互聯(lián)網(wǎng)所提供的是"盡力而為"(best-effort)的服務(wù),在這種服務(wù)模型下,所有的業(yè)務(wù)流被"一視同仁"地公平地競爭網(wǎng)絡(luò)資源,路由器對所有的IP包都采用先來先處理(First
Come First Service FCFS)的工作方式,它盡最大努力將IP包送達目的地。但對IP包傳遞地可靠性、延遲等不能提供任何保證。這很適合Email、Ftp、WWW等業(yè)務(wù)。
但隨著互聯(lián)網(wǎng)的高速增長,IP業(yè)務(wù)也得到了快速增長和多樣化。特別是隨著多媒體業(yè)務(wù)的興起,計算機已經(jīng)不是單純的處理數(shù)據(jù)的工具,而是越來越貼近生活,計算機的交互越來越實時和生動,這對計算機互聯(lián)網(wǎng)絡(luò)也就相應(yīng)地提出了更高的要求。對那些有帶寬、延遲、延遲抖動等特殊要求的應(yīng)用來說,現(xiàn)有的"盡力而為"的服務(wù)顯然是不夠的。盡管由于網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)帶寬以及網(wǎng)絡(luò)速度都得到了極大的提高,但需要通過網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)卻也幾乎以與網(wǎng)絡(luò)發(fā)展速度相同的速度增加,甚至超過網(wǎng)絡(luò)發(fā)展的速度,這使得網(wǎng)絡(luò)帶寬與網(wǎng)絡(luò)速度依然是一個瓶頸問題。同時,近年來發(fā)展起來的一些新的應(yīng)用(如多媒體應(yīng)用,組播應(yīng)用等)不僅增加了網(wǎng)絡(luò)流量,更因為這些應(yīng)用改變了以往互聯(lián)網(wǎng)上的流量性質(zhì),因而它們需要全新的服務(wù)要求。由于不具備服務(wù)質(zhì)量保障特性,不能預(yù)留帶寬,不能限定網(wǎng)絡(luò)時延,因此,目前的因特網(wǎng)無法支持許多新的應(yīng)用如遠程教學、遠程手術(shù)、遠程會議和學術(shù)交流等。
2.IP QoS的定義及其實施方案
IP QoS的研究目標是有效地為用戶提供端到端的服務(wù)質(zhì)量控制或保證。QoS就是網(wǎng)絡(luò)單元(例如,應(yīng)用程序,主機或路由器)能夠在一定級別上確保它的業(yè)務(wù)流和服務(wù)要求得到滿足。QoS并沒有創(chuàng)造帶寬,只是根據(jù)應(yīng)用程序的需求以及網(wǎng)絡(luò)狀況來管理帶寬。IP
QoS有一套性能參數(shù),主要包括:
業(yè)務(wù)可用性:用戶到Internet業(yè)務(wù)之間連接的可靠性。
傳輸延遲:指兩個參照點之間發(fā)送和接收數(shù)據(jù)包的時間間隔。
可變延遲:也稱為延遲抖動(Jitter),指在同一條路由上發(fā)送的一組數(shù)據(jù)流中數(shù)據(jù)包之間的時間差異。
吞吐量:網(wǎng)絡(luò)中發(fā)送數(shù)據(jù)包的速率,可用平均速率或峰值速率表示。
丟包率:在網(wǎng)絡(luò)中傳輸數(shù)據(jù)包時丟棄數(shù)據(jù)包的最高比率。數(shù)據(jù)包丟失一般是由網(wǎng)絡(luò)擁塞引起的。
實現(xiàn)QoS的一種方法是按照服務(wù)水平的要求分配資源給每一個數(shù)據(jù)流。這種采用"資源預(yù)留"進行帶寬分配的方法并不適合"盡力而為"型應(yīng)用。由于帶寬資源是有限的,QoS的設(shè)計者引入了優(yōu)先級概念,使得在資源預(yù)留后"盡力而為"服務(wù)的數(shù)據(jù)流的傳輸也能得到一定的保障。因此,IP
QoS可以分為兩種基本類型:
基于資源預(yù)留:網(wǎng)絡(luò)資源按照某個業(yè)務(wù)的QoS要求進行分配,制定資源管理策略;ヂ(lián)網(wǎng)工程任務(wù)組IETF(Internet Engineering
Task Force)提出的綜合服務(wù)(Integrated Services, IntServ)體系結(jié)構(gòu)便是基于這種策略,資源預(yù)留協(xié)議(Resource
reSerVation Protocol, RSVP)是其核心部分。
基于優(yōu)先級:網(wǎng)絡(luò)邊界節(jié)點對業(yè)務(wù)流進行分類、整形、標記。核心節(jié)點按照資源管理策略分配資源,對QoS要求高的業(yè)務(wù)給以優(yōu)先處理。IETF提出的區(qū)分服務(wù)(Differentiated
Services,DiffServ)便是基于這種策略。
這些QoS方法可以被用于單個數(shù)據(jù)流或聚集的數(shù)據(jù)流(aggregate flow)。根據(jù)應(yīng)用的數(shù)據(jù)流的不同,IPQoS可以分類為:
用于單數(shù)據(jù)流:單個數(shù)據(jù)流為在兩個應(yīng)用(發(fā)送者和接受者)之間的單個的、單向的數(shù)據(jù)流。可以用傳輸協(xié)議、源地址、源端口號碼、目的地址和目的端口號碼這五種參數(shù)來分類。
用于聚集流:綜合流由兩個或更多個單個數(shù)據(jù)流組成。這些流在一個或多個參數(shù)、標記或優(yōu)先數(shù)以及一些認證信息方面有一些共同點。
為了解決IP QoS問題,IETF已經(jīng)提出了幾種服務(wù)模型和機制,主要有:
綜合服務(wù)和資源預(yù)留協(xié)議IntServ/RSVP:以RSVP信令向網(wǎng)絡(luò)提出業(yè)務(wù)流傳輸規(guī)格(Flowspec),并建立和拆除傳輸路徑上的業(yè)務(wù)流狀態(tài)。主機和路由器節(jié)點建立和保持業(yè)務(wù)流狀態(tài)信息。盡管RSVP經(jīng)常用于單個流,但也用于聚流的資源預(yù)留。
區(qū)分服務(wù):在區(qū)分服務(wù)網(wǎng)絡(luò)中,邊界路由器根據(jù)用戶的流規(guī)格(stream profile)將用戶流劃分為不同的級別,再聚合成流聚集,聚集信息存放在IP包頭的DS標記域,稱為DS標記(Differentiated
Services CodePoint,DSCP)。內(nèi)部節(jié)點則根據(jù)DSCP提供不同質(zhì)量的調(diào)度轉(zhuǎn)發(fā)服務(wù)。
多協(xié)議標記交換(MultiProtocol Lable Switch,MPLS):根據(jù)分組頭的標記,通過網(wǎng)絡(luò)路徑控制來提供流聚集的帶寬管理子網(wǎng)帶寬管理(Subnet
Bandwidth Management,SBM):負責OSI第二層(數(shù)據(jù)鏈路層)的分類和優(yōu)先級排列,同IEEE 802網(wǎng)絡(luò)進行共享和交換。
3.綜合服務(wù)模型和資源預(yù)留協(xié)議
IntServ/RSVP簡介
Int-Serv/RSVP服務(wù)模型在IETF RFC1633中進行了定義。RFC1633將資源預(yù)留協(xié)議RSVP作為IntServ結(jié)構(gòu)中的主要信令協(xié)議。其基本思想就在于以資源預(yù)留的方式來實現(xiàn)QoS保障,RSVP是其核心部分。RSVP是主機用來從應(yīng)用程序獲得特定的QoS的一種控制協(xié)議,完成綜合服務(wù)需要定義的呼叫接納控制功能和資源預(yù)留功能。端點應(yīng)用程序利用RSVP消息向網(wǎng)絡(luò)提出完成數(shù)據(jù)傳送必須保留的網(wǎng)絡(luò)資源(如帶寬及緩沖區(qū)大小等),同時也確定沿傳送路徑的各個節(jié)點傳輸處理策略,從而對每個業(yè)務(wù)流實現(xiàn)逐個控制。
在服務(wù)層次上,IntServ/RSVP提供了3種級別的業(yè)務(wù):
端到端的質(zhì)量保證型服務(wù)(Guaranteed Service):保證帶寬、限制延遲、無丟包。
可控負載型服務(wù)(Controlled-Load Service):類似于在當前的一個負載較輕網(wǎng)絡(luò)中實現(xiàn)的盡力而為業(yè)務(wù)的服務(wù)質(zhì)量。
盡力而為的服務(wù)(Best Effort Service):類似當前Internet在提供的盡力而為的服務(wù)。
在結(jié)構(gòu)層次上,IntServ/RSVP服務(wù)模型主要由四個部分構(gòu)成:信令協(xié)議RSVP,接入控制器(admission control routines),分類器(classifier)以及包調(diào)度器(packet
scheduler)。
在實現(xiàn)層次上,綜合服務(wù)需要所有路由器在控制路徑上處理每個流的信令消息并維護每個流的路徑狀態(tài)和資源預(yù)留狀態(tài),在數(shù)據(jù)路徑上執(zhí)行流的分類、調(diào)度和緩沖區(qū)管理。具體而言,資源預(yù)留協(xié)議RSVP負責逐點(hop-by-hop)地建立或者拆除每個流的資源預(yù)留軟狀態(tài)(soft
state),也即建立或拆除數(shù)據(jù)傳輸路徑;接入控制器將決定是否接受一個資源預(yù)留請求,其根據(jù)是鏈路和網(wǎng)絡(luò)節(jié)點的資源使用情況以及QoS請求的具體要求;分類器則對傳輸?shù)臄?shù)據(jù)包進行分類成傳輸流,
IntServ常用的分類器是多域(Multi-Field,MF)分類器,當路由器接收到數(shù)據(jù)包時,它根據(jù)數(shù)據(jù)包頭部的多個域(如5元組:源IP地址,目的IP地址,源端口號,目的端口號,傳輸協(xié)議),將數(shù)據(jù)包放入相應(yīng)的隊列中;調(diào)度器則根據(jù)不同的策略對各個隊列中的數(shù)據(jù)包進行調(diào)度轉(zhuǎn)發(fā)。
資源預(yù)留協(xié)議RSVP
RSVP早在1993年就被提出,用于為IP網(wǎng)提供QoS能力。1997年初IETF批準RSVP成為RFC文件,在+IntServ工作組內(nèi)進行標準制定工作。RSVP是一種提供預(yù)留設(shè)置和控制以實現(xiàn)綜合服務(wù)合協(xié)議,是所有QoS協(xié)議中最復(fù)雜的。RSVP資源預(yù)留請求包括流規(guī)格說明(TSpec)、資源預(yù)留規(guī)格說明(RSpec)和過濾器規(guī)格說明(Filter
Spec),它們一起稱為"流描述符"(Flow Des-criptor)。資源預(yù)留請求中的流規(guī)格說明通常包含服務(wù)類型和數(shù)字參數(shù)集合。預(yù)留說明和業(yè)務(wù)流說明決定于綜合服務(wù)模型并且對RSVP來說是透明的。過濾器規(guī)格說明的格式依賴于所使用的網(wǎng)絡(luò)層協(xié)議,即IPv4或IPv6。目前所用的RSVP中定義的基本過濾器規(guī)格說明格式具有嚴格的形式:發(fā)送端IP地址和可選的TCP/UDP端口號。在服務(wù)保證、資源分配的粒度和對保證QoS應(yīng)用及用戶反饋的細節(jié)等方面RSVP都能提供最高級的QoS。歸納起來,RSVP有以下6個特點:
在每一個路由器中的預(yù)留是"軟"的,這意味著需要由接收者周期地更新。
RSVP不是傳輸協(xié)議而是網(wǎng)絡(luò)(控制)協(xié)議,它不攜帶數(shù)據(jù),但是和TCP或UDP數(shù)據(jù)流并行工作。
應(yīng)用要求API決定流的初始預(yù)留請求,并且接收在經(jīng)過初始請求和全過程中預(yù)留成功或失敗的通知。
為了能夠容納大量不同的接收者,預(yù)留是以接收端驅(qū)動的(Receiver-Driven)。
多播的預(yù)留在上行的數(shù)據(jù)流復(fù)制點上被結(jié)合。
RSVP數(shù)據(jù)流可以通過不支持RSVP的路由器,這會在QoS鏈上產(chǎn)生弱鏈路,在這些弱鏈路上無法提供QoS保證,因而此時的服務(wù)就是盡力而為型的。
使用RSVP信令建立數(shù)據(jù)發(fā)送路徑以及為業(yè)務(wù)流預(yù)留資源的過程如下:
發(fā)送端向接收端發(fā)送一個包含業(yè)務(wù)流規(guī)格說明(TSpec)的PATH消息,其中包含了業(yè)務(wù)流標識(即目的地址)及其業(yè)務(wù)特征,包括所需要的帶寬的上下限,延遲以及延遲抖動等。如圖1中①所示。
該消息由沿路徑的路由器逐跳傳送,并且每個路由器都被告知準備預(yù)留資源,從而建立一個"路徑狀態(tài)",該狀態(tài)信息包含PATH消息中的前一跳源地址。如圖1中②、③所示。
接收方收到此消息后從業(yè)務(wù)特征和所要求的QoS計算出所需要的資源,向其上游節(jié)點發(fā)送一個資源預(yù)留請求RESV消息,該消息中包含了TSpec、RSpec以及Filter
Spec,其主要包含的參數(shù)就是要求預(yù)留的帶寬。如圖1中④所示。
RESV是沿PATH的發(fā)送路徑原路返回的,沿途的路由器收到RESV消息后,調(diào)用自己的接入控制程序以決定是否接受該業(yè)務(wù)流,如果接受,則按要求為業(yè)務(wù)流分配帶寬和緩存空間,并記錄該流狀態(tài)信息,然后將RESV消息繼續(xù)向上游轉(zhuǎn)發(fā);如果拒絕,則向接收端返回一個錯誤信息給接收端以終止呼叫。如圖1中⑤所示。
當最后的路由器收到RESV消息并且接受該請求時,它向接收端發(fā)回一個確認消息。如圖1中⑥所示。
圖1 RSVP建立傳輸路徑以及預(yù)留資源的過程
在此過程中,我們注意到,和電信網(wǎng)絡(luò)中的呼叫建立過程相反,RSVP是由接收端驅(qū)動的資源預(yù)留。其目的是考慮在組播的情況下,以接收端驅(qū)動,可以適應(yīng)組播群成員的動態(tài)增減,以及各接收端要求不同QoS的異質(zhì)請求情況。當通信結(jié)束或者一方退出會話后預(yù)留的資源可以由超時機制釋放。RSVP還定義了顯式的釋放機制,通過PathTear由啟動點沿下游方向傳送至接收端,通知沿途各路由器釋放資源。ResvTear則反向傳送,功能相似。它們可由端系統(tǒng)發(fā)出,也可由路由器在狀態(tài)超時時發(fā)送出。至此,業(yè)務(wù)流的傳輸路徑已經(jīng)建立起來了,數(shù)據(jù)流可以進行發(fā)送了。
RSVP可以看作是配置業(yè)務(wù)處理的機制,綜合服務(wù)則是在RSVP信令基礎(chǔ)上夠用以提供端到端QoS保證的體系結(jié)構(gòu)。IntServ設(shè)定網(wǎng)絡(luò)設(shè)備支持業(yè)務(wù)的處理機制,保證每一個業(yè)務(wù)流嚴格獨立于其他業(yè)務(wù)流的服務(wù),并設(shè)定提供特定量化資源的服務(wù)。
從以上討論可以看出,IntServ/RSVP服務(wù)模型對傳統(tǒng)Internet體系結(jié)構(gòu)的擴展主要包括在路由器中保存業(yè)務(wù)流狀態(tài)信息以及明確的狀態(tài)建立機制。這種模型在路由器中所保存的業(yè)務(wù)流狀態(tài)信息是軟狀態(tài)信息,由于軟狀態(tài)信息在路由器發(fā)生錯誤時容易通過RSVP信令刷新而隱含地拆除并在另外路由器中重建業(yè)務(wù)流狀態(tài)信息,而硬狀態(tài)信息(hard
state)需要明確地拆除狀態(tài)信息,因而保持了網(wǎng)絡(luò)體系結(jié)構(gòu)的魯棒性(robustness)。同時,由于這種模型有效地集成了各種實時應(yīng)用和非實時應(yīng)用,因而保持了網(wǎng)絡(luò)的效率。另外,由于兼容了傳統(tǒng)網(wǎng)絡(luò)體系結(jié)構(gòu)和協(xié)議棧,因此能對網(wǎng)絡(luò)進行有效的管理。
IntServ/RSVP的缺陷
從理論上講IntServ/RSVP模型完全可以保證為IP網(wǎng)絡(luò)提供QoS保障。但隨后在一些網(wǎng)上的實驗表明這種服務(wù)模型有很明顯的局限性,這些問題主要表現(xiàn)在:這不僅表現(xiàn)在擴展性差上,更大的問題是它要求核心路由器必須保持經(jīng)過它的每一個單個數(shù)據(jù)流的狀態(tài),而核心路由器是不能這么做的。另一個大問題是這種方法因此,盡管主要的路由器生產(chǎn)商和主機都支持RSVP,它也被廣泛接受,但是它始終沒有成為主流,原因是ISP們不愿意采用它,很少有大型網(wǎng)絡(luò)采用它。近來,人們認識到RSVP的出路在于與區(qū)分服務(wù)配合工作,相輔相成。
可擴展性差:可擴展性是IntServ/RSVP模型最致命的一個問題,其基于流的資源預(yù)留、調(diào)度處理以及緩沖區(qū)管理,有利于提供QoS保證,但狀態(tài)信息隨業(yè)務(wù)流數(shù)量的增長而增長,沿途的路由器要為每個數(shù)據(jù)流都維持一個"軟狀態(tài)",而路由器的存儲器容量有限,可以保存的軟狀態(tài)信息都是有限的,在一個運營商規(guī)模的網(wǎng)絡(luò)中幾乎不可能實現(xiàn)這一要求。
對路由器的要求過高,網(wǎng)絡(luò)中所有的路由器都必須支持RSVP信令協(xié)議,接入控制程序,分類器以及調(diào)度器。
RSVP中引入每流狀態(tài)(per-flow state)的概念,對于數(shù)據(jù)通信和實時應(yīng)用通信而言,IP網(wǎng)絡(luò)同時扮演了面向無連接和面向連接網(wǎng)絡(luò)的兩個不同角色,提供兩種功能,這與其簡化設(shè)計原則相抵觸。
資源預(yù)留不適用于短時流,比如Web流等,而在因特網(wǎng)中Web流量超過了50%。
IntServ/RSVP還存在著資源預(yù)留和路由協(xié)議之間的矛盾。如圖2所示,從路由角度來看它是一條好的路徑,但從資源預(yù)留來看,由于沒有足夠的資源可以預(yù)留,不能為數(shù)據(jù)流建立起一條路徑,因此這一進程只能停留在這里,等待上層超時拆除這個應(yīng)用進程,再重新建立路徑。
因此,要實現(xiàn)IntServ的QoS保證是很困難的,它需要基于流的、復(fù)雜的資源預(yù)留、接納控制、QoS路由和調(diào)度機制。在諸如互聯(lián)網(wǎng)這種復(fù)雜的、大規(guī)模的網(wǎng)絡(luò)中,鏈路狀態(tài)是不確定的,有效地預(yù)留帶寬資源非常困難。而且資源預(yù)留本身就與IP網(wǎng)絡(luò)的最大特點"無連接"相沖突。更重要地問題就是IntServ面臨地可擴展性(scalability)問題和魯棒性(rubustness)問題,這主要是因為在分布式網(wǎng)絡(luò)環(huán)境中,很難維持動態(tài)的、可復(fù)制的傳輸流狀態(tài)一致性。
早期的IntServ是面向單流的,在路由器配置和使用多域分類準則,這給路由器尤其是主干網(wǎng)絡(luò)核心路由器帶來了巨大負荷。為了增加IntServ的擴展性,近期RSVP已經(jīng)開始支持流聚集,即將沿相同業(yè)務(wù)流傳輸路徑流聚合成宏流(macro-flow),按宏流來預(yù)留資源。這雖然減輕了核心路由器的一些負擔,但IntServ本身的體系結(jié)構(gòu)已經(jīng)決定了其高復(fù)雜性,而且由于路徑數(shù)是邊界節(jié)點數(shù)的平方,宏流數(shù)仍然很龐大。
由于IntServ/RSVP體系存在著諸多問題,一種新的體系結(jié)構(gòu)便應(yīng)運而生,這就是區(qū)分服務(wù)體系結(jié)構(gòu)(Differentiated Services,DiffServ)。
4.區(qū)分服務(wù)
區(qū)分服務(wù)簡介
DiffServ的最大特點就是簡單有效、擴展性強。其實施特點是采用聚合的機制將具有相同特性的若干業(yè)務(wù)流聚合起來,為整個聚合流提供服務(wù),而不再面向單個業(yè)務(wù)流。也就是說在DiffServ網(wǎng)絡(luò)邊界路由器上保持每流狀態(tài),核心路由器只負責數(shù)據(jù)包的轉(zhuǎn)發(fā)而不保持狀態(tài)信息。這種Core-Stateless結(jié)構(gòu)有很強的擴展性。其基本實現(xiàn)方法是:
簡化網(wǎng)絡(luò)內(nèi)部節(jié)點的服務(wù)機制。在網(wǎng)絡(luò)內(nèi)部的核心路由器中只保存簡單的DSCP(DiffServ CodePoint)與PHB的對應(yīng)機制,在數(shù)據(jù)流進入核心路由器時只根據(jù)數(shù)據(jù)包頭部DS(Differ-
entiated Services)域中的DSCP進行轉(zhuǎn)發(fā),而業(yè)務(wù)流狀態(tài)信息的保存與流監(jiān)控機制的實現(xiàn)等都在網(wǎng)絡(luò)邊界節(jié)點進行,內(nèi)部節(jié)點是狀態(tài)無關(guān)的。
聚合網(wǎng)絡(luò)內(nèi)部核心路由器的服務(wù)對象。采用流聚集的方式進行傳輸控制,具有相同DSCP的業(yè)務(wù)流組成一個宏流(macro-flow),核心路由器的服務(wù)對象即是宏流而不是單流(micro-flow),單流信息只在網(wǎng)絡(luò)邊界節(jié)點保存和處理。
DiffServ大大降低了信令的工作,而將重點放在流聚集以及適用于全網(wǎng)業(yè)務(wù)等級的一套"逐跳行為"上。我們可以根據(jù)預(yù)先確定的規(guī)則對數(shù)據(jù)流進行分類,從而將多種應(yīng)用數(shù)據(jù)流聚集為有限的幾種數(shù)據(jù)流等級。具體而言,邊界節(jié)點根據(jù)用戶的流規(guī)格(profile)和資源預(yù)留信息對業(yè)務(wù)流進行分類、整形、標記、聚合為不同的流聚集,流聚集信息包含在報文IP頭部的DSCP標記域中。核心路由器在調(diào)度轉(zhuǎn)發(fā)IP包時以流聚集為服務(wù)對象,根據(jù)IP包頭不同的DSCP提供不同的轉(zhuǎn)發(fā)服務(wù)質(zhì)量,這種對不同類型的數(shù)據(jù)報進行轉(zhuǎn)發(fā)的方式,稱為"逐跳行為"(Per-Hop-Behavior,PHB),實際上是一種相對優(yōu)先級機制。
實際上,按照DS域的標記,以相應(yīng)方式提供不同質(zhì)量的數(shù)據(jù)包轉(zhuǎn)發(fā)服務(wù),也正是區(qū)分服務(wù)名字的由來。美國正在開展的下一代互聯(lián)網(wǎng)計劃Internet2便是選擇DiffServ作為其QoS策略。
區(qū)分服務(wù)的體系結(jié)構(gòu)
雖然DiffServ仍在不斷的發(fā)展,一些標準仍在制定、完善之中,但經(jīng)過幾年的發(fā)展,DiffServ的相關(guān)概念及模型已經(jīng)比較成熟了,DiffServ體系結(jié)構(gòu)也已經(jīng)比較明確了。在此基礎(chǔ)上,與服務(wù)提供有關(guān)的問題,如DSCP的定義、PHB服務(wù)的定義等等已逐步完善。區(qū)分服務(wù)體系結(jié)構(gòu)如圖3所示。
其中的DiffServ區(qū)域是由一些相連的DiffServ節(jié)點構(gòu)成的集合,它們有統(tǒng)一的服務(wù)提供策略,且實現(xiàn)一致的PHB組,比如某個ISP的網(wǎng)絡(luò)或者內(nèi)部網(wǎng)。每個DS區(qū)域通過邊界節(jié)點(boundary
node)與非DS區(qū)域相連,根據(jù)不同的數(shù)據(jù)流傳輸方向,邊界節(jié)點可以分為入口節(jié)點和出口節(jié)點。
為了保證用戶能從ISP那里獲得所需要的服務(wù)質(zhì)量,用戶必須和ISP之間簽訂有服務(wù)等級協(xié)定(Service Level Agreement, SLA),而ISP之間也必須建立業(yè)務(wù)流調(diào)節(jié)協(xié)定(Traffic
Condition Agreement, TCA),SLA規(guī)范了ISP對客戶端網(wǎng)絡(luò)所支持的業(yè)務(wù)類別以及每種類別的業(yè)務(wù)流數(shù)量,TCA則規(guī)范了ISP之間的數(shù)據(jù)流應(yīng)該滿足的一些約定。
這樣,當有數(shù)據(jù)流進入DS區(qū)域時,入口節(jié)點對其進行分類(classifier)、調(diào)節(jié)(condition),保存流(單流或聚流)的狀態(tài)信息,根據(jù)事先和用戶約定的流規(guī)格對流進行計量(metering)、標記(marking)、整形(sharping)、丟棄(dropping)等,以使輸入流符合SLA,同時在包頭標記DSCP值,并將其加入相應(yīng)的行為聚集BA(Behavior
Aggregate)。出口節(jié)點也可能需要對輸出流進行調(diào)節(jié),以保證其與下游DS區(qū)域的TCA相符。
DiffServ區(qū)(region)則是由連續(xù)的DS區(qū)域構(gòu)成。一個DS區(qū)內(nèi)的DS區(qū)域可以支持不同的PHB組,并且各自區(qū)域的DSCP到PHB的映射函數(shù)也可能不相同。在不同的DS區(qū)域之間,必須對SLA和TCA進行調(diào)節(jié),以協(xié)調(diào)彼此之間的服務(wù)語義。這樣,通過在上游DS區(qū)域和下游DS區(qū)域之間建立SLA或TCA,區(qū)分服務(wù)可以擴展到多個DS區(qū)域。
圖3 區(qū)分服務(wù)體系結(jié)構(gòu)示意圖
在圖3中,我們假設(shè)客戶端網(wǎng)絡(luò)已經(jīng)和ISP建立了相應(yīng)的SLA,ISP之間也建立了TCA。如果客戶端網(wǎng)絡(luò)中的主機A向另一客戶端網(wǎng)絡(luò)的主機B發(fā)送數(shù)據(jù)流,則數(shù)據(jù)包在客戶端網(wǎng)絡(luò)中路由到達與它直接相連的ISP的網(wǎng)絡(luò)N1,邊界路由器E1根據(jù)用戶與ISP之間的SLA通過查看數(shù)據(jù)包的頭部信息對它進行分類、監(jiān)控、標記以及整形,以使它符合SLA。被標記了DSCP的數(shù)據(jù)包在N1中傳輸,直到到達N1的出口節(jié)點。在N1的出口節(jié)點,邊界路由器根據(jù)N1與N2之間的TCA對業(yè)務(wù)流進行整形,使它符合N1與N2網(wǎng)絡(luò)之間的TCA。業(yè)務(wù)流依次通過中間的每個ISP,最后到達接收端所在的客戶端網(wǎng)絡(luò)。
區(qū)分服務(wù)標記域與區(qū)分服務(wù)標記DSCP
IP包頭部的區(qū)分服務(wù)標記域(DS Field)是DS區(qū)域邊界節(jié)點和內(nèi)部節(jié)點傳輸流聚集信息的媒介,是內(nèi)部核心路由器轉(zhuǎn)發(fā)報文的依據(jù),是連接報文與轉(zhuǎn)發(fā)服務(wù)(PHB)的橋梁,也是邊界節(jié)點與其它DS區(qū)域根據(jù)TCA進行調(diào)節(jié)的依據(jù)。
DS標記域定義為IPv4頭部的TOS(Type of Service)字節(jié)或IPv6頭部的流類型(Traffic Class)字節(jié)。如圖4所示。其中DSCP(6bit)即為區(qū)分服務(wù)標記,CU(2bit)在本體系中沒有使用,IETF已將它定義為ECN(Explicit
Congestion Notification,顯式擁塞指示)使用。對于不支持CU域的路由器,當決定所收到的報文的PHB時,將忽略CU的值;對于不支持該域的主機,在發(fā)送數(shù)據(jù)包的時候,將該域的值置零。下行節(jié)點則通過識別這個字段,獲取信息來處理到達輸入端口的數(shù)據(jù)包,并將它們正確地轉(zhuǎn)發(fā)給下一跳的路由器。
分服務(wù)中的分類和調(diào)節(jié)機制
為了使用戶數(shù)據(jù)流符合SLA和TCA,邊界節(jié)點要對其進行分類和調(diào)節(jié),因而從功能上可以分為兩個模塊:分類器(classifier)和調(diào)節(jié)器(conditioner),如圖5所示。
分類器根據(jù)數(shù)據(jù)包頭部的某些域(如DSCP或MF五元組)對數(shù)據(jù)包進行分類。目前定義了兩種類型的分類器:
行為聚集(Behavior Aggregate,BA)分類器:根據(jù)包頭的DSCP來對包進行分類。
多域(Multi-Field,MF)分類器:根據(jù)包頭部中多個域內(nèi)容的組合來進行分類,如源地址、目標地址、DS域、協(xié)議標識、源端口號以及目標端口號等。
從功能上,調(diào)節(jié)器可分為計量器(meter)、標記器(marker)、整形器(sharper)和丟包器(dropper)。
計量器根據(jù)TCA中所規(guī)范的業(yè)務(wù)流要求測量被分類器所選定的業(yè)務(wù)流的某些實時屬性,并將所測量到的數(shù)據(jù)包的統(tǒng)計信息送往其它的調(diào)節(jié)功能模塊。
標記器設(shè)置報文的DS域為一特定的DSCP,并將標記了的包添加到一特定的DS行為聚集中。標記器可以將所有送入到它那兒的包標記為同一個DSCP值,也可以配置成根據(jù)計量器的統(tǒng)計信息將其標記為同一PHB組內(nèi)的PHB所對應(yīng)的DSCP值。
整形器和丟包器則通過延遲或丟棄業(yè)務(wù)流中的包使得業(yè)務(wù)流符合TCA流規(guī)范。
隨著對網(wǎng)絡(luò)業(yè)務(wù)流特性研究的深入發(fā)展,調(diào)節(jié)器的實現(xiàn)技術(shù)也日漸成熟,通常的做法是用令牌桶(token bucket)和漏斗桶(leaky bucket)等算法進行適當?shù)慕M合。近來又提出了一種新的算法:基于時間滑動窗口(Time
Slide Windows,TSW)的算法,它是通過計算數(shù)據(jù)包的平均到來速度來對包進行分類和標記。
在客戶端網(wǎng)絡(luò)與ISP建立的SLA有兩種形式:靜態(tài)SLA和動態(tài)SLA。靜態(tài)SLA根據(jù)具體的策略由網(wǎng)絡(luò)操作員事先確定客戶網(wǎng)絡(luò)所需要的網(wǎng)絡(luò)資源,并一直為客戶端網(wǎng)絡(luò)保留相應(yīng)的資源,這樣,客戶端網(wǎng)絡(luò)在發(fā)送數(shù)據(jù)流的時候,并不需要向ISP申請網(wǎng)絡(luò)資源。顯然,這種SLA實現(xiàn)簡單,但缺乏靈活性,網(wǎng)絡(luò)資源利用率不高。動態(tài)SLA則相反,它提供了較強的靈活性。當客戶網(wǎng)絡(luò)需要發(fā)送數(shù)據(jù)時,它首先向ISP申請網(wǎng)絡(luò)資源,ISP根據(jù)客戶請求分配資源,并在邊界節(jié)點建立起相應(yīng)的SLA。動態(tài)SLA可以使用帶寬代理(Bandwidth
Broker, BB)(如圖6)或者RSVP來實現(xiàn)
區(qū)分服務(wù)中的逐跳行為
逐跳行為PHB是一個DS節(jié)點調(diào)度轉(zhuǎn)發(fā)特定流聚集行為的外特性描述,本質(zhì)上,PHB描述的是單個節(jié)點為特定流聚集分配資源的方式。IETF目前已經(jīng)定義的PHB有:
加速型轉(zhuǎn)發(fā)(Expedited Forwarding,EF):可使時延和時延抖動最小并且可以提供最高級的綜合QoS確保型轉(zhuǎn)發(fā)(Assured
Forwarding,AF):超過流量規(guī)劃值的數(shù)據(jù)流,不會按照未超過規(guī)劃值時那么高的概率傳送。這意味著它可以被降級,但是不會被丟棄。
允許丟包的加速型轉(zhuǎn)發(fā)EFD:除了EFD允許丟包而EF幾乎沒有丟包外,EFD與EF的外特性幾乎相同。EFD的應(yīng)用主要是在無線移動網(wǎng)絡(luò)中。
缺省型轉(zhuǎn)發(fā) BE:相當于傳統(tǒng)的極力而為調(diào)度轉(zhuǎn)發(fā)行為的PHB。
準缺省型轉(zhuǎn)發(fā) LBE:比BE優(yōu)先級還要低的PHB行為,其作用是在擁塞時有比BE更高的丟包優(yōu)先級,提高BE的性能。
區(qū)分服務(wù)的基本服務(wù)類型
與IntServ類似,Diff-Serv也定義了三種服務(wù)類型:
盡力而為的服務(wù):類似于目前Internet上盡力而為的服務(wù)。
獎賞服務(wù)(Premium Services,PS):為用戶提供低延遲、低抖動、低丟包率和保證帶寬的端到端或者網(wǎng)絡(luò)邊界到邊界的傳輸服務(wù)。PS是目前區(qū)分服務(wù)模型中定義的級別最高的服務(wù)種類。這種"三低一保證"的服務(wù)類似于傳統(tǒng)運營商網(wǎng)絡(luò)的專線業(yè)務(wù),因此也稱為"虛擬專線"服務(wù)。
確保服務(wù)(Assured Services,AS):確保服務(wù)是從統(tǒng)計上保證用戶的帶寬,其初衷是在網(wǎng)絡(luò)擁塞的情況下,也能保證用戶有一定量的預(yù)約帶寬。AS的著眼點是帶寬和丟包率,而不太注重延遲和抖動。AS最具吸引力的是其實現(xiàn)機制較為簡單,只要采用簡單的標記和丟棄機制就能實現(xiàn)IP
QoS。在發(fā)生擁塞時,確保服務(wù)通過控制丟包優(yōu)先級,提供了比"盡力而為"服務(wù)更好的服務(wù)。確保服務(wù)的基本思路是:
邊界路由器對進入DS域的數(shù)據(jù)包進行標記,預(yù)約帶寬內(nèi)的包標為IN(in profile),否則標為OUT(out profile)。
發(fā)生擁塞時,核心路由器根據(jù)包頭的標記決定丟包概率,Out包的丟棄概率大于In包。從而在統(tǒng)計意義上上保證用戶的預(yù)約帶寬。
目前,獎賞服務(wù)已經(jīng)比較成熟、穩(wěn)定,而確保服務(wù)仍然處于發(fā)展之中,其焦點主要集中在如何保證聚流之間的個公平性以及聚流內(nèi)各單流之間的公平性,這主要是由于Internet上數(shù)據(jù)流的特性引起的。研究表明,現(xiàn)有的確保服務(wù)方案并不能真正確保用戶得到的服務(wù),因此,如何使得確保服務(wù)能夠真正起到確保的作用,還有待進一步研究。
5.多協(xié)議標簽交換MPLS
1997年,以Cisco公司為主的幾家公司(包括Ipsilon、IBM、Cascade、Toshiba)提出了多協(xié)議標簽交換(Multiprotocol
Lable Switch,MPLS)技術(shù)。MPLS技術(shù)產(chǎn)生的初衷就是為了綜合利用網(wǎng)絡(luò)核心的交換技術(shù)和網(wǎng)絡(luò)邊緣的IP路由技術(shù)各自的優(yōu)點而產(chǎn)生的其最初設(shè)計目標是將第二層的交換速度引入到第三層;跇撕灥慕粨Q方式允許路由器在作轉(zhuǎn)發(fā)決定的時候僅僅以簡單的標簽為基礎(chǔ),而不是基于目標IP地址作復(fù)雜的路由查找,F(xiàn)在,MPLS更成為流量工程(Traffic
Engeering)和虛擬專用網(wǎng)(Virtual Private Network,VPN)方案的重要解決手段,并且日益成為擴大IP網(wǎng)絡(luò)規(guī)模的重要標準。
MPLS中的常用的術(shù)語
標簽(Label):標簽是一個包含在每個包中的短的具有固定長度的數(shù)值,用于通過網(wǎng)絡(luò)轉(zhuǎn)發(fā)包。
標簽邊緣路由器(Lable Edge Router,LER):LER是MPLS網(wǎng)絡(luò)同其他網(wǎng)絡(luò)相連的邊緣設(shè)備,它提供流量分類和標簽的映射(作為Ingress)、標簽的移除功能。
標簽交換路由器(Lable Switching Router,LSR):LSR是MPLS網(wǎng)絡(luò)的核心設(shè)備,提供標簽交換、標簽分發(fā)功能,具有第三層轉(zhuǎn)發(fā)分組和第二層交換分組的能力。
等價轉(zhuǎn)發(fā)類(Forwarding Equivalence Class,F(xiàn)EC):FEC是在轉(zhuǎn)發(fā)過程中以等效的方式處理的一組數(shù)據(jù)包,例如目的地址前綴相同的數(shù)據(jù)包。FEC歸類的方法可以各不相同,粒度也可有差別。
標簽交換路徑(Lable Switching Path,LSP):MPLS實際上是一個面向連接的系統(tǒng),標簽的分配實際上就是一個建立連接的過程,也即建立了一條LSP。LSP可以是動態(tài)的,也可以是靜態(tài)的,動態(tài)LSP是通過路由信息自動生成,靜態(tài)LSP是被明確提供的。
標簽分配協(xié)議(Label Distribution Protocol,LDP):LDP提供一套標準的信令機制用于有效地實現(xiàn)標簽的分配與轉(zhuǎn)發(fā)功能。LDP基于原有的網(wǎng)絡(luò)層路由協(xié)議OSPF、IS-IS、RIP、EIGRP或BGP等構(gòu)建標簽信息庫,并根據(jù)網(wǎng)絡(luò)拓撲結(jié)構(gòu),在MPLS域邊緣節(jié)點(即入節(jié)點與出節(jié)點)之間建立LSP。LDP主要執(zhí)行以下4個操作:
發(fā)現(xiàn)(Discovery):發(fā)布并維護網(wǎng)絡(luò)中的LSR。
會晤(Session):建立和保持兩個對等LDP之間的會晤。
廣告( Advertisement):執(zhí)行標簽的分配和傳播( allocation and distribution)。通知(Notification):通告差錯信息。
MPLS的基本原理
MPLS協(xié)議的關(guān)鍵是引入了標簽(Label)的概念。一對LSR必須在標簽的數(shù)值和意義上一致。例如,下行LSR會給上行LSR發(fā)送一個特定標簽X.代表一個特定的稱作A的FEC。于是,一個標簽只在一對正在通信的LSR之間起作用,并用來表示屬于一個從上行LSR流向下行LSR的特定FEC的分組。MPLS可以支持添加到現(xiàn)有的幀或分組結(jié)構(gòu)(如以太網(wǎng)、PPP)的標簽,也可以利用包含在數(shù)據(jù)鏈路層(如幀中繼和ATM)中的標簽結(jié)構(gòu)。
標簽的格式取決于分組封裝所在的介質(zhì)。例如,ATM封裝的分組(信元)采用VPI和/或VCI數(shù)值作為標簽,而幀中繼PDU采用DLCI作為標簽。對于那些沒有內(nèi)在標簽結(jié)構(gòu)的介質(zhì)封裝,則采用一個特殊的數(shù)值填充。圖7給出4字節(jié)填充標簽的格式,它包含一個20bits的標簽值、一個3bits的CoS值、一個1bit的堆棧標識符和一個8bits的TTL值。此外.如果填充值被插入到一個PPP或以太網(wǎng)幀中,包含在各幀頭中的一個協(xié)議ID(或以太網(wǎng)類型)表示一個幀或者一個
MPLS單播或組播幀。
傳統(tǒng)的路由器是通過逐步查找路由/轉(zhuǎn)發(fā)表來轉(zhuǎn)發(fā)數(shù)據(jù)的(hop by hop路由方式),由于路由查找基本上是通過CPU來完成的,所以轉(zhuǎn)發(fā)速率受到很大的限制,這種轉(zhuǎn)發(fā)效率遠遠不能滿足目前互聯(lián)網(wǎng)的發(fā)展需要,尤其是一些高帶寬和對時延敏感的多媒體業(yè)務(wù)大量進入互聯(lián)網(wǎng)后。而MPLS的一個根本目的就是解決轉(zhuǎn)發(fā)速率問題。其方法就是依據(jù)標簽這個短小、定長、非結(jié)構(gòu)化并只具有局部意義的標識來轉(zhuǎn)發(fā)分組。由于標簽的這些特點,所以標簽的查找可以采用數(shù)組來實現(xiàn),無論是用硬件還是用軟件來實現(xiàn)都不難。
當一個數(shù)據(jù)包進入MPLS網(wǎng)絡(luò)時,它首先在LER處被分配一個標簽。報文沿著LSP進行轉(zhuǎn)發(fā),路徑中的每個LSR僅僅根據(jù)標簽內(nèi)容來做出轉(zhuǎn)發(fā)決定。在每一跳中,LSR剝離現(xiàn)有的標簽,將一個新的標簽應(yīng)用于該報文,并告訴下一跳如何轉(zhuǎn)發(fā)該報文。
具體而言,每個進入MPLS網(wǎng)絡(luò)的數(shù)據(jù)包被歸類為一個轉(zhuǎn)發(fā)等價類(Forwarding Equivalence Class, FEC),該等價類以一個標簽來標識,因此,報文中的標簽內(nèi)容也就表示了該報文所分配的FEC。傳統(tǒng)的路由器在進行包轉(zhuǎn)發(fā)時,各個路由器是獨立地作出轉(zhuǎn)發(fā)決定的,也就是說,每個路由器都將查看包頭的目的地址,而在MPLS中,只是在報文進入MPLS網(wǎng)絡(luò)的LER時查看包的目的地址,在其它路由器并不查看包的目的地址,而僅僅根據(jù)其標簽內(nèi)容來作出轉(zhuǎn)發(fā)決定。在數(shù)據(jù)包進入到LSR時,入域標簽映射(Incoming
Label Map, ILM)機制將入域包的標簽內(nèi)容與一組下一跳標簽轉(zhuǎn)發(fā)入口(The Next Hop Label Forwarding Entry,NHLFE)相映射。LSR查看該NHLFE,決定向哪個接口轉(zhuǎn)發(fā)該包,并對包的標簽棧執(zhí)行一個操作,然后將新的標簽壓入標簽棧,轉(zhuǎn)發(fā)所得到的結(jié)果。
MPLS在流量工程中的應(yīng)用
流量工程(Traffic Engineering,TE)的主要目的就是在促進有效、可靠的網(wǎng)絡(luò)操作的同時,優(yōu)化網(wǎng)絡(luò)資源的利用率和流量的性能。一般來說,它包含了技術(shù)的應(yīng)用、測量的科學準則、模型化、特征化(Characterization)和因特網(wǎng)流量的控制,以及如何將這些知識和技術(shù)應(yīng)用到實踐中來獲取一些特定的性能指標。由于網(wǎng)絡(luò)資源的昂貴和因特網(wǎng)激烈的商業(yè)競爭的天性,流量工程已經(jīng)成為大型自治系統(tǒng)(Autonomous
System,AS)中一個不可缺少的功能。
MPLS的最初設(shè)計目標是將第二層的交換速度引入到第三層,隨著第三層交換速度的大大提高,這一最初目標已經(jīng)不復(fù)存在了,而現(xiàn)在MPLS的最主要功能就是流量工程,即在多條可能的轉(zhuǎn)發(fā)路徑中進行負載平衡。
流量工程是指為業(yè)務(wù)流選擇路徑的處理過程,以在網(wǎng)絡(luò)中不同的鏈路、路由器和交換機之間平衡業(yè)務(wù)流負載。當網(wǎng)絡(luò)中存在多條并行或可選的路徑時,流量工程就顯得非常重要了。流量工程的主要目的是提供有效可靠的網(wǎng)絡(luò)操作,同時優(yōu)化網(wǎng)絡(luò)資源的利用和業(yè)務(wù)流性能。流量工程的目標是在一給定節(jié)點與另一節(jié)點之間計算一條路徑(源路由),該路徑不違反它的約束(例如帶寬/管理要求),并且從一些數(shù)量指標看來是最優(yōu)的。一旦路徑被計算后,流量工程將負責在該路徑上建立和維護轉(zhuǎn)發(fā)狀態(tài)。
圖8 MPLS體系結(jié)構(gòu)
6.子網(wǎng)帶寬管理SBM
由于數(shù)據(jù)包的發(fā)送過程必須經(jīng)過發(fā)送端主機以及接收端主機的所有OSI協(xié)議層,甚至可能要經(jīng)過中間某個網(wǎng)絡(luò)的子網(wǎng)。這就涉及到一個問題:如何在子網(wǎng)內(nèi),即在數(shù)據(jù)鏈路層上保證高優(yōu)先級的數(shù)據(jù)幀獲得高級別的服務(wù)。某些鏈路層的技術(shù)已經(jīng)可以支持QoS了,例如異步傳輸模式ATM。而其它更多的LAN技術(shù)(如以太網(wǎng)技術(shù))最初并非為支持QoS設(shè)計的。以太網(wǎng)作為共享的廣播媒介,在它的交換方式中,提供了一種類似與傳統(tǒng)的盡力而為的IP服務(wù)。為此,IETF的ISSLL小組定義了上層QoS協(xié)議和服務(wù)與以太網(wǎng)之類的數(shù)據(jù)鏈路層技術(shù)之間的映射關(guān)系,并且提出了子網(wǎng)帶寬管理(Subnet
Bandwidth Management,SBM)的方案,它適用于802.1 LAN,如以太網(wǎng)、令牌環(huán)和FDDI等。SBM是數(shù)據(jù)鏈路層上的QoS,它通過將高層QoS映射到特定的數(shù)據(jù)鏈路層上實現(xiàn)在第二層上的快速交換。
SBM也是一個信令協(xié)議,它允許網(wǎng)絡(luò)節(jié)點和交換機之間在SBM框架內(nèi)進行通信和協(xié)調(diào),并實現(xiàn)向高層QoS的映射。在SBM體系結(jié)構(gòu)中,要求所有的數(shù)據(jù)幀必須通過至少一個SBM交換機。SBM的主要構(gòu)件有三個部分:
請求模塊(Request Module, RM):請求模塊駐留在每個端系統(tǒng)中而不駐留在任何交換機中。請求模塊根據(jù)管理員所定義的策略,將高層的QoS協(xié)議參數(shù)映射到第二層的優(yōu)先級別。
帶寬分配器(Bandwidth Allocator, BA):帶寬分配器保存子網(wǎng)內(nèi)資源的分配狀態(tài),并且根據(jù)可用資源的情況以及管理員所定義的策略來執(zhí)行接入控制。
通信協(xié)議(Communication Protocols, CP):通信協(xié)議用于在SBM系統(tǒng)中,各個不同的組件之間進行通信。SBM體系結(jié)構(gòu)提供了RM-to-BA以及BA-to-BA的信令機制來請求資源、改變或刪除分配資源。
SBM有兩種形式的體系結(jié)構(gòu):集中式結(jié)構(gòu)和分布式結(jié)構(gòu),它取決于BA所處的位置,如圖9和圖10所示。不管在哪種形式的結(jié)構(gòu)中,RM都必須在需要請求資源的端系統(tǒng)中。APP表示需要使用RM的應(yīng)用,它可以是用戶應(yīng)用程序,也可以是高層協(xié)議(如RSVP)。
在集中式結(jié)構(gòu)中,只有單個的BA來實現(xiàn)整個子網(wǎng)的帶寬管理與分配,每個端系統(tǒng)中包含一個RM,而網(wǎng)橋和交換機中則不需要RM。當端系統(tǒng)需要請求資源時,則由它的RM首先向BA發(fā)出請求通信。在這種結(jié)構(gòu)中,BA需要知道整個子網(wǎng)的拓撲結(jié)構(gòu)。
在分布式結(jié)構(gòu)中,子網(wǎng)內(nèi)所有的網(wǎng)絡(luò)設(shè)備中都需要實現(xiàn)BM功能,所有的端系統(tǒng)中仍然需要實現(xiàn)RM。在這種結(jié)構(gòu)中,每個BA需要知道與它連接的本地網(wǎng)段(一個子網(wǎng)可能包括多個網(wǎng)段)的拓撲結(jié)構(gòu)。
關(guān)于作者
姜明,計算機專業(yè)博士研究生。主要研究方向為網(wǎng)絡(luò)體系結(jié)構(gòu)、網(wǎng)絡(luò)QoS。非常高興能夠與廣大同行就IP QoS及IPv6協(xié)議方面的相關(guān)問題進行切磋,歡迎大家對本文多提寶貴意見,我的Email是:jiangmingcc@163.com。
下一代互聯(lián)網(wǎng)關(guān)鍵技術(shù)IP QoS(2)
賽迪網(wǎng)
中國信息化(industry.ccidnet.com)
相關(guān)鏈接: