從2006年開始出現(xiàn)的云計(jì)算概念,其熱度一直持續(xù)到今天,并有愈演愈烈之勢(shì),幾乎所有企業(yè)IT業(yè)務(wù)都在向云計(jì)算演進(jìn)。在此期間,數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備更是以每年40%以上的速度增長(zhǎng),其中數(shù)據(jù)中心級(jí)核心交換機(jī)可以說(shuō)是整個(gè)云計(jì)算網(wǎng)絡(luò)架構(gòu)的一個(gè)關(guān)鍵節(jié)點(diǎn)。
何以誕生?
數(shù)據(jù)中心級(jí)交換機(jī)之所以誕生,背后有著深刻的原因。根本的支撐是整個(gè)IT業(yè)界的應(yīng)用模型發(fā)生了革命性的變化,從Client/Server的流量模型向Server/Server流量模型演進(jìn),從單播為主的流量模型到Incast和多播流量的大量使用。同時(shí)伴隨著的是大量企業(yè)關(guān)鍵業(yè)務(wù)IT化,企業(yè)客戶對(duì)IT的投資更加活躍,大規(guī)模服務(wù)器集群、虛擬化、大數(shù)據(jù)等技術(shù)的成熟都對(duì)網(wǎng)絡(luò)提出了更高的業(yè)務(wù)要求。
從附表的分析中我們可以發(fā)現(xiàn),業(yè)務(wù)應(yīng)用的需求驅(qū)動(dòng)加上產(chǎn)品技術(shù)的成熟是數(shù)據(jù)中心核心交換機(jī)成功的關(guān)鍵。所以當(dāng)我們?cè)O(shè)計(jì)下一代的數(shù)據(jù)中心核心交換機(jī)時(shí),也謹(jǐn)遵守這一規(guī)則。
現(xiàn)狀如何?
當(dāng)前條件下,主流網(wǎng)絡(luò)設(shè)備廠商的數(shù)據(jù)中心級(jí)核心交換機(jī)基本具備如下特點(diǎn):
1.較高可擴(kuò)展性可擴(kuò)展性的應(yīng)用場(chǎng)景主要集中在如下3個(gè)方面:
首先是高速擴(kuò)展的數(shù)據(jù)中心,它需要容納更多的服務(wù)器接入、更高的接入端口速率、更大的數(shù)據(jù)吞吐量,來(lái)滿足不斷新增的服務(wù)器接入需求。要達(dá)成這一目標(biāo),需要依賴更高性能的硬件,生產(chǎn)出高密度、高速接口的新網(wǎng)絡(luò)設(shè)備。
其次是虛擬機(jī)遷移的支持,需要一個(gè)可擴(kuò)展的大二層網(wǎng)絡(luò)來(lái)匹配虛擬機(jī)應(yīng)用。使虛擬機(jī)的靈活部署可以在更廣大的物理場(chǎng)點(diǎn)之間實(shí)現(xiàn)。這就需要新協(xié)議、新硬件特性的支持,比如全新的二層路由協(xié)議TRILL,還有跨數(shù)據(jù)中心的L2互連支持。
最后是網(wǎng)絡(luò)架構(gòu)擴(kuò)展的需求,現(xiàn)代數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)越來(lái)越趨向于采用模塊化的方式,它易部署、易維護(hù)、易管理,能有效提高部署效率,降低運(yùn)維的復(fù)雜度。
2.網(wǎng)絡(luò)設(shè)備的自身虛擬化能力網(wǎng)絡(luò)設(shè)備自身的虛擬化應(yīng)用場(chǎng)景主要集中在如下3個(gè)方面:
首先是簡(jiǎn)化網(wǎng)絡(luò)拓?fù),降低網(wǎng)絡(luò)運(yùn)維的復(fù)雜性。比較典型的業(yè)務(wù)特性是雙(多)機(jī)集群。目前業(yè)界比較成熟的是雙機(jī)集群;而多機(jī)集群的技術(shù)難度遠(yuǎn)大于雙機(jī)集群,現(xiàn)在還處于試水階段;另外還包括接入層交換機(jī)的各種矩陣擴(kuò)展方式,虛擬堆疊技術(shù)等等。
其次是網(wǎng)絡(luò)資源共享、靈活調(diào)配。目前已有多個(gè)廠家提供虛擬交換機(jī)技術(shù)來(lái)達(dá)成這一目標(biāo)。虛擬交換機(jī)幫助用戶快速部署網(wǎng)絡(luò),并提升網(wǎng)絡(luò)資源的利用率,包括機(jī)房空間、供電、設(shè)備板卡等,是一個(gè)不可多得的好技術(shù)。
最后是網(wǎng)絡(luò)對(duì)虛擬機(jī)的感知以及網(wǎng)絡(luò)適配。它要求網(wǎng)絡(luò)可以以虛擬機(jī)的顆粒度進(jìn)行管理。這類技術(shù)是現(xiàn)在業(yè)界在實(shí)現(xiàn)上最不成熟的一環(huán),目前有802.1BR、802.1Qbg、甚至是帶外網(wǎng)管實(shí)現(xiàn)……一線廠商或多或少都有自己的方案,但最終誰(shuí)能占據(jù)主流市場(chǎng)尚未可知。
3.多業(yè)務(wù)支持和網(wǎng)絡(luò)融合多業(yè)務(wù)支持和網(wǎng)絡(luò)融合的應(yīng)用場(chǎng)景主要集中在如下3個(gè)方面:
首先是對(duì)復(fù)雜網(wǎng)絡(luò)業(yè)務(wù)的支持。譬如,支持多租戶、移動(dòng)IP、VPN等。這需要引入各種創(chuàng)新的協(xié)議和硬件芯片(如各種VPN技術(shù)、VxLAN/NvGRE、IPv6等)。如果用芯片直接適配復(fù)雜業(yè)務(wù)的處理,可以獲得較高的處理性能;目前基本都在啟動(dòng)階段,沒(méi)有成熟應(yīng)用。
其次是對(duì)傳統(tǒng)業(yè)務(wù)的集成。常用的傳統(tǒng)業(yè)務(wù)有防火墻、網(wǎng)絡(luò)分析、負(fù)載均衡設(shè)備等。通常的做法是用多業(yè)務(wù)板塊在設(shè)備層面進(jìn)行集成。由于這些復(fù)雜業(yè)務(wù)不能在ASIC上直接實(shí)現(xiàn),所以用加載CPU的業(yè)務(wù)板卡來(lái)實(shí)現(xiàn)是一個(gè)比較快速、靈活的解決方案。好處是可以支持多種業(yè)務(wù),甚至允許用戶自定義;缺點(diǎn)是性能一般都不太高。
最后看網(wǎng)絡(luò)融合。在數(shù)據(jù)中心,最主要的內(nèi)容就是對(duì)傳統(tǒng)的FC網(wǎng)絡(luò)和HPC網(wǎng)絡(luò)進(jìn)行融合。目標(biāo)是實(shí)現(xiàn)Everything over Ethernet。10GE和DCB等新技術(shù)的出現(xiàn)使得Ethernet可以承載原來(lái)所不能承載的異種網(wǎng)絡(luò),如FCoE、RDMAoE等等。
缺憾在哪?盡管數(shù)據(jù)中心級(jí)的核心交換機(jī)在業(yè)務(wù)和技術(shù)上取得了很大突破,但目前還存在不少缺憾,主要包括:
1.網(wǎng)絡(luò)擴(kuò)展能力有限在設(shè)備的可擴(kuò)展性上,核心交換機(jī)能滿足支撐未來(lái)5年乃至10年的網(wǎng)絡(luò)擴(kuò)展需求的廠家?guī)缀鯖](méi)有;究其根本原因就是設(shè)備架構(gòu)設(shè)計(jì)和網(wǎng)絡(luò)業(yè)務(wù)快速擴(kuò)張速度的不匹配。
服務(wù)器虛擬化后,對(duì)二層的數(shù)據(jù)交換產(chǎn)生了巨大需求,但二層網(wǎng)絡(luò)由于天生的缺陷,網(wǎng)絡(luò)節(jié)點(diǎn)的可擴(kuò)展性非常有限。
一些傳統(tǒng)的二層網(wǎng)絡(luò)技術(shù),如STP等,只解決了二層網(wǎng)絡(luò)的破環(huán),卻在如何做大二層網(wǎng)絡(luò)上并未涉及,在多個(gè)數(shù)據(jù)中心之間如何實(shí)現(xiàn)虛擬機(jī)的二層互通,現(xiàn)在也沒(méi)有一個(gè)非常成熟的方案。
2.網(wǎng)絡(luò)虛擬化和應(yīng)用虛擬化分離應(yīng)用虛擬化以后,客戶的業(yè)務(wù)、應(yīng)用將變得更加靈活,調(diào)整起來(lái)會(huì)變得更加動(dòng)態(tài)、頻繁。
網(wǎng)絡(luò)虛擬化如何跟隨業(yè)務(wù)、應(yīng)用的變化進(jìn)行動(dòng)態(tài)適配,快速、自動(dòng)地進(jìn)行部署變更,也是一道很大的考題。
3.網(wǎng)絡(luò)行為開放有限隨著客戶應(yīng)用環(huán)境的日益復(fù)雜,許多客戶都提出了網(wǎng)絡(luò)行為定制化的需求。因?yàn)槊總(gè)客戶的網(wǎng)絡(luò)環(huán)境都有其特點(diǎn),而廠家生產(chǎn)的標(biāo)準(zhǔn)化設(shè)備不能滿足所有客戶的特殊行為需求,所以業(yè)界出現(xiàn)了通過(guò)一個(gè)開放式標(biāo)準(zhǔn)接口來(lái)控制網(wǎng)絡(luò)設(shè)備行為的思潮。
OpenFlow/OpenStack/SDN等技術(shù)應(yīng)運(yùn)而生。盡管目前這些技術(shù)還比較稚嫩,和設(shè)備的適配上也不完美,但誰(shuí)也不能斷言將來(lái)這種將網(wǎng)絡(luò)控制的細(xì)節(jié)充分開放給外部應(yīng)用的架構(gòu)就一定走不通。
不管最終采用了什么技術(shù)——控制和轉(zhuǎn)發(fā)完全分離、網(wǎng)絡(luò)設(shè)備直接提供API接口、開放式平臺(tái)提供中間件……定制客戶化的網(wǎng)絡(luò)行為這一業(yè)務(wù)需求是不可忽略的。
4.“數(shù)據(jù)中心”和“園區(qū)網(wǎng)”核心的重復(fù)投資兩套核心設(shè)備固然能解決安全性問(wèn)題,但勢(shì)必帶來(lái)物理設(shè)備雙份投資,同時(shí)管理和維護(hù)成本也會(huì)相應(yīng)提高。
從客戶的角度看,使用同一硬件平臺(tái)支持?jǐn)?shù)據(jù)中心和園區(qū)網(wǎng),能獲得統(tǒng)一的管理、雙核心物理耦合(通過(guò)虛擬交換機(jī)來(lái)實(shí)現(xiàn))、便捷的部署和運(yùn)維等優(yōu)點(diǎn)。
從技術(shù)角度看,數(shù)據(jù)中心和園區(qū)網(wǎng)共享核心交換機(jī)是大勢(shì)所趨。
5.極高的電力成本比較歷代核心交換機(jī)的功耗會(huì)發(fā)現(xiàn)最近幾代設(shè)備的電力消耗越來(lái)越大。如果客戶把這些新型的交換機(jī)安裝在傳統(tǒng)供電設(shè)計(jì)的數(shù)據(jù)中心機(jī)房,那么供電就是個(gè)大問(wèn)題,而且溫度越高、對(duì)設(shè)備可靠性的沖擊就越大。
把數(shù)據(jù)中心級(jí)核心交換機(jī)的功耗降下來(lái)是一個(gè)非常重要的課題,有助于提高設(shè)備的可靠性,節(jié)約日益緊張的能源,降低對(duì)設(shè)備機(jī)房的安裝要求。