跨界競爭呼喚系統(tǒng)架構(gòu)創(chuàng)新
我們正在進入一個跨界競爭的新時代,每個行業(yè)都面臨著結(jié)構(gòu)性挑戰(zhàn),對電信行業(yè)來說尤其如此。
首先,從收入結(jié)構(gòu)來看,運營商的業(yè)務正遭遇來自IT產(chǎn)業(yè)的挑戰(zhàn)。之前,電信業(yè)務分為三個層次:終端、網(wǎng)絡和IT基礎設施以及上層應用。隨著網(wǎng)絡接入速率的大幅提升,導致IT產(chǎn)業(yè)從賣產(chǎn)品變成賣服務,骨干網(wǎng)絡和IT基礎設施逐漸變成云服務的形式。運營商如果能把云服務做好,就可以與AWS等云服務巨頭爭搶萬億美元的云市場,反之則將喪失很多傳統(tǒng)的電信業(yè)務,尤其是數(shù)據(jù)中心之間的專線業(yè)務等,比如阿里云就正在建設連接全球的云骨干網(wǎng)。
其次,運營商的效率和成本也面臨結(jié)構(gòu)性挑戰(zhàn)。如今,電信設備維護的OPEX支出約為CAPEX的三倍,給運營商帶來沉重的負擔。此外,電信網(wǎng)絡越來越復雜,超過了一個人的專業(yè)知識和能力,導致70%的重大網(wǎng)絡故障都是人為因素造成。正如加拿大運營商TELUS首席無線架構(gòu)師所說:“機械制造都走向自動化了,電信業(yè)還處于手工業(yè)的階段。”
要解決電信業(yè)面臨的挑戰(zhàn),僅僅靠產(chǎn)品創(chuàng)新是遠遠不夠的,需要整個系統(tǒng)架構(gòu)的創(chuàng)新和商業(yè)模式的創(chuàng)新,才能提升運營商的競爭力,解決結(jié)構(gòu)性問題。什么是系統(tǒng)架構(gòu)創(chuàng)新?以云計算為例,它并不是某個服務器或存儲產(chǎn)品的創(chuàng)新,而是通過全新的分布式系統(tǒng)提升資源利用效率,是系統(tǒng)級的創(chuàng)新。產(chǎn)品創(chuàng)新、系統(tǒng)架構(gòu)創(chuàng)新和商業(yè)模式創(chuàng)新三者相互支撐,互相促進。
為了滿足新時代的客戶需求,華為的創(chuàng)新體系即按照上述三個維度來設計。在產(chǎn)品層面,華為設計網(wǎng)絡設備的指導思想是“奧運精神”,即大容量、低時延,所有產(chǎn)品創(chuàng)新都圍繞這個目標進行。在系統(tǒng)架構(gòu)創(chuàng)新領域,華為的目標是構(gòu)建一個敏捷的自動化、智能化網(wǎng)絡,實現(xiàn)網(wǎng)絡的“自動駕駛模式”。在商業(yè)模式創(chuàng)新上包括兩個目標,第一是通過提供云服務成為世界五朵云之一,第二是構(gòu)建網(wǎng)絡時代的在線智能服務模式。
SoftCOM AI帶來全新價值
回顧華為網(wǎng)絡架構(gòu)的發(fā)展路徑,在ALL IP階段我們提出Single戰(zhàn)略,云計算崛起后,2012年進入ALL Cloud階段,我們提出SoftCOM來實現(xiàn)以數(shù)據(jù)中心為中心的網(wǎng)絡。近年來隨著人工智能技術的發(fā)展,我們提出要全面智能化(ALL Intelligence),將人工智能引入電信網(wǎng)絡,SoftCOM AI由此誕生,目的是實現(xiàn)網(wǎng)絡架構(gòu)層面的自治網(wǎng)絡,以及商業(yè)模式層面的服務2.0。
引入人工智能的自治網(wǎng)絡,意在構(gòu)建網(wǎng)絡領域的“工業(yè)4.0”,實現(xiàn)網(wǎng)絡“自動駕駛”。工業(yè)4.0有三個特征,即敏捷的設備、智能的控制和智慧的分析系統(tǒng),來實現(xiàn)生產(chǎn)的自動化,這對于電信業(yè)來說同樣適用。在電信網(wǎng)絡中,下層是網(wǎng)絡設備,上面是控制層,在整個網(wǎng)絡的控制和運維方面,端到端引入人工智能技術,構(gòu)建分段自治功能,每一段的自治通過上層運營系統(tǒng)實現(xiàn)端到端的自治能力,進而實現(xiàn)整網(wǎng)自治。自治網(wǎng)絡帶來的最大變化是運維維護人員不在整個業(yè)務流程里,是一個自動化的系統(tǒng),我們稱之為“網(wǎng)絡自動駕駛模式”,來實現(xiàn)整個網(wǎng)絡的自優(yōu)、自愈、自動化。
服務2.0的目標則是打造網(wǎng)絡領域的“工業(yè)互聯(lián)網(wǎng)”,提供在線數(shù)字化“智慧服務”。將這一服務理念延伸到電信行業(yè),未來的網(wǎng)絡在運營商側(cè)全自動化運行,華為則在后臺提供基于人工智能的全自動化在線服務,這種服務基于持續(xù)迭代的模式,根據(jù)業(yè)界慣例構(gòu)建“模型即服務”,永遠處于Beta階段,不斷更新和完善。
將AI引入電信網(wǎng)絡,帶來的全新價值是“可預測性”。電信網(wǎng)絡的管理和控制中心基于設備的南向接口和數(shù)據(jù)采集,通過一定的策略和規(guī)則,來實現(xiàn)對整個網(wǎng)絡的管理和調(diào)度。其實施的依據(jù)主要有三個條件,包括網(wǎng)絡的可達性、SLA要求和資源效率,這些是網(wǎng)絡實現(xiàn)自動化的基礎。但隨著網(wǎng)絡日益復雜,僅有這些已遠遠不夠,需要在網(wǎng)絡中引入基于算法的網(wǎng)絡管控、在線AI推理和數(shù)據(jù)分析,實現(xiàn)流量預測、質(zhì)量預測和故障預測。預測性是AI的核心價值,基于未知的條件來調(diào)度網(wǎng)絡,實現(xiàn)故障發(fā)生前規(guī)避故障、質(zhì)量劣化前優(yōu)化質(zhì)量、網(wǎng)絡擁塞前調(diào)整流量,從而達到自動、自優(yōu)、自愈、自治的永不故障的自動駕駛網(wǎng)絡,結(jié)構(gòu)性提升運維和運營效率。
提升用戶體驗,實現(xiàn)三個倍增
要實現(xiàn)網(wǎng)絡的自動駕駛,必然將是一個長期的過程,不可能一蹴而就。參考汽車自動駕駛的五個發(fā)展步驟,我們也將自動駕駛網(wǎng)絡分為五個階段,第一個階段是AI能夠指出“發(fā)生了什么”,第二個階段需要判定“為什么會發(fā)生”,第三個階段需要預測“將會發(fā)生什么”,后續(xù)都需要人工判斷決策和采取相應措施;到了第四個階段,AI已經(jīng)可以判斷“需要采取什么措施”,然后由人工去操作;最后一個階段才是全面地實現(xiàn)網(wǎng)絡的自我控制和自動修復,使網(wǎng)絡具備自愈能力。
自治網(wǎng)絡和服務2.0的實現(xiàn),將帶給最終用戶分鐘級的ROADS體驗,永遠最優(yōu)的網(wǎng)絡連接和永不斷網(wǎng)的可獲得性;對運營商的價值則是實現(xiàn)運維效率、資源效率和能耗效率的倍增。
在運維領域,運維水平分為三個發(fā)展階段,第一個階段稱為R2F(Run-to-Failure),網(wǎng)絡在運行中突然發(fā)生故障,然后運維人員馬上趕去處理,這是最低級的水平;第二個階段是PvM(Preventive Maintenance),即例行的巡檢,對每個設備進行檢查來預防故障發(fā)生,但這種做法效率非常低下;第三個階段是PdM(Predictable Maintenance),我們稱之為可預測性維護,即能夠預測某個設備未來有多大概率發(fā)生故障,然后進行針對性的維護。通過PdM,我們希望能將電信網(wǎng)絡的告警壓縮和故障定位減少90%,實現(xiàn)90%關鍵器件的失效和劣化預測,進一步達到網(wǎng)絡自愈。此外,網(wǎng)絡故障中超過70%的問題源自無源設備,例如光纖彎曲老化、接口松動等,在這一過程中,信號都會發(fā)生變化,通過引入AI學習這些變化的特征,就有可能提前進行預測,用有源解決無源的故障問題。
在網(wǎng)絡資源方面,當下的特點是網(wǎng)絡建設好了,流量就隨之流動,資源利用可能并不合理。如果反過來思考,基于流量走向來調(diào)度網(wǎng)絡,資源利用率就會大幅提升,F(xiàn)在的網(wǎng)絡并不具備這樣的能力,只有通過引入人工智能,建好流量預測模型,才能實現(xiàn)精準流量預測和最合理的網(wǎng)絡拓撲,以流量而不是物理連接來決定網(wǎng)絡的路徑,最終大幅提高網(wǎng)絡的資源效率。
關于能耗效率,有個說法叫做“比特決定瓦特”,即網(wǎng)絡流量大小決定能耗多少。在機房或者站點,每個系統(tǒng)都有數(shù)十個參數(shù),通過AI訓練生成散熱與環(huán)境及業(yè)務負荷模型,使得日照、溫度和配套設施油機、太陽能和電池等達到最佳能效;在設備層面,根據(jù)業(yè)務負載進行動態(tài)能量投放,沒有流量時就利用時隙關斷、RF深度休眠、載頻關斷等減少耗電量,同時實現(xiàn)數(shù)據(jù)中心對象如服務器組件的動態(tài)節(jié)能管理;第三個是網(wǎng)絡系統(tǒng),構(gòu)建準確的業(yè)務負荷預測模型,使整網(wǎng)流量最優(yōu)從而達到能耗效率最佳。
自治網(wǎng)絡的目標架構(gòu),對華為來說就是SoftCOM+AI,具體做法是:把下層設備和云基礎設施、中間層的網(wǎng)絡管理和控制以及上層全流程的系統(tǒng),在規(guī)劃、部署、運行、維護、優(yōu)化和經(jīng)營的端到端過程中,每一個環(huán)節(jié)都引入人工智能技術,使能網(wǎng)絡達到系統(tǒng)最優(yōu)。與此同時,華為也構(gòu)建了一個面向運營商的AI訓練平臺,將網(wǎng)絡設備運行的狀態(tài)數(shù)據(jù)接入平臺來訓練AI模型,并針對模型進行持續(xù)更新和優(yōu)化,使得網(wǎng)絡系統(tǒng)的自動化程度不斷提高。
以光網(wǎng)絡為例,來看一下AI如何使能全流程的業(yè)務發(fā)展。首先是數(shù)據(jù)底座,即需要獲得怎樣的數(shù)據(jù),具體到光網(wǎng)絡來說包括光纖的數(shù)據(jù)、光信號的數(shù)據(jù)、路由數(shù)據(jù)等;接下來是使能技術,即人工智能的算法,包括數(shù)據(jù)清洗、信息整合、機器學習建模、深度學習等等,這些算法與光網(wǎng)絡無關;為了實現(xiàn)光網(wǎng)絡的自動駕駛,還需要構(gòu)建大量模型,比如光纖模型、濾波器模型等;最后是業(yè)務應用場景,包括開局自動檢查光纖、業(yè)務發(fā)放、網(wǎng)絡優(yōu)化、故障定位以及資源自動調(diào)度等,通過模型找到最優(yōu)方法,進而實現(xiàn)快速發(fā)放、極簡運維和智能運營,智能化提高網(wǎng)絡調(diào)度效率,零等待、零接觸、零體驗,讓人們感受不到網(wǎng)絡的存在。
未來將是智能化的時代,運營商網(wǎng)絡的智能化不可能一蹴而就,而是一個長期實踐。SoftCOM AI是華為All Intelligence戰(zhàn)略在電信領域的落地,其中最核心的AI能力依托于華為在All Intelligence中長期堅決的戰(zhàn)略投入而積累成長,和電信領域場景相結(jié)合,旨在幫助運營商打造永不故障的自治網(wǎng)絡,盡快實現(xiàn)數(shù)字化、智能化轉(zhuǎn)型。