不能懵,華為現在帶你一起,十問數據中心!
人人聊,家家說,AI在數據中心真的落地了嗎?
自從AlphaGo戰(zhàn)勝了柯潔和李世石,如果一個科技圈或創(chuàng)業(yè)圈的精英不會聊兩句AI,出門兒都不好意思跟人打招呼。無比敬崗愛崗的數據中心從業(yè)者們當然也不能放著這么好的技術不琢磨,不過關于AI與數據中心,說了不少,也聽了很多。但新技術只有應用,創(chuàng)造出價值,才有繼續(xù)優(yōu)化和演進的可能。
問:所以現在AI在數據中心真的落地了嗎,應用了有什么好處?
答:落地了,實踐證明,AI是數據中心難得的行業(yè)轉折機遇,AI將使能數據基礎設施價值最大化。
問:那怎么用AI實現價值最大化呢?
答:以下有幾個經過驗證的標準答案,要不借你“Ctrl C”一下。
1、讓AI時時給數據中心做CT
主動預防,安全可靠
安全運行對數據中心的重要性不言而喻,業(yè)界在提升數據中心可靠性和可用性方面已有實踐,例如收集供配電系統(tǒng)設備信息,對即將發(fā)生故障的設備和部件提前發(fā)出預警,為運維人員的運維活動提供決策支撐,但是如何利用機器的自我學習能力,做到供配電系統(tǒng)整體運行的安全可靠,是需要思考的重點問題。要實現更高程度的智能化及主動避錯,這對AI技術應用是個很好的契機。
華為融入AI性能的iPower技術可提升數據中心可用性,借助智能化硬件,實現智能故障定位與預警管理,引入大數據技術,智能分析每日海量的運維數據,識別機房潛在隱患,保障數據中心的可靠運行。
iPower智能供配電技術以模塊化UPS為核心,主要通過供電全鏈路監(jiān)測、預警和故障自動隔離等手段,提高數據中心能源基礎設施可用性,繼而通過AI技術的應用,最終實現預測性維護。
iPower通過供電全鏈路監(jiān)測,可實現毫秒級的故障檢測,毫秒級的故障隔離,分鐘級的故障恢復,可消除火災隱患,大大提高數據中心能源基礎設施可靠性和可用性;
以電池管理為例,在預防電池失效方面,iPower通過AI技術,可以精確預測電池的壽命和健康度,為用戶提前提供維護決策依據,及時排除有失效隱患的電池組,變事后補救為事前預防,變被動響應為主動維護,大大提高數據中心供配電安全等級。華為的模塊化UPS結合iPower技術,可以在電池出現溫度快速升高等極端情況下,自動切斷該組電池,從而避免出現起火等惡性事件。
2、讓AI給數據中心做管家
智能營維,自動高效
數據中心傳統(tǒng)的維護方法是靠人,失誤率大、漏錯率高、失效排查時間長,傳統(tǒng)運維方式無法解決人為誤操作帶來的業(yè)務中斷問題。
融入AI性能的 iManager,可看作是數據中心的大腦,借助智能化硬件和傳感器,實現精準感知。通過自動化手段,逐步減少人工巡檢等例行重復性工作,池化專家資源和能力,并固化于運維流程中。
加上全流程的電子運維,包括巡檢、維保、應急演練,把所有的流程以及操作指導全部做到線上,實現了運維質量從原來靠人的責任心到現在靠流程管理的轉變。通過全流程電子化的運維跟蹤,量化原來無法量化的信息,比如通過電子運維提升巡檢的執(zhí)行力和運維活動的質量、實現故障的預測等,大幅提高人均運維效率和運維水平,提升數據中心的可靠性。
此外,市場上出現了越來越多由邊緣計算產生的邊緣數據中心機房,就近提供服務和處理計算。邊緣數據中心數量日益增長,分行、支行、網點等數據中心無法統(tǒng)一集中管理,數據中心故障響應速度慢,運維效率低。
華為iManager全網管理功能,實現對多網點數據中心基礎設施進行集中監(jiān)控,統(tǒng)一管理,實現預防性維護,通過GIS定位技術提高故障定位響應速度,提升數據中心運維效率;移動APP監(jiān)控,從內到外簡化管理,輕松知曉海量網點數據中心運行情況,擺脫傳統(tǒng)人工的運維檢修方式,降低維護下站次數和節(jié)省開支,讓數據中心管理變得更加簡單、高效。
華為iManager還能對資產進行盤查,保證設備的完整性,保護重要數據。另外,還可以對資產匹配最適宜的供電、制冷、空間、帶寬等資源,實現資源的最佳利用,利用AI技術,可協(xié)助對資產上下架和運營進行智能化的管理,提升運營效率和效益。
3、AI給數據中心唱首“涼涼”
降耗增效,綠色節(jié)能
能耗問題一直是數據中心關注的焦點,傳統(tǒng)數據中心年平均PUE高于1.8,隨著越來越多AI應用的落地,業(yè)界對高速計算的需求日漸增多,GPU計算服務器的規(guī)模和需求將持續(xù)增長,加速計算服務器產生的熱能是傳統(tǒng)CPU的數倍,如何解決服務器的散熱問題將是未來的重要考量。目前已有的智能DC節(jié)能技術可以通過傳感器獲取關鍵節(jié)點數據,進而優(yōu)化所有系統(tǒng)和設備的整體能耗,降低PUE。
而AI能否深入數據中心內核,帶來更低PUE?華為作為ICT行業(yè)的領導者,在數據中心熱管理技術方面走在行業(yè)前端,致力于帶給客戶更低的PUE。
華為將基于AI的iCooling智能熱管理解決方案融入數據中心基礎設施,針對數據中心制冷效率提升瓶頸,通過深度學習,打通精密空調末端、冷水機組、冷卻塔、水泵等制冷系統(tǒng)以及IT負載、環(huán)境變量等大數據之間的聯(lián)動,對大量的歷史數據進行分析,探索影響能耗的關鍵因素,獲取PUE的預測模型。利用尋優(yōu)算法,獲取調優(yōu)參數組,下發(fā)到控制系統(tǒng),實現制冷系統(tǒng)的最優(yōu)控制。最終通過規(guī)范化的實踐引導和目標導向評測,不斷調整優(yōu)化,獲取最佳PUE。
iCooling@AI解決方案目前已在華為云廊坊數據中心成功部署,全年PUE可降低超過0.1,年平均值達到1.3以下,年節(jié)約電費數百萬元。