在8月11日的《智享云未來 2017云計(jì)算技術(shù)與應(yīng)用高峰論壇》上,烽火云計(jì)算資深專家趙銳為大家?guī)砹恕墩⻊?wù)云智能化之路》的主題演講。趙銳在演講中提到,在湖北省楚天云的建設(shè)中,烽火自研的FitOS虛擬機(jī)高可用解決方案(HA-Stack)為保證關(guān)鍵業(yè)務(wù)連續(xù)性提供了重要技術(shù)支撐。另外,烽火HA-Stack解決方案還在近期榮獲了2017可信云大會“年度技術(shù)創(chuàng)新獎”,受到了業(yè)界的高度認(rèn)可。
作為大型政務(wù)云的典型代表,楚天云是“智慧湖北”的龍頭工程,是國內(nèi)第一個貫通國家、省、市、縣四級的數(shù)據(jù)交換及共享平臺,也是國內(nèi)第一個采用OpenStack開源架構(gòu)為基礎(chǔ)的省級政務(wù)云平臺。目前,楚天云在現(xiàn)有基礎(chǔ)設(shè)施及全省統(tǒng)一的政務(wù)網(wǎng)絡(luò)體系基礎(chǔ)之上,上聯(lián)國家電子政務(wù)外網(wǎng),橫聯(lián)104個廳局委辦,下聯(lián)17個地市州政務(wù)外網(wǎng),打破部門壁壘、區(qū)域分割,變“信息孤島”為“信息樞紐”,實(shí)現(xiàn)全省范圍內(nèi)的數(shù)據(jù)共享互通。
基于楚天云的戰(zhàn)略地位及重要功能,如何保證楚天云業(yè)務(wù)連續(xù)運(yùn)行就成為了最基礎(chǔ)而又最重要的工作。在楚天云規(guī)劃早期,烽火基于 FitCloud云網(wǎng)一體化解決方案提出了創(chuàng)新的建設(shè)思路。其中,烽火FitOS云操作系統(tǒng)做為FitCloud的核心產(chǎn)品,基于OpenStack組件進(jìn)行深度優(yōu)化及二次開發(fā),在原生的基礎(chǔ)上,增加虛擬機(jī)HA解決方案,通過采用分布式鎖的防腦裂技術(shù),在OpenStack外新增組件來實(shí)現(xiàn)主機(jī)和虛擬機(jī)故障場景下的虛擬機(jī)高可用。
在傳統(tǒng)場景中,由故障檢測不準(zhǔn)確導(dǎo)致的主備虛機(jī)“腦裂”現(xiàn)象時常發(fā)生,在雙機(jī)熱備高可用(HA)系統(tǒng)中,當(dāng)聯(lián)系兩個節(jié)點(diǎn)的“心跳線”斷開時, 節(jié)點(diǎn)上的HA軟件像“裂腦人”一樣,本能地爭搶“共享資源”、爭起“應(yīng)用服務(wù)”,就會導(dǎo)致共享資源被瓜分、兩邊“服務(wù)”都起不來,或者兩邊“服務(wù)”都起來了,但同時讀寫“共享存儲”,最終導(dǎo)致數(shù)據(jù)損壞;另外,以往依賴IPMI來監(jiān)測主機(jī)下電,當(dāng)狀態(tài)Off時,通過疏散虛擬機(jī)的接口(底層調(diào)用的Rebuild接口)來進(jìn)行虛擬機(jī)HA重建,但無法解決主機(jī)掉電的場景,導(dǎo)致的數(shù)據(jù)面、業(yè)務(wù)面中斷也無法解決。
為避免楚天云在運(yùn)行中出現(xiàn)傳統(tǒng)故障場景,烽火FitOS虛擬機(jī)高可用解決方案中的防 “腦裂”方案基于分布式文件系統(tǒng)提供存儲資源,底層使用SanLock鎖提供防腦裂保護(hù),保證磁盤同時只能有一處寫入;此外,上層基于自研HA-Stack+Consul提供基于管理、存儲、業(yè)務(wù)網(wǎng)絡(luò)多平面探測,支持HA策略矩陣配置,基于QGA提供虛擬機(jī)內(nèi)部異常檢測(藍(lán)屏、死機(jī)、業(yè)務(wù)網(wǎng)絡(luò)中斷等),同時超半數(shù)主機(jī)故障后,服務(wù)自動停止,防止故障擴(kuò)散,當(dāng)所有主機(jī)恢復(fù)后,服務(wù)將自動恢復(fù)。
除政務(wù)行業(yè)外,烽火云計(jì)算正同時在交通、教育、醫(yī)療等重點(diǎn)行業(yè)持續(xù)發(fā)力,并將基于用戶場景提高云計(jì)算產(chǎn)品及解決方案中的智能化要素,幫助用戶完成智能化的IT建設(shè)及業(yè)務(wù)運(yùn)營,使得烽火成為具有持續(xù)創(chuàng)新性及競爭力的智慧城市建設(shè)領(lǐng)導(dǎo)者。