更多虛機(jī)重啟優(yōu)先級(jí)
當(dāng)故障轉(zhuǎn)移(failover)發(fā)生時(shí),虛機(jī)重啟優(yōu)先級(jí)決定了虛機(jī)重啟的先后順序。需要重啟的虛機(jī)被分配給還有空閑資源的服務(wù)器,高優(yōu)先級(jí)的虛機(jī)被優(yōu)先分配,然后是次一級(jí)優(yōu)先級(jí)的虛機(jī),直到所有的空閑資源用完。服務(wù)器然后按照優(yōu)先順序啟動(dòng)虛機(jī),如果資源不夠了,vSphere 會(huì)暫停重啟動(dòng)作,直到有足夠的資源可用(因?yàn)橛衅渌奶摍C(jī)釋放資源了)。
在 vSphere 6.5 中新增了兩個(gè)虛機(jī)重啟優(yōu)先級(jí)(下面標(biāo)藍(lán)色的兩個(gè)級(jí)別),讓管理員有更多的配置選擇,把虛機(jī)的優(yōu)先等級(jí)分得更細(xì)。
- Highest
- High
- Medium
- Low
- Lowest
虛機(jī)重啟順序可控
一個(gè)多層應(yīng)用(Multi-Tiered Application)是由多個(gè)虛機(jī)組成的,如數(shù)據(jù)庫(kù)、應(yīng)用服務(wù)器、Web 服務(wù)器等,這些虛機(jī)的啟動(dòng)應(yīng)該有一個(gè)先后順序,在一般的情況下,應(yīng)該遵循數(shù)據(jù)庫(kù)→應(yīng)用服務(wù)器→Web服務(wù)器的順序。vSphere 用 vApp 把這些虛機(jī)組成一組,作為一個(gè)整體來進(jìn)行管理。管理員可以給 vApp 分配資源,把 vApp 作為一個(gè)整體來啟動(dòng)或關(guān)閉等。在 vApp 的配置中,通過指定每一個(gè)虛機(jī)啟動(dòng)的延遲時(shí)間來調(diào)整各個(gè)虛機(jī)的啟動(dòng)順序。
vSphere 6.5 引入了虛機(jī)之間的依賴鏈機(jī)制來控制多層應(yīng)用的啟動(dòng),通過指定虛機(jī)之間的依賴關(guān)系來定義它們的啟動(dòng)順序,這稱之為順序可控的重啟(Orchestrated Restart)。在下圖的例子中,APP 依賴于 DB,WEB 依賴于 APP,所以它們的啟動(dòng)順序就如數(shù)字標(biāo)識(shí)所示。vSphere 會(huì)檢依賴鏈的有效性,避免產(chǎn)生無效的依賴關(guān)系:
- 循環(huán)依賴:例如下圖中 DB 又依賴于 WEB;
- 依賴關(guān)系跟重啟優(yōu)先級(jí)相矛盾:例如下圖中 APP 和 WEB 為高優(yōu)先級(jí),但是 DB 卻被定義為低優(yōu)先級(jí)。
主動(dòng)預(yù)防系統(tǒng)故障
傳統(tǒng)的 HA 都是被動(dòng)的,只有當(dāng)服務(wù)器故障時(shí),才會(huì)把受保護(hù)的虛機(jī)故障轉(zhuǎn)移(failover)到其他的服務(wù)器上去,F(xiàn)在主流的服務(wù)器廠商都提供了硬件系統(tǒng)的監(jiān)控和預(yù)警功能,使得主動(dòng)預(yù)防成為可能。vSphere 6.5 可以通過插件與以下服務(wù)器廠商的系統(tǒng)管理工具相集成,以實(shí)現(xiàn)主動(dòng)預(yù)防式 HA(Proactive HA):
- Dell Openmanage
- HP Insight Manager
- Cisco UCS Manager
這些系統(tǒng)管理工具會(huì)把服務(wù)器的一些異常狀況向 vSphere 告警,例如某個(gè)散熱風(fēng)扇發(fā)生故障,某塊硬盤的讀寫故障率超出正常閾值范圍等等。當(dāng)這種告警發(fā)生時(shí),意味著服務(wù)器處于亞健康狀態(tài),這時(shí) vSphere 就會(huì)把這臺(tái)服務(wù)器處于隔離模式(Quarantine mode),這意味著該服務(wù)器上不會(huì)再啟動(dòng)新的虛機(jī),并且 vSphere 會(huì)盡可能地把該服務(wù)器上的虛機(jī) vMotion 到其他健康服務(wù)器上去。
傳統(tǒng)的 HA 是當(dāng)服務(wù)器發(fā)生故障時(shí)才起作用,主動(dòng)預(yù)防式 HA 把故障防患于未然,主動(dòng)獲取服務(wù)器的故障預(yù)警,在宕機(jī)發(fā)生之前就把應(yīng)用負(fù)載轉(zhuǎn)移到其他服務(wù)器上去,從而為企業(yè)關(guān)鍵應(yīng)用提供更高等級(jí)的可靠性保護(hù)。