商業(yè)銀行做容災(zāi)備份已經(jīng)有很多年了,但業(yè)務(wù)連續(xù)性、容災(zāi)備份一直是國內(nèi)銀行信息化的短板。因此,雖是老生常談,但卻歷久彌新,不斷有新的話題、新的關(guān)注點出現(xiàn)。目前在容災(zāi)備份領(lǐng)域,商業(yè)銀行比較關(guān)注的話題是“雙活”容災(zāi)中心的建立。
何為“雙活”數(shù)據(jù)中心?
所謂“雙活”數(shù)據(jù)中心,區(qū)別于一個數(shù)據(jù)中心、一個災(zāi)備中心的模式,前者兩個數(shù)據(jù)中心都處于運行當(dāng)中,所以稱為“雙活”,且互為備份;后者是一個數(shù)據(jù)中心投入運行,另外一個數(shù)據(jù)中心處在不工作狀態(tài),只有當(dāng)災(zāi)難發(fā)生時,生產(chǎn)數(shù)據(jù)中心癱瘓,災(zāi)備中心才啟動。
“雙活”數(shù)據(jù)中心最大的特點是:一、充分利用資源,避免了一個數(shù)據(jù)中心常年處于閑置狀態(tài)而造成浪費。通過資源整合,“雙活”數(shù)據(jù)中心的服務(wù)能力是雙倍的。二、“雙活”數(shù)據(jù)中心如果斷了一個數(shù)據(jù)中心,另外一個數(shù)據(jù)中心還在運行,對用戶來說是不可感知的。而一個災(zāi)備中心的模式,如果生產(chǎn)數(shù)據(jù)中心癱瘓,需要半個小時、甚至兩個小時、甚至更長時間才能啟動災(zāi)備中心,在啟動災(zāi)備中心的時間里,用戶交易會嚴(yán)重受損。
“雙活”與“云”不謀而合
在國內(nèi)的商業(yè)銀行當(dāng)中,部署了雙活數(shù)據(jù)中心的銀行還為數(shù)甚少,光大銀行是最早開始這方面探索的銀行之一。光大銀行災(zāi)備體系是典型的“兩地三中心”模式,目前在北京有兩個規(guī)模相當(dāng)?shù)碾p活中心,在武漢有一個異地災(zāi)備中心。
光大銀行的“雙活”數(shù)據(jù)中心的模式始建于2002年。當(dāng)時還沒有出現(xiàn)云計算的概念,但是這個思路和今天云計算的思路不謀而合。“云”的目的就是把數(shù)據(jù)中心的所有資源整合成一個資源,成為一朵云,這樣用戶就不知道是哪個數(shù)據(jù)中心為其提供服務(wù)。“雙活”數(shù)據(jù)中心的效果也是一樣的。
“雙活”模式依賴于虛擬化和云計算技術(shù),要把應(yīng)用從A數(shù)據(jù)中心遷移到B數(shù)據(jù)中心只需點一下鼠標(biāo),拖拽一下,遷移就可以完成。這項被稱為“一鍵切換平臺”技術(shù)的實現(xiàn),有賴于兩個數(shù)據(jù)中心必須是“雙活”的。傳統(tǒng)的災(zāi)備中心模式采用備份模式,兩個數(shù)據(jù)中心的地址是一樣的,或者利用域名進行切換,系統(tǒng)間關(guān)系復(fù)雜,切換影響較大,一般都需要停機窗口,通常是必須生產(chǎn)中心倒掉,災(zāi)備中心才能起來,兩個中心同時起來會發(fā)生沖突。“雙活”數(shù)據(jù)中心可以規(guī)避這個問題。
在傳統(tǒng)的災(zāi)備中心模式中,為保證備份中心隨時可用,銀行科技部門每年都要耗費大量經(jīng)歷組織演練,通常為了規(guī)避業(yè)務(wù)風(fēng)險,演練都是模擬性質(zhì)的。這樣大費周章的演練在“雙活”模式中也是不必要的,因為每個數(shù)據(jù)中心每時每刻都是“活著”的。
“雙活”數(shù)據(jù)中心的優(yōu)勢
“雙活”數(shù)據(jù)中心的最大優(yōu)勢是有效利用資源。災(zāi)備中心建設(shè)的投資巨大及每年運維成本極高,如果資源處于閑置狀態(tài),資源是相當(dāng)浪費的,有了虛擬化,能夠把閑置的資源整合,服務(wù)能力會提高一倍。銀行系統(tǒng)中很多資源都是彈性需求,如基金、貴金屬交易、電子支付、和網(wǎng)銀交易,在交易火爆時一天交易量可能達(dá)到全年交易量總和。故銀行系統(tǒng)容量規(guī)劃時是充分考慮到交易峰值的,但這樣在正常時間就有很大的交易浪費,以淘寶“雙十一”活動為例,交易量在幾分鐘內(nèi)就可能達(dá)到全年交易量的總和,需要系統(tǒng)服務(wù)能力提高十倍,這時雙活數(shù)據(jù)中心和靈活快速的資源調(diào)度就充分發(fā)揮出了作用。云計算技術(shù),讓IT系統(tǒng)有了資源整合的能力,讓系統(tǒng)有了充分的彈性,隨時可以調(diào)度十臺機器來提高服務(wù)能力,來保證交易的突發(fā)需求,以及各種突發(fā)因素造成的交易量猛增。
有了云計算技術(shù),不代表投入會更少,但是資源利用率會更高,系統(tǒng)但抗沖擊能力會更強,自由調(diào)度能力會更強。
自動化是“雙活”與“云計算”必不可少的前提條件
云計算需要自動化手段來幫助系統(tǒng)維護人員進行自動的資源調(diào)配。比如,通過虛擬化技術(shù)虛擬出了上萬臺虛擬機器,白天需要50臺機器給網(wǎng)銀系統(tǒng)提供web服務(wù),晚上網(wǎng)銀交易少了,貴金屬交易多了,這50臺機器要調(diào)配到另一個系統(tǒng)上。這五十臺不可能一個人一臺臺調(diào)配,那可能配一晚上都配不完,就需要自動化的軟件來自動調(diào)整資源分配。
光大銀行目前采用的是雙數(shù)據(jù)中心同時工作的資源模式,同城的兩個數(shù)據(jù)中心都投入生產(chǎn)系統(tǒng)。光大銀行信息科技部系統(tǒng)運維處高級經(jīng)理牟健君介紹說,“假如這個數(shù)據(jù)中心有5臺機器工作,另外一個數(shù)據(jù)中心有5臺機器處于空閑狀態(tài),我想做一個操作:讓這邊的5臺機器停下來做日常的運維、審檢,讓另外一邊的5臺投入生產(chǎn)。有自動化工具以后,我點一下鼠標(biāo),這5臺機器上的應(yīng)用就可以立即切換到那5臺空閑的資源上去,整個業(yè)務(wù)不間斷,調(diào)度靈活。如果沒有自動化手段,過去的切換過程需要至少半個小時。”因此,自動化是云計算、“雙活”數(shù)據(jù)中心應(yīng)用必不可少的前提條件。
異地“雙活”難度大
當(dāng)然,部署“雙活”數(shù)據(jù)中心的難度也非常大,尤其是異地“雙活”,涉及到數(shù)據(jù)同步效率問題。如果數(shù)據(jù)同步效率達(dá)不到要求,在災(zāi)難發(fā)生時就會造成一段時間的交易丟失。在異地“雙活”的模式中,兩地數(shù)據(jù)中心同時接納交易,技術(shù)難度很大,需要更改眾多底層程序。異地“雙活”模式目前在國內(nèi)的商業(yè)銀行中還鮮見成功案例,但只有做到異地“雙活”才能提供真正無誤的服務(wù)。
隨著云計算技術(shù)的日漸成熟,越來越多的銀行開始考慮部署“雙活”、乃至“多活”數(shù)據(jù)中心。