本期工程采用了HP高端磁盤陣列XP512進行遠程數(shù)據(jù)容災,在云南聯(lián)通業(yè)務中心本地新增一臺HP XP512。同時,在異地備份中心新增一臺XP512存儲服務器,作為主生產(chǎn)中心XP512的異地容災備份。本次容災的建設目標是對綜合營帳系統(tǒng)、專業(yè)計費、短消息計費系統(tǒng)進行同城異地數(shù)據(jù)級容災的綜合數(shù)據(jù)容災系統(tǒng),業(yè)務系統(tǒng)的數(shù)據(jù)將可以通過基于XP磁盤陣列的Continuous Access XP軟件實時同步復制到備份數(shù)據(jù)中心的XP512中,從而實現(xiàn)數(shù)據(jù)的遠程保護
下圖是方案規(guī)劃的容災系統(tǒng)示意圖(見圖1)。
硬件環(huán)境的搭建在此就不贅述,下面主要從整個工程的重點和難點:系統(tǒng)遷移進行著重介紹。
系統(tǒng)遷移需求分析
在本次案例實施中,選取營業(yè)系統(tǒng)的遷移做簡要說明。
一、系統(tǒng)現(xiàn)狀
綜合營賬系統(tǒng)應用目前運行在兩臺主機superdome組成的群集上,其中一臺運行營業(yè)的應用,另一臺運行賬務的應用。數(shù)據(jù)存儲在一臺MA8000磁盤陣列中,由于系統(tǒng)數(shù)據(jù)量較大,營業(yè)和賬務的數(shù)據(jù)遷移工作必須分開進行,所以在一個系統(tǒng)數(shù)據(jù)遷移完畢后,MA8000磁盤陣列仍然需要在線,以保證其他系統(tǒng)遷移前的正常工作。
二、系統(tǒng)數(shù)據(jù)遷移要求
由于需遷移系統(tǒng)均為在線運行,因此,要盡量減少業(yè)務的影響。為此,整個遷移過程必須按以下步驟進行:
1.營業(yè)系統(tǒng)負責全省所有業(yè)務受理及客服系統(tǒng)的查詢,如發(fā)生長時間中斷,會對業(yè)務及公司形象帶來非常不利影響。因此,業(yè)務中斷必須在夜間或業(yè)務量較少時進行。
三、風險分析
實施原則
實施重點
實施的重點在于系統(tǒng)遷移的前期準備、遷移后數(shù)據(jù)一致性檢查及應用的測試驗證工作。
實施難點
實施的難點在于系統(tǒng)遷移過程中應急情況下系統(tǒng)和數(shù)據(jù)的可恢復性。
存在風險
項目中的風險貫穿于整個實施過程,在項目實施前應充分考慮到所有可能存在的風險,考慮出現(xiàn)風險時的應急措施,采取相應的手段規(guī)避風險?赡艽嬖诘娘L險有:
1.系統(tǒng)遷移的數(shù)據(jù)量較大,需要計劃足夠的時間;
營業(yè)系統(tǒng)遷移計劃
根據(jù)以上分析,總體計劃分為前期準備階段、系統(tǒng)遷移實施階段和遷移后系統(tǒng)試運行階段三個階段。
一、 前期準備階段
前期準備階段是整個系統(tǒng)遷移成功的關鍵,該階段需要完成的工作有:
1.掌握系統(tǒng)的現(xiàn)狀、分布、IP地址、用途等,制定詳細遷移任務清單;
二、 系統(tǒng)遷移實施階段
為了系統(tǒng)的可靠性、數(shù)據(jù)的完整性和可恢復性,應對現(xiàn)有系統(tǒng)進行軟硬件方面的檢測,并對系統(tǒng)和數(shù)據(jù)進行備份,一旦在遷移過程中發(fā)生問題,可以馬上恢復原有系統(tǒng),保證系統(tǒng)運行。在此階段需要完成的工作有:
1.遷移前的設備檢測,系統(tǒng)、數(shù)據(jù)備份(如數(shù)據(jù)庫未打開歸檔,需在實施遷移前打開);
其中系統(tǒng)備份前最好對設備硬件和軟件分別進行檢查,確認遷移前系統(tǒng)處于正常狀態(tài)。遷移的每個步驟都要按事先的規(guī)劃進行,并確保操作的可逆性,一旦出現(xiàn)問題系統(tǒng)可以回退到遷移前狀態(tài)。
營業(yè)系統(tǒng)遷移應急措施
一、系統(tǒng)遷移前的異常
二、系統(tǒng)遷移過程中的異常
三、 系統(tǒng)遷移后的異常
數(shù)據(jù)庫遷移
一、數(shù)據(jù)庫信息調(diào)查
數(shù)據(jù)庫的遷移主要是所有數(shù)據(jù)文件、重做日志、控制文件的遷移,在準備階段需調(diào)查清楚所有在用的數(shù)據(jù)文件、重做日志、控制文件所在裸盤的詳細情況。同時建議數(shù)據(jù)庫管理員在遷移前盡量不要添加新的數(shù)據(jù)文件,如遇特殊情況需增加新的數(shù)據(jù)文件,則必須通知工程項目組對已調(diào)查的數(shù)據(jù)進行更新。
二、在XP512上創(chuàng)建物理卷組和對應的邏輯卷
三、數(shù)據(jù)庫備份與遷移
1. Oracle數(shù)據(jù)庫物理備份準備。
A 使用dd拷貝和在sqlplus下用"alter database backup controlfile to trace"分別備份數(shù)據(jù)庫控制文件;
3.修改inityy.ora文件,指定新的controlfile name(在XP512上),確保數(shù)據(jù)庫可以啟動,確保歸檔備份目錄有足夠空間。
4.停主機上所有應用程序,正常宕數(shù)據(jù)庫,完后重啟數(shù)據(jù)庫(不啟監(jiān)聽),根據(jù)業(yè)務情況編寫SQL提取一致性數(shù)據(jù),將結果用spool輸出至一文本文件中保存。此外建議使用"alter system switch logfile"將所有日志組均做一次切換。
5.再次檢查數(shù)據(jù)庫數(shù)據(jù)文件是否與調(diào)查結果一致。
6.正常宕數(shù)據(jù)庫,用dd物理移植數(shù)據(jù)文件、控制文件、日志文件到XP512上,實際可生成多個shell并行執(zhí)行。
7.在XP512上啟動數(shù)據(jù)庫到mount狀態(tài),將數(shù)據(jù)文件指向XP512。
10.在測試環(huán)境中進行應用程序的驗證。
四、 異常情況處理
原存儲設備MA8000的邏輯卷不會立即刪除, 這樣原來數(shù)據(jù)庫數(shù)文件,日志文件不會丟失,即便有控制文件更改,也可用控制文件恢復, 如遷移有問題或時間過長,要留出恢復時間,用原來數(shù)據(jù)文件、日志文件、控制文件啟動原數(shù)據(jù)庫。要求在測試階段,只能對數(shù)據(jù)庫的內(nèi)容進行可控的增加、刪除、修改。只有多方確認無問題情況下,才能啟動應用。同時做好歸檔的保存,如聯(lián)機重做日志少,可考慮增加幾組聯(lián)機重做日志。
工程試運行及演習
系統(tǒng)遷移工作成功后,工程即進入試運行階段,在此期間相關人員需定時觀察主機運行狀態(tài)、主備兩個中心XP512的同步狀態(tài)及數(shù)據(jù)庫運行狀態(tài)并記錄。系統(tǒng)穩(wěn)定運行后,應制定定期進行主備中心切換的容災演習制度,發(fā)現(xiàn)問題立即解決,確保在發(fā)生災難時系統(tǒng)的可恢復性。
中國計費網(wǎng)(www.billingchina.com)