1、背景
隨著企業(yè)業(yè)務(wù)數(shù)據(jù)的激增,傳統(tǒng)備份方式下,要保存生產(chǎn)數(shù)據(jù)的多個副本拷貝,導(dǎo)致備份容量會越來越大,造成對備份系統(tǒng)管理困難和成本上升。
然而,備份系統(tǒng)中存在的多個生產(chǎn)數(shù)據(jù)副本之間,存在著大量的冗余重復(fù)數(shù)據(jù)。因此,對于備份系統(tǒng),重刪技術(shù)的應(yīng)用可以很好的消除冗余數(shù)據(jù),極大節(jié)省備份空間,從而降低采購和運維成本。
2、華為OceanStor VTL6900重刪方案
華為集中備份解決方案采用OceanStor VTL6900作為備份設(shè)備, VTL6900通過FC SAN或者IP SAN連接備份服務(wù)器,應(yīng)用組網(wǎng)如圖1所示。
圖1 VTL集中備份方案
華為 OceanStor VTL6900虛擬帶庫是業(yè)界唯一的集群重刪備份系統(tǒng),同時支持Post processing和Inline的重復(fù)數(shù)據(jù)刪除技術(shù),其重刪引擎為SIR(Single Instance Repository)。
2.1 Post processing重復(fù)數(shù)據(jù)刪除方案
VTL6900所支持的Post processing重復(fù)數(shù)據(jù)刪除技術(shù),其數(shù)據(jù)比較方法為索引比較方法。
Post processing重復(fù)數(shù)據(jù)刪除技術(shù)原理
圖1 VTL集中備份方案
在Post processing重復(fù)數(shù)據(jù)刪除模式中,VTL6900軟件包含兩個模塊:VTL模塊和SIR模塊。VTL6900的存儲空間邏輯上被劃分為兩部分,分別為VTL模塊和SIR模塊所用,稱之為VTL存儲空間(又稱為Cache)和SIR存儲空間(又稱為Repository)。VTL6900接收到備份數(shù)據(jù)后,首先將其存放于VTL存儲空間,此后的某個時刻(如某時間點、備份結(jié)束、達(dá)到存儲水位等),SIR模塊會讀取這些數(shù)據(jù),并將其和SIR存儲空間中的已有不同數(shù)據(jù)塊進(jìn)行比較:SIR模塊將原始備份數(shù)據(jù)劃分為大小為若干KB的數(shù)據(jù)塊,然后使用SHA-1算法為每個數(shù)據(jù)塊計算出一個哈希值(又稱為索引/Index),通過比較新數(shù)據(jù)塊和已有數(shù)據(jù)塊的哈希值以確定新數(shù)據(jù)塊是否重復(fù),重復(fù)的數(shù)據(jù)塊將被丟棄,而僅保留其數(shù)據(jù)塊指針,全新的數(shù)據(jù)塊才會被存放到SIR存儲空間。
2.2 Inline重復(fù)數(shù)據(jù)刪除方案
VTL6900所支持的Inline重復(fù)數(shù)據(jù)刪除技術(shù),其數(shù)據(jù)比較方法也為索引比較方法。數(shù)據(jù)重復(fù)數(shù)據(jù)刪除執(zhí)行過程,如圖2所示。
Inline重復(fù)數(shù)據(jù)刪除技術(shù)原理
圖2 VTL集中備份方案
在Inline重復(fù)數(shù)據(jù)刪除模式中,VTL6900軟件包含兩個模塊:VTL模塊和SIR模塊。VTL6900在接收到備份數(shù)據(jù)時,Inline Parser會同步將內(nèi)存中的原始備份數(shù)據(jù)劃分為大小為若干KB的數(shù)據(jù)塊,然后使用SHA-1算法為每個數(shù)據(jù)塊計算出一個哈希值(又稱為索引/Index)。同時,SIR模塊會在內(nèi)存中同步的比較新數(shù)據(jù)塊和已有數(shù)據(jù)塊的哈希值以確定新數(shù)據(jù)塊是否重復(fù),重復(fù)的數(shù)據(jù)塊將被丟棄,而僅保留其數(shù)據(jù)塊指針,全新的數(shù)據(jù)塊才會被存放到SIR存儲空間。
3、華為OceanStor VTL6900系統(tǒng)亮點
高性能:滿足用戶對備份窗口的需求。單VTL引擎配置時,VTL6900備份性能可達(dá)9TB/hr,8小時內(nèi)可支持備份63TB數(shù)據(jù);雙引擎配置時,VTL6900實測備份性能高達(dá)31TB/hr,8小時內(nèi)可支持備份239TB數(shù)據(jù)。對于一次備份數(shù)據(jù)量不超過239TB的用戶,VTL6900可以很好地滿足其對備份窗口的要求。
大容量:滿足用戶對存儲容量的需求。雙VTL引擎配置時,VTL6900最大支持1728TB裸容量(可用容量為1230TB),提供重復(fù)數(shù)據(jù)刪除功能時,VTL6900最大可提供220TB存儲容量用于存放重復(fù)數(shù)據(jù)刪除后的數(shù)據(jù),以20:1重復(fù)數(shù)據(jù)刪除比計算,VTL6900可存放4PB備份數(shù)據(jù),滿足中高端用戶對備份容量的需求。
重復(fù)數(shù)據(jù)刪除:極大節(jié)約系統(tǒng)能耗和存儲投資。VTL6900支持重復(fù)數(shù)據(jù)刪除和磁盤休眠,可顯著減少備份系統(tǒng)需要配置的磁盤存儲,極大節(jié)省系統(tǒng)能耗和存儲投資。
集群架構(gòu):滿足用戶高可用需求。雙VTL引擎HA集群配置下,VTL6900的兩個VTL引擎一般都獨立工作,當(dāng)任何一個VTL引擎出現(xiàn)故障導(dǎo)致其無法支持備份業(yè)務(wù)時,另一個引擎將自動接管該故障引擎,VTL6900又恢復(fù)正常工作,滿足用戶對備份系統(tǒng)的高可用需求。3個(2+1)SIR引擎HA集群配置下,當(dāng)VTL6900任何一個SIR引擎出現(xiàn)故障導(dǎo)致其無法支持重復(fù)數(shù)據(jù)刪除業(yè)務(wù)時,Standby SIR引擎將自動接管該故障引擎,VTL6900又恢復(fù)正常工作,滿足用戶對備份系統(tǒng)的高可用需求。
4、VTL6900重刪備份系統(tǒng)給客戶帶來的價值
基于重復(fù)數(shù)據(jù)刪除的遠(yuǎn)程復(fù)制,顯著降低用戶網(wǎng)絡(luò)帶寬需求,節(jié)約網(wǎng)絡(luò)帶寬投資。各個站點的備份數(shù)據(jù)首先在本地VTL中完成重復(fù)數(shù)據(jù)刪除后,再通過WAN復(fù)制到數(shù)據(jù)中心VTL,復(fù)制過程中僅傳輸重復(fù)數(shù)據(jù)刪除后,且在數(shù)據(jù)中心不存在的那些數(shù)據(jù)塊,相比直接傳輸未經(jīng)重復(fù)數(shù)據(jù)刪除的備份數(shù)據(jù),此舉可大幅節(jié)約復(fù)制帶寬,顯著降低用戶網(wǎng)絡(luò)帶寬需求,節(jié)約網(wǎng)絡(luò)帶寬投資。
全局重復(fù)數(shù)據(jù)刪除,進(jìn)一步降低用戶存儲投資。VTL6900支持全局重復(fù)數(shù)據(jù)刪除功能,即復(fù)制過程中僅傳輸重復(fù)數(shù)據(jù)刪除后的、在數(shù)據(jù)中心不存在的那些數(shù)據(jù)塊,因此各個分支節(jié)點VTL之間的,以及各個分支節(jié)點VTL和數(shù)據(jù)中心VTL之間的重復(fù)數(shù)據(jù)均可得到消除,全局重復(fù)數(shù)據(jù)刪除的重復(fù)數(shù)據(jù)消除效率更高,進(jìn)一步降低用戶存儲投資。