如何優(yōu)化您的云計(jì)算基礎(chǔ)架構(gòu)
2011/09/01
云計(jì)算正在引起廣泛的討論并為企業(yè)IT世界帶來了活力。由于渴望提高效率和降低成本,各種規(guī)模和各式各樣的組織都在迅速地采用基于Web的軟件、平臺和基礎(chǔ)設(shè)施解決方案。確實(shí),分析公司國際數(shù)據(jù)公司(International Data Corporation)預(yù)計(jì)在2009年到2013年間,全球企業(yè)在云服務(wù)方面支出的復(fù)合年均增長率將達(dá)到26%,即從174億美元增長到442億美元。專家們預(yù)測也就是幾年的時間,大多數(shù)企業(yè)都會至少使用一些基于云技術(shù)的應(yīng)用和服務(wù)。
然而,除了能夠簡化管理、提高靈活性之外,云計(jì)算也對供電、冷卻和可用性帶來了挑戰(zhàn)。為了應(yīng)對這些挑戰(zhàn),各企業(yè)必須增加其電氣及機(jī)械基礎(chǔ)設(shè)施的強(qiáng)度和彈性。
本白皮書調(diào)查不斷采用基于云的解決方案背后的推動力,研究云架構(gòu)如何影響數(shù)據(jù)中心,討論一系列能夠幫助公司在不損失正常運(yùn)行時間或過載其供電與冷卻系統(tǒng)的情況下受益于云計(jì)算的具體方法與技術(shù)。
了解云計(jì)算
盡管存在各種各樣的定義,云計(jì)算最基本的定義就是IT基礎(chǔ)架構(gòu)、服務(wù)和軟件通過互聯(lián)網(wǎng)或內(nèi)部基于Web的基礎(chǔ)架構(gòu)進(jìn)行實(shí)時交付。一般來說,云解決方案分為三大類:
- 軟件即服務(wù)(SaaS),這種解決方案通過云來交付軟件應(yīng)用。
例如,在線CRM應(yīng)用Salesforce.com和基于Web的生產(chǎn)力套裝軟件Google Apps,都是常見的SaaS服務(wù)。
- 平臺即服務(wù)(PaaS),這類解決方案提供在線訪問計(jì)算資源和編程工具,開發(fā)人員可以利用這些資源和編程工具來創(chuàng)建和控制基于云計(jì)算的應(yīng)用。
如:源于Salesforce.com的Force.com,還有Microsoft Windows Azure,就是兩個人們比較熟悉的PaaS解決方案。
- 基礎(chǔ)設(shè)施即服務(wù)(IaaS),這類解決方案通過Web提供像存儲空間和處理能力這樣的基礎(chǔ)設(shè)施資源。亞馬遜網(wǎng)絡(luò)服務(wù)(Amazon Web Services)就是最著名的IaaS提供商之一。
無論是哪一類云計(jì)算解決方案,它們都能通過“公共云”(public cloud)或“私有云”(private cloud)來交付。公共云解決方案通過互聯(lián)網(wǎng)交換數(shù)據(jù)。在用戶端,除了一個Web瀏覽器和高速互聯(lián)網(wǎng)連接外,它們不需要任何基礎(chǔ)設(shè)施,其典型的收費(fèi)方式為訂閱型現(xiàn)收現(xiàn)付制(subscription-based),您只需為所使用的資源付費(fèi)。私有云解決方案利用相同的基礎(chǔ)技術(shù)和協(xié)議作為其公共對等物,但駐留在企業(yè)防火墻內(nèi)的私有或租用的服務(wù)器上。許多IT經(jīng)理人們都相信,私有云方案使他們的安全和管理工作更加輕松。
無論是公共云還是私有云解決方案,都能夠帶來大量的商業(yè)和技術(shù)方面的效益:
效率:云解決方案通常運(yùn)行在靈活、高度自動化的基礎(chǔ)架構(gòu)上,它們在管理上更加簡單,因而成本更低。另外,由于它們不需要本地服務(wù)器資源,公共云解決方案使各企業(yè)避免了巨大的前期軟硬件投資,使IT由資本支出轉(zhuǎn)為費(fèi)用。
靈活性:大多數(shù)云基礎(chǔ)架構(gòu)都廣泛采用服務(wù)器虛擬化技術(shù),這種技術(shù)允許單個物理服務(wù)器宿主成多個“虛擬服務(wù)器”,而每個虛擬服務(wù)器都有其自己的操作系統(tǒng)和應(yīng)用程序。由于那些虛擬服務(wù)器本質(zhì)上只是些復(fù)雜的計(jì)算機(jī)文件,創(chuàng)建一個虛擬服務(wù)器所需的時間只相當(dāng)于建立一個新的物理服務(wù)器的一小部分。因此,云環(huán)境使企業(yè)部署新的應(yīng)用和服務(wù)的速度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)環(huán)境。
可擴(kuò)展性:大多數(shù)云方案都利用虛擬化帶來的靈活性,使用戶根據(jù)需求的變化而動態(tài)地增加或去除處理與儲存能力。
云計(jì)算如何影響IT基礎(chǔ)設(shè)施
維持可用性和提供充足的供電和制冷能力對于傳統(tǒng)的數(shù)據(jù)中心管理人員來說是長期存在的挑戰(zhàn)。然而,由于種種原因,云數(shù)據(jù)中心的管理人員要解決那些問題會更加困難。
供電與制冷
大多數(shù)云基礎(chǔ)架構(gòu)用于宿主虛擬機(jī)的服務(wù)器硬件都比典型的單一功能的服務(wù)器更大且更穩(wěn)定。同時也得到更為廣泛的利用:當(dāng)平均非虛擬服務(wù)器以5~15%的處理能力運(yùn)行時,平均虛擬主服務(wù)器在任何時候的利用率可能高達(dá)80%。鑒于這兩種原因,大多數(shù)云數(shù)據(jù)中心的虛擬主服務(wù)器都比傳統(tǒng)服務(wù)器需要更多的供電,配電裝置(PDU)、配電盤和不間斷電源系統(tǒng)(UPS)的負(fù)擔(dān)也更重。
當(dāng)企業(yè)部署刀片式服務(wù)器來宿主其虛擬服務(wù)器時尤其如此。刀片式服務(wù)器采用多個即插即用型處理裝置,它們共享公共的電氣系統(tǒng)、電源、風(fēng)扇、電纜和存儲器。這樣的安排節(jié)省了數(shù)據(jù)中心的占地面積,簡化了硬件管理,并提高了IT靈活性。然而,這同時也大大增加了運(yùn)算密度。結(jié)果,刀片式服務(wù)器產(chǎn)生大量的熱,從根本提高了機(jī)柜級供電要求。確實(shí),一個典型的傳統(tǒng)服務(wù)器機(jī)柜可能需要4至6 kW電力,而一個典型的布滿刀片式機(jī)架的機(jī)柜則可能需要高達(dá)30 kW的電力,遠(yuǎn)遠(yuǎn)超過許多電源和冷卻系統(tǒng)的處理能力。
圖:大多數(shù)云基礎(chǔ)架構(gòu)為超高密環(huán)境,機(jī)柜級供電要求遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的數(shù)據(jù)中心
可靠性
大多數(shù)云計(jì)算環(huán)境大量采用虛擬化技術(shù)對可用性具有重要影響。在傳統(tǒng)的數(shù)據(jù)中心,每個服務(wù)器通常只支持一種應(yīng)用。而在虛擬化的云計(jì)算數(shù)據(jù)中心,一個主服務(wù)器可以支持幾種或多種應(yīng)用。因此,一旦主機(jī)發(fā)生故障,將會影響大批用戶和企業(yè)職能。
此外,令云計(jì)算和虛擬化如此吸引人的靈活性也能夠在有意無意間導(dǎo)致停機(jī)。沒有正確的管理,在數(shù)據(jù)中心內(nèi)或跨數(shù)據(jù)中心的突然轉(zhuǎn)移工作負(fù)荷會造成電路過載或冷卻系統(tǒng)負(fù)擔(dān)過重,進(jìn)而使關(guān)鍵的系統(tǒng)崩潰。
基于云基礎(chǔ)架構(gòu)的供電與冷卻策略
IT及設(shè)備管理人員可以通過實(shí)施下述策略來應(yīng)對為云環(huán)境提供供電和冷卻的巨大挑戰(zhàn)。
采用模塊式供電與冷卻系統(tǒng)組件
任何云數(shù)據(jù)中心的管理者都不希望其供電和冷卻能力無法滿足客戶需求。另一方面,在未來需要之前過早地提前部署額外能力會浪費(fèi)大量的時間、金錢和資源。
采用模塊式供電系統(tǒng)組件是一種更理想的作法。這類產(chǎn)品使您能夠隨著需求的增長而快速、遞增式地提高能力。例如,用于小型云環(huán)境的模塊式可擴(kuò)展型UPS可以基于能夠安裝在標(biāo)準(zhǔn)設(shè)備機(jī)柜內(nèi)的12kW組件,提供高達(dá)50或60kW的供電能力。隨著需求的增長,IT人員可以插入另一個12kW組件,供電能力(在本例中)從12kW增加至N+1架構(gòu)的60kW。此外,基于機(jī)柜的模塊式供電系統(tǒng)組件都傾向于采用緊湊結(jié)構(gòu),且易于安裝,這就使其非常適用于技術(shù)人員會經(jīng)常移動、改變和增加基礎(chǔ)設(shè)施資源的快節(jié)奏的云數(shù)據(jù)中心。
UPS供電模塊的規(guī)模小到3kVA,大到1,000kVA以上。一般來說,企業(yè)應(yīng)該部署比成品模塊預(yù)計(jì)滿容量小4~6倍的UPS模塊。
模塊化UPS設(shè)計(jì)允許最初的12kW N+1架構(gòu)設(shè)備擴(kuò)展至36kW以上,以滿足未來的電源要求。
圖:模塊式電源組件讓您根據(jù)需求的不斷增長而遞增式地提高能力
部署被動式冷卻系統(tǒng)
現(xiàn)在,大多數(shù)企業(yè)都在其服務(wù)器所在樓層的周圍部署機(jī)房空調(diào)(CRAC)裝置來解決數(shù)據(jù)中心產(chǎn)生的熱量。許多公司還采用“熱通道-冷通道”式硬件配置,針對指定的服務(wù)器機(jī)柜只配置了熱風(fēng)排出或者冷風(fēng)吸入。這就產(chǎn)生了對流循環(huán),從而形成冷卻的連續(xù)氣流。然而,雖然這類技術(shù)基本足以應(yīng)對傳統(tǒng)數(shù)據(jù)中心的需求,但卻往往無法處理云基礎(chǔ)架構(gòu)產(chǎn)生的巨大熱量。因此,公共和私有云環(huán)境通常需要更先進(jìn)、更強(qiáng)大的冷卻技術(shù)。
模塊式冷卻系統(tǒng)組件與上面討論過的UPS設(shè)計(jì)類似,目前許多制造商都有生產(chǎn)。然而,根據(jù)需求的增長部署額外的冷卻模塊并不像模塊式UPS那么簡單。數(shù)據(jù)中心管理人員通常必須提前為那些設(shè)備安裝造價昂貴的地板下或架空管道。因此,許多公司寧愿通過配備帶有變頻驅(qū)動或電子整流(EC)扇的CRAC和機(jī)房空氣調(diào)節(jié)器(CRAH)系統(tǒng)來降低與冷卻相關(guān)的耗電量。變頻驅(qū)動讓空氣調(diào)節(jié)系統(tǒng)在服務(wù)器需要較少的冷卻量時運(yùn)行得更慢,在工作負(fù)荷達(dá)到峰值時運(yùn)行得更快,從而達(dá)到節(jié)能目的。同樣,EC風(fēng)扇采用“智能”電機(jī),根據(jù)氣流的需求量運(yùn)行得更快或更慢。
圖:在最初施工時可以加裝帶快速接頭的地板下或架空管道,盡管它們會增加施工成本
追求更低前期成本和更高運(yùn)行效率的公司可以安裝被動式冷卻系統(tǒng)。它們的機(jī)殼上裝有一個氣密的后門和煙囪,用于收集來自服務(wù)氣的熱排風(fēng),并將其直接引導(dǎo)至CRAC裝置上的回風(fēng)管道中。然后,CRAC裝置對排風(fēng)進(jìn)行冷卻并重新循環(huán)。被動式系統(tǒng)要求機(jī)柜從前到后都具有較強(qiáng)的氣密性,以便與由CRAC裝置進(jìn)入的冷風(fēng)混合的服務(wù)器熱風(fēng)盡量少。通過比普通的熱-冷通道技術(shù)更徹底地分離冷風(fēng)和熱風(fēng),設(shè)計(jì)合理的被動式冷卻系統(tǒng)甚至能以低成本使灼熱的30kW服務(wù)器機(jī)柜在安全溫度下運(yùn)行。
圖:本文所述的被動式冷卻系統(tǒng)利用氣密的機(jī)殼和煙囪在熱風(fēng)與冷風(fēng)混合前排出數(shù)據(jù)中心,從而使溫度管理更加高效
建造多個設(shè)備間
提供公共云服務(wù)的大型數(shù)據(jù)中心通常在與服務(wù)器樓層相鄰的指定設(shè)備間內(nèi)配備UPS設(shè)備。建立兩個設(shè)備間,一個用于UPS和供電系統(tǒng)電氣組件,另一個用于UPS蓄電池,這種安排的效率更高。由于UPS電子裝置的典型安全工作溫度為35°C / 95°F,UPS蓄電池溫度通常必須保持在25°C / 77°F。
將UPS蓄電池放在其自己的環(huán)境可控房間內(nèi)可以減少冷卻系統(tǒng)必須處理的熱量。將放熱量較大的設(shè)備部署在可接受的高溫環(huán)境中有助于降低冷卻需求和節(jié)省電費(fèi)。
改善云基礎(chǔ)架構(gòu)可靠性的策略
盡管云計(jì)算使得保持正常運(yùn)行時間更加困難,下面所討論的方法和技術(shù)能夠顯著改善這項(xiàng)任務(wù)。
進(jìn)行電源鏈審計(jì)
打算在現(xiàn)有數(shù)據(jù)中心的基礎(chǔ)上增加云基礎(chǔ)架構(gòu)的企業(yè)應(yīng)該在其部署前規(guī)劃中包含電源鏈審計(jì)。由通過認(rèn)證的供電系統(tǒng)工程師進(jìn)行審計(jì)時,電源鏈審計(jì)有助于評估您的供電系統(tǒng)和確定哪個需要進(jìn)行升級、擴(kuò)展或現(xiàn)代化(如果有),以支持云環(huán)境更苛刻的要求。另外,電源鏈審計(jì)還能夠幫助您識別潛在的成本節(jié)約機(jī)會,評估您的供電組件的電氣安全性。
為供電基礎(chǔ)架構(gòu)增加冗余度
企業(yè)可以利用如下的冗余供電系統(tǒng)架構(gòu)來提高可用性和減少計(jì)劃外停機(jī)的可能性:
N+1:N+1架構(gòu)比保持服務(wù)器設(shè)備啟動和運(yùn)行所需的最低要求多一個UPS、發(fā)電機(jī)或其它供電組件。因此,如果任何一個組件發(fā)生中斷或需要維護(hù),其余系統(tǒng)仍能提供充分的保護(hù),以免數(shù)據(jù)丟失。N+1架構(gòu)一般足以滿足小型或中型云環(huán)境的需求。
圖:即使UPS因技術(shù)問題或維護(hù)要求而關(guān)閉,N+1供電體系結(jié)構(gòu)仍能繼續(xù)工作
2(N):它對于大型云環(huán)境是一個不錯的選擇,2(N)架構(gòu)的特點(diǎn)是有兩個獨(dú)立但相同的供電路徑,每個都能自行支持整個架構(gòu)。在正常情況下,兩個供電路徑均按50%供電能力工作。然而,如果一個路徑發(fā)生計(jì)劃內(nèi)或計(jì)劃外停機(jī),另一個就會臨時按100%供電能力運(yùn)行來進(jìn)行補(bǔ)償。
2(N)架構(gòu)與含有雙電源的服務(wù)器配合使用。在這種排列中,每個電源一般都是利用一個獨(dú)立的供電路徑。那樣,即使整個動力總成都關(guān)機(jī)進(jìn)行維修或維護(hù),服務(wù)器仍然可用。
圖:A 2(N)電源架構(gòu)利用獨(dú)立且相同的供電路徑。如果任何一個路徑發(fā)生故障,另一個會自動補(bǔ)償
部署復(fù)制軟件
為了進(jìn)一步提高可靠性,云數(shù)據(jù)中心管理人員可以使用基于軟件的冗余技術(shù),如:復(fù)制。復(fù)制解決方案持續(xù)捕獲所保護(hù)的服務(wù)器上發(fā)生的變化,然后接近實(shí)時地將其復(fù)制到備份服務(wù)器中。如果主服務(wù)器發(fā)生故障,則備份服務(wù)器能夠迅速介入,從而確保無縫的可用性。
利用實(shí)時遷移軟件
利用許多服務(wù)器虛擬化解決方案中內(nèi)建的實(shí)時遷移功能是另一個有效的基于軟件的可靠性策略。實(shí)時遷移系統(tǒng),如:VMware公司的在線遷移(vMotion)解決方案,讓管理員能夠幾乎同時地將虛擬服務(wù)器由一個物理主機(jī)遷移至另一個物理主機(jī),以解決技術(shù)問題或滿足維護(hù)要求。假如一個物理服務(wù)器有即將發(fā)生故障的跡象,技術(shù)人員就可以利用實(shí)時遷移軟件迅速地將其虛擬機(jī)轉(zhuǎn)移至另一個宿主機(jī)上,直到問題解決為止。
部署集成管理軟件
清潔、可靠的電源是云基礎(chǔ)架構(gòu)作為處理能力和存儲空間成功運(yùn)行的關(guān)鍵。那么,為了讓云數(shù)據(jù)中心保持平穩(wěn)運(yùn)行,管理員需要關(guān)于其IT資源和電力資源的完整的最新信息,F(xiàn)在,許多云操作人員都利用獨(dú)立的管理工具來監(jiān)測其服務(wù)器和電源環(huán)境。然而,現(xiàn)在有了集成的解決方案,它讓管理員能夠只通過一個控制臺就能管理物理服務(wù)器、虛擬服務(wù)器、UPS、PDU等。
例如,最新發(fā)布的伊頓公司(Eaton)的智能電源管理器(Intelligent Power Manager)軟件和VMware的虛擬中心服務(wù)器(vCenter Server)虛擬化管理系統(tǒng)配合使用,支持在一個地方綜合查詢與網(wǎng)絡(luò)和電源相關(guān)的事件和報(bào)警信息。此外,管理員還能對這兩個系統(tǒng)進(jìn)行設(shè)置,讓其根據(jù)狀態(tài)信息動態(tài)地工作。假如您的數(shù)據(jù)中心發(fā)生電氣中斷,智能電源管理器(Intelligent Power Manager)和虛擬中心(vCenter)便可以從容地在您的UPS系統(tǒng)電量耗盡以前關(guān)閉受影響的虛擬及物理服務(wù)器;蛘,如果數(shù)據(jù)中心配備有在線遷移(vMotion),您就可以自動地將受影響的虛擬機(jī)遷移至另一個完全運(yùn)行的設(shè)備上的宿主設(shè)備。無論采用哪種方法,從最終用戶的角度來說,最終結(jié)果就是持續(xù)的正常運(yùn)行。
結(jié)論
基于云的軟件、平臺和基礎(chǔ)架構(gòu)解決方案提高了IT運(yùn)營的效率和靈活性。因此,許多企業(yè)現(xiàn)在都在開發(fā)和利用公共和私有云,并且在接下來的幾年里會有更多的企業(yè)加入。
然而,云計(jì)算也使數(shù)據(jù)中心遭受到更大的新壓力。云基礎(chǔ)架構(gòu)廣泛利用了虛擬化和更強(qiáng)大的服務(wù)器(包括刀片式服務(wù)器)和技術(shù),顯著地提高了機(jī)柜級供電和冷卻要求。此外,云數(shù)據(jù)中心一般是動態(tài)環(huán)境,虛擬工作負(fù)荷在物理主機(jī)之間自由的遷移。它增加了IT業(yè)的靈活性,但也會導(dǎo)致電路損壞及其它致使服務(wù)中斷的電氣問題。
為了掌控這些挑戰(zhàn),各企業(yè)應(yīng)該采用能夠提高其物理及虛擬環(huán)境(包括供電和冷卻系統(tǒng))可靠性和冗余度的技術(shù)和工藝。它們包括模塊式電源組件、被動式冷卻方案、復(fù)制解決方案和實(shí)時遷移軟件。另外,對物理及虛擬系統(tǒng)進(jìn)行適當(dāng)?shù)谋O(jiān)控將有助于企業(yè)更加輕松地管理其基礎(chǔ)設(shè)施?傊,這些工具和策略能夠幫助任何公司可靠而低成本地享受云計(jì)算的力量!(by,Chris Loeffler)。
比特網(wǎng)
相關(guān)閱讀: