盡管使用有效性進行衡量有它的好處,但并不能充分優(yōu)化數(shù)據(jù)中心的效率。IT團隊需要更詳細的數(shù)據(jù)中心指標(biāo),包括能源和冷卻基礎(chǔ)設(shè)施,以及計算系統(tǒng),以真正優(yōu)化數(shù)據(jù)中心。
談到在這一方面的進展,2007年美國環(huán)境保護局(Environmental Protection Agency)公布了一份關(guān)于數(shù)據(jù)中心效率的報告,其中指出希望發(fā)布名為“能源之星”(ENERGY STAR)的服務(wù)器評級標(biāo)準(zhǔn),盡管后來實現(xiàn)比預(yù)期的要晚,他們還是完成了這一標(biāo)準(zhǔn)。Green Grid早在2010年公布了水的使用效率和碳使用效率指標(biāo),但是并沒有引起太多的關(guān)注。2016年6月,Green Grid宣布的性能指標(biāo)(Performance Indicator,PI),一個著眼于將冷卻標(biāo)準(zhǔn)與能源效率結(jié)合起來進行評價的指標(biāo)。
我們已經(jīng)習(xí)慣于以性能和效率的指標(biāo)來評價數(shù)據(jù)中心,然而對于多數(shù)IT團隊來說,甚至是一些日常跟蹤能源使用效率(power usage effectiveness,PUE)的團隊來說,啟用新的評價指標(biāo)無疑需要更高端的數(shù)據(jù)收集以及分析技巧。對于那些已經(jīng)準(zhǔn)備好使用更加復(fù)雜優(yōu)化工具的團隊來說,有一些關(guān)鍵內(nèi)容需要事前考慮。
拓展數(shù)據(jù)中心評價指標(biāo)的意義
關(guān)閉休眠服務(wù)器、整合和虛擬化應(yīng)用程序或購買符合能源之星評級的硬件等方式來節(jié)約能源是常見措施。然而,除非能源和冷卻的基礎(chǔ)設(shè)施同樣完成優(yōu)化,這對現(xiàn)存系統(tǒng)較為困難,否則降低的消耗將無法顯著提高能源效率。這時PUE數(shù)據(jù)將變得更糟。通過以PUE為基準(zhǔn),而不作為跟蹤度量,指標(biāo)數(shù)據(jù)很可能看起來沒救了,這樣投資和付出是不值得的。管理層只希望他們的投資能催生較低的PUE數(shù)值,而沒有理解數(shù)字本身所代表的意義。
這就是其他數(shù)據(jù)中心所采用的評價指標(biāo),如Green Grid的數(shù)據(jù)中心能源效率(data center energy productivity,DCeP)都是有價值的原因。DCeP將完成有效工作時,數(shù)據(jù)中心實際產(chǎn)生每瓦的能量消費的數(shù)據(jù)進行了量化。DCeP允許用戶建立自己對有效工作指標(biāo)的定義。例如,在線搜索公司可能會以其網(wǎng)站完成的搜索數(shù)量作為定義內(nèi)容。而對于零售商來說,定義內(nèi)容很可能是銷售數(shù)量。PUE還是必要的,然而DCeP指標(biāo)能更容易被一些經(jīng)驗較少的人們所理解。
盡管DCeP不是一個科學(xué)準(zhǔn)確的度量角度,它提供了一種方法來量化你真正完成工作時所使用的能源。如果一家銀行的服務(wù)器在大部分時間里都處于空閑狀態(tài),它描述出最小能量,所需的最少的冷卻量,并不會顯著地影響PUE.但它仍然消耗了能力卻沒幾乎沒完成任何工作。DCeP則正相反,它的目標(biāo)是減少能源消耗,最大限度地提高有用的工作。對于行業(yè)中的領(lǐng)先企業(yè),要將每一盎司的生產(chǎn)性計算從他們使用的每瓦功率中擠壓出來,復(fù)雜的服務(wù)器可以提供遠遠超出了處理器利用率的操作數(shù)據(jù),而更為復(fù)雜的數(shù)據(jù)中心度量可以跟蹤結(jié)果。
然而PUE和DCeP還都只是有關(guān)能源效率和降低能源。使用它們衡量效率,可能造成部分無法識別的結(jié)果,因為這些指標(biāo)無法顯現(xiàn)出在節(jié)省能源、影響冷卻性能和可靠性方面所作出的犧牲和讓步。新的PI度量指標(biāo)則可以做到,對于那些擁有更高水準(zhǔn)數(shù)據(jù)收集技能的、有能力去優(yōu)化運營過程中每個環(huán)節(jié)的管理員很有幫助。
PI度量的四個層級
PI度量有四個層級。Level 1是基本層級,不需要復(fù)雜的設(shè)備就可以應(yīng)用。Level 2需要更徹底、更準(zhǔn)確的測量。Level 3和Level 4添加計算流體動力學(xué)(computational fluid dynamics,CFD)的空氣流建模來提供性能監(jiān)控的圖形可視化,還提供假設(shè)情景分析,預(yù)測使用當(dāng)前能源效率時,未來的能力和故障模式是如何的。Level 3是普通建模。Level 4使用實際和詳細的測量方法,校準(zhǔn)計算流體動力學(xué)模型作為其他標(biāo)準(zhǔn)可信賴的準(zhǔn)確度量基線。
要使用PI和DCeP這樣的標(biāo)準(zhǔn)拓展數(shù)據(jù)中心度量有三個前提;
采用PUE方法;
在計算操作中定義哪些工作是有效工作并且
獲取每個機架工作時產(chǎn)生的能源、溫度等詳細測量數(shù)據(jù)
PI將PUE、熱合規(guī)性和彈性結(jié)合起來補充現(xiàn)有的度量方法。后兩者分別基于ASHRAE推薦標(biāo)準(zhǔn)和允許的熱度范圍。熱合規(guī)性和彈性研究如何在正常和異常條件下保證冷卻工作的冗余。如果機房空調(diào)空氣溫度必須降低到滿足熱合規(guī)目標(biāo),PUE可能增加。PI度量的側(cè)重點是要了解硬件是如何可靠地被冷卻,以及能源設(shè)施的效率如何,以及一個因素如何影響其他因素。決定你距離想達到的極限距離有多少,以及你想要的目標(biāo)能源效率或PUE值。然后,測量實際情況并繪制一張三角形的圖,也稱為蜘蛛圖,看看他們是如何接近你的目標(biāo)。
圖1. 蜘蛛圖是從幾個維度衡量以確定大致的目標(biāo)一種方法
現(xiàn)在有幾種衡量數(shù)據(jù)中心的指標(biāo),依據(jù)能源效率,計算每單位能源消耗和可靠性相對能源效率的工作輸出,以最大限度地提高整體數(shù)據(jù)中心的性能。對于大多數(shù)運營工作來說,堅持基本設(shè)施和跟蹤電源使用的有效性應(yīng)處于最優(yōu)先?梢赃x擇其他標(biāo)準(zhǔn),但PUE仍然是基礎(chǔ)。即使你還沒有準(zhǔn)備好采取進一步的措施,了解行業(yè)中成形的建議還是有幫助的,只要你有了目標(biāo)就能知道應(yīng)該如何去做。