由于云計(jì)算和虛擬化等新技術(shù)的到來,數(shù)據(jù)中心的演進(jìn)可能會(huì)把它自身變成一個(gè)非常不同的環(huán)境。然而,任何運(yùn)作平穩(wěn)且成功的數(shù)據(jù)中心總是需要一些基本要素的。不管數(shù)據(jù)中心的規(guī)模是像一個(gè)立式式衣柜還是一架飛機(jī),甚至是傳言中谷歌正在搭建游艇式數(shù)據(jù)中心,這些要素都是非常關(guān)鍵的。
1、環(huán)境控制
標(biāo)準(zhǔn)化、可預(yù)測(cè)的環(huán)境是任何高質(zhì)量數(shù)據(jù)中心的基石。這不僅僅是關(guān)乎讓設(shè)備冷卻、維持適當(dāng)?shù)臐穸龋ǜ鶕?jù)維基百科,推薦的溫度范圍是61-75華氏度/16-24攝氏度,40%-55%的濕度),你還需要考慮滅火、空氣氣流以及功率分配等因素。我曾經(jīng)工作過的一家公司為了確保數(shù)據(jù)中心盡可能一塵不染,要求機(jī)房?jī)?nèi)不能存放任何紙板箱。這么做是因?yàn)榧埌孱w粒可能會(huì)進(jìn)入氣流中,潛在地污染服務(wù)器,因?yàn)榉植紮C(jī)制是將冷空氣送到機(jī)架前端。這個(gè)例子可能有些極端,但是說明了這一點(diǎn)的重要性。
2、安全性
不用說(但不管怎樣我還是會(huì)說),物理安全是一個(gè)可靠的數(shù)據(jù)中心的基礎(chǔ)。讓你的系統(tǒng)處于嚴(yán)密的開啟關(guān)閉狀態(tài),僅允許那些獲得授權(quán)的人員進(jìn)入,在配合只允許對(duì)服務(wù)器、應(yīng)用和網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù)進(jìn)行的必要訪問?梢钥隙ǖ卣f,任何企業(yè)最有價(jià)值的資產(chǎn)都是在數(shù)據(jù)中心里。三流的小偷會(huì)偷筆記本電腦或者手機(jī)。職業(yè)偷盜者會(huì)把目光鎖定數(shù)據(jù)中心。門鎖是可以被攻克的,所以我建議同時(shí)使用警報(bào)器。當(dāng)然,警報(bào)器也可能失效,所以想想你的下一步措施:把服務(wù)器機(jī)架也鎖上?為你的安全系統(tǒng)配備備用電源?雇傭保安?這取決于你的安全需求,但是要記住,“安全是一段旅程,而不是終點(diǎn)。”
3、問責(zé)
作為一名系統(tǒng)管理員來說,我可以證明大多數(shù)IT人都是專業(yè)且值得信賴的。但是,我并不否認(rèn)需要在數(shù)據(jù)中心方面有一定的問責(zé)制度來追蹤其行為。數(shù)據(jù)中心應(yīng)該記錄通過準(zhǔn)入訪問的登錄信息(而且我建議這些日志由IT部門之外的部門管理,例如安全部門,或者這些信息的副本保存在IT總監(jiān)和副總裁等多人手中)。訪客應(yīng)該登錄或者登出,任何時(shí)候都保持在監(jiān)督的情況下。應(yīng)該開啟對(duì)網(wǎng)絡(luò)、應(yīng)用、文件資源的審查。最后,每個(gè)系統(tǒng)都應(yīng)該有一個(gè)確定的負(fù)責(zé)人,不管是服務(wù)器、路由器、數(shù)據(jù)中心冷卻器還是報(bào)警系統(tǒng)。
4、策略
每一個(gè)涉及數(shù)據(jù)中心的流程背后都應(yīng)該有它的一套策略,以確保環(huán)境維護(hù)和管理。你需要系統(tǒng)訪問和使用的策略(例如,只有數(shù)據(jù)庫(kù)管理員可以完全控制SQL服務(wù)器)。你還應(yīng)該有數(shù)據(jù)保留的策略——你保存?zhèn)浞荻嚅L(zhǎng)時(shí)間?你是離站保存這些備份嗎?如果這些備份內(nèi)容過期的話怎么辦?同樣的道理也適用于安裝新系統(tǒng),檢查過時(shí)的設(shè)備或者服務(wù),以及拆除舊設(shè)備——例如,擦除服務(wù)器硬盤,捐贈(zèng)或者回收硬件。
5、冗余
我擁有的第一輛車是一輛藍(lán)色福特Pinto。當(dāng)時(shí)它花了我父母400美元,油費(fèi)是每加侖1美元,我開著它到處走。它有一個(gè)備用輪胎經(jīng)常能派上用場(chǎng)。我說這件事并不是為了懷舊,而是為提出一個(gè)觀點(diǎn):即使我的老爺車也具備一定的冗余性。你的數(shù)據(jù)中心應(yīng)該是更尖端、更昂貴以及非常關(guān)鍵的,因此你需要的不僅僅是一個(gè)“備用輪胎”來確保它的健康運(yùn)行。你企業(yè)需要保持運(yùn)轉(zhuǎn)的一切事情都應(yīng)該至少保存兩份,不管是郵件服務(wù)器、ISP、數(shù)據(jù)光纖鏈路還是VOIP電話系統(tǒng)虛擬機(jī)。三份或者更多在很多情況下也不會(huì)有壞處的!
不僅僅是冗余組件很重要,測(cè)試和確保其穩(wěn)定工作的流程也很重要——例如定期進(jìn)行故障演練,研究新的方法等。
6、監(jiān)控
監(jiān)控所有系統(tǒng)的正常運(yùn)行時(shí)間和監(jiān)控狀況,將帶來巨大的正面價(jià)值,但這只是開始。你還需要監(jiān)控帶寬使用了多少,以及電力、存儲(chǔ)、物理機(jī)架空間,以及其他數(shù)據(jù)中心作為一種“商品”提供的任何東西。
還有像Nagios這樣的免費(fèi)工具監(jiān)控一些基本細(xì)節(jié),更復(fù)雜的解決方案如Dranetz測(cè)量功率。流程中還包括停電或者低閥值警報(bào)——以確保給你的警報(bào)上個(gè)保險(xiǎn),這樣就可以是獨(dú)立于數(shù)據(jù)中心的(例如,如果你的電子郵件服務(wù)器是在一個(gè)VMWare ESX主機(jī)上,而這個(gè)主機(jī)發(fā)生故障,那么另一個(gè)系統(tǒng)應(yīng)該監(jiān)控到這個(gè)情況,能夠及時(shí)發(fā)出通知)。
7、可擴(kuò)展性
所以,今天你的公司需要25臺(tái)服務(wù)器用于包括虛擬化、冗余性、文件服務(wù)器、電子郵件、數(shù)據(jù)庫(kù)和分析等一系列任務(wù)?那么你下個(gè)月、明年或者下個(gè)十年需要的是什么?確保你有適當(dāng)規(guī)模的數(shù)據(jù)中心,足夠擴(kuò)展的容量以增加電力、網(wǎng)絡(luò)、物理空間和存儲(chǔ)。如果你的數(shù)據(jù)中心需求不斷增長(zhǎng)——如果你的公司是盈利的,那么一定會(huì)出現(xiàn)這種情況——那么今天就開始做規(guī)劃吧。
為可擴(kuò)展性規(guī)劃并不是唯一一件事,這是一個(gè)持續(xù)的過程。明智的企業(yè)會(huì)積極地追蹤和報(bào)告這個(gè)理念。我在這些報(bào)告中看到了一些參考,其中談到了必須盡快填補(bǔ)關(guān)鍵領(lǐng)域可擴(kuò)展性中存在的差距。
8、變更管理
你可能會(huì)說,變更管理應(yīng)該歸在“策略”一項(xiàng)下,不過我會(huì)說這既是一項(xiàng)策略,也是一種理念。適當(dāng)變更管理的準(zhǔn)則會(huì)確保你那個(gè)尚未規(guī)劃、討論和商定提供故障措施或者B計(jì)劃的數(shù)據(jù)中心不會(huì)發(fā)生任何問題。不管是引入新系統(tǒng)還是淘汰舊系統(tǒng),你數(shù)據(jù)中心所有組件的生命周期都應(yīng)該與變更管理的前景相符合。
9、布置
我認(rèn)識(shí)的所有IT專業(yè)人員無不是時(shí)間緊迫的。部署新系統(tǒng)可能結(jié)果是由于痛苦的最后期限而砍掉了一些細(xì)節(jié)——這些細(xì)節(jié)似乎總是包括一些讓環(huán)境整潔漂亮的東西。
成功的系統(tǒng)實(shí)施并不僅僅意味著接入并開啟,還包括通過標(biāo)準(zhǔn)化和可支持的方法把設(shè)備集成到數(shù)據(jù)中心內(nèi)。你的服務(wù)器機(jī)架應(yīng)該是干凈的、擺放有序的(生產(chǎn)系統(tǒng)在一個(gè)機(jī)架,測(cè)試系統(tǒng)在另一個(gè)機(jī)架)。線纜長(zhǎng)度適中,遵循布線指南而不是隨意地鋪設(shè)。
10、文檔記錄
最后一點(diǎn)是適當(dāng)?shù)、有益的、及時(shí)的文檔記錄——如果你不嚴(yán)格遵循程序的話,你可能在實(shí)施過程中忽略這一點(diǎn)。只是羅列一堆關(guān)于交換機(jī)部署以及服務(wù)器接入的圖表還不夠,你的變更管理指南準(zhǔn)則要求文檔記錄應(yīng)該是具有相關(guān)性的,所有細(xì)節(jié)涉及到的人員都應(yīng)該能夠獲得。
也許聽上去有些變態(tài),但是我一直堅(jiān)守“被車撞”的規(guī)則。如果我明天被一輛車撞到,大家不用擔(dān)心我的工作文檔或者個(gè)人文檔是否更新了,因?yàn)槲颐恐芏紩?huì)確保所有變更和調(diào)整都被相應(yīng)地記錄下來。不夸張地說,如果我決定換工作地話,我不會(huì)花兩個(gè)星期的時(shí)間在系統(tǒng)保存上。
全部細(xì)節(jié)
這些理念的好處在于它們是與硬件或者軟件完全無關(guān)的。無論你的數(shù)據(jù)中心包含運(yùn)行Linux、Windows還是其他操作系統(tǒng)的服務(wù)器,還是僅僅是網(wǎng)絡(luò)交換機(jī)和大型機(jī)的集合,希望這些對(duì)于你和你的企業(yè)都是有用的。
將所有這些結(jié)合到一起,把你的IT環(huán)境想象成一個(gè)車輪,數(shù)據(jù)中心是樞紐,這10個(gè)要素就是周邊的“輪胎”。