IT專業(yè)人員通常使用復(fù)雜的工具來監(jiān)控并報告虛擬服務(wù)器性能,確保為每個工作負載都分配了足夠多的計算資源,保證每個系統(tǒng)在已制定的參數(shù)內(nèi)運行。但硬件平臺運行穩(wěn)定并不能確保運行在該平臺之上的工作負載向用戶交付了足夠好的服務(wù)級別。隨著企業(yè)對應(yīng)用的價值越來越重視,運維關(guān)注的焦點已經(jīng)從系統(tǒng)管理逐漸轉(zhuǎn)向了服務(wù)管理。
應(yīng)用性能管理的重要性
應(yīng)用性能管理是一個新興的數(shù)據(jù)中心準則,旨在確保工作負載對最終用戶交付了適宜的性能級別并協(xié)助IT專業(yè)人員對工作負載出現(xiàn)性能問題的根源進行診斷。
應(yīng)用性能管理(有時稱之為業(yè)務(wù)服務(wù)管理或者監(jiān)控)基于如下考慮:監(jiān)控系統(tǒng)硬件性能相對容易,但是硬件性能并非總能夠轉(zhuǎn)換為工作負載性能。服務(wù)器可能有足夠多的資源,然而工作負載可能仍舊會遇到性能瓶頸。
結(jié)果就是用戶體驗很糟糕,這可能會降低生產(chǎn)效率以及工作質(zhì)量,錯過銷售機遇或者接聽不必要的服務(wù)支持電話。
應(yīng)用性能管理能夠幫助IT專業(yè)人員了解每個企業(yè)負載的性能表現(xiàn)以及不同工作負載在數(shù)據(jù)中心服務(wù)器、存儲以及網(wǎng)絡(luò)基礎(chǔ)設(shè)施之間的交互情況。
準確定位虛擬數(shù)據(jù)中心存在的問題
在虛擬化之前,對物理服務(wù)器之上的應(yīng)用問題進行診斷相對簡單。在大多數(shù)情況下,管理員通過重新配置,升級或者為服務(wù)器打補丁能夠解決問題。
不幸的是,虛擬化診斷為應(yīng)用性能增加了一個全新的、很復(fù)雜的虛擬化層。運行多個工作負載肯定有益于提升服務(wù)器的利用率,但是硬件資源共享有時可能會導致不可預(yù)見的結(jié)果,以意想不到的方式對工作負載的性能產(chǎn)生不良影響。
例如,假定一臺數(shù)據(jù)庫服務(wù)器和一臺多媒體服務(wù)器共享同一臺主機服務(wù)器。服務(wù)器有足夠多的資源來應(yīng)對工作負載對資源的需求,而且在正常的使用模式下,這兩個工作負載都交付了足夠好的性能,F(xiàn)在假定用戶一直在抱怨數(shù)據(jù)庫查詢性能低下,IT專業(yè)人員通常會通過檢查數(shù)據(jù)庫服務(wù)器虛擬機來應(yīng)對用戶的抱怨,希望發(fā)現(xiàn)是配置發(fā)生了變化或者資源存在不足。但是檢查完數(shù)據(jù)庫服務(wù)器后,看起來唯一的問題就是當數(shù)據(jù)庫查詢性能低下時本地磁盤的I/O過于頻繁,但是本地磁盤活動頻繁卻和數(shù)據(jù)庫虛擬機無關(guān)。然而另一名技術(shù)人員發(fā)現(xiàn)當數(shù)據(jù)庫響應(yīng)緩慢時多媒體服務(wù)器虛擬機在處理大量的視頻處理請求。
在上述示例中,即使數(shù)據(jù)庫服務(wù)器虛擬機正面臨性能問題,但這是由本地多媒體虛擬機處理大量的請求而導致的。因此一臺虛擬機的性能可能會對其他本地虛擬機帶來不良影響。
虛擬化可能會使追蹤問題根源變得復(fù)雜起來,因為可能不會考慮特定系統(tǒng)上的其他負載情況就對虛擬機的資源進行調(diào)整或者遷移虛擬機。為更高效地診斷上述問題,IT專業(yè)人員需要使用能夠識別出虛擬機物理路徑以及每臺虛擬機正在運行的應(yīng)用的業(yè)務(wù)服務(wù)管理工具。
應(yīng)用性能管理診斷功能
負載性能監(jiān)控工具包括ManageEngine公司的應(yīng)用管理器、Dell的Foglight,BMC以及IBM推出的應(yīng)用性能管理。但是無論選擇哪種產(chǎn)品,下一代虛擬機性能監(jiān)控與管理工具必須能夠提供整個虛擬環(huán)境的智能、整體視圖,要能夠覆蓋終端設(shè)備。
例如,工具必須允許IT員工查看運行在物理系統(tǒng)之上的完整的虛擬基礎(chǔ)設(shè)施,還必須能夠記錄每臺虛擬機使用的計算資源并自動制定性能基線,在對工作負載的性能產(chǎn)生影響前報告所有的性能問題。結(jié)合上述特性使應(yīng)用性能管理工具能夠找到多個工作負載行為之間的因果關(guān)系,更好地對問題產(chǎn)生的根源進行分析。這是一個重大挑戰(zhàn),但將會作為數(shù)據(jù)中心發(fā)展的一個重要階段而出現(xiàn)。
從價值角度考慮,能夠更好地對問題根源進行分析的工具通過節(jié)省不必要的開銷,很可能會收回工具部署成本。例如,一名IT技術(shù)人員如果無法檢查虛擬機之間的關(guān)系,可能會試圖通過遷移虛擬機、升級服務(wù)器、替代服務(wù)器或者重新分配資源來解決工作負載問題,這會浪費大量的時間。盡管這些策略可能會緩和當前的問題,但并沒有從根本上解決問題也無法避免該問題在隨后繼續(xù)出現(xiàn)。
企業(yè)IT的目標是為員工、合作伙伴以及企業(yè)用戶提供服務(wù)。確保負載可用并提供足夠好的用戶體驗對數(shù)據(jù)中心今后的管理至關(guān)重要。恰當?shù)墓ぞ卟粌H能夠防患于未然而且能夠加快解決虛擬機交互所帶來的無法預(yù)想到的問題。目前市場上已經(jīng)推出了應(yīng)用性能監(jiān)控工具,但其功能、特性仍舊在不斷發(fā)展以為IT專業(yè)人員提供更好的洞察力以及決策信息。