現(xiàn)如今的數(shù)據(jù)量增長以大爆炸的速度迅猛增長。據(jù)調(diào)研顯示,2006年至2011年之間,全球范圍內(nèi)的數(shù)字?jǐn)?shù)據(jù)量呈指數(shù)級增長趨勢,已經(jīng)從200艾字節(jié)增長到近2澤字節(jié)(10倍的增長),而預(yù)計(jì)到2015年,可用數(shù)字?jǐn)?shù)據(jù)將逾8澤字節(jié)。有近70%的雇員總數(shù)超過500名的企業(yè)均聲稱,他們正管理著超過100TB的數(shù)據(jù),而有近40%的企業(yè)表示他們目前管理的總數(shù)據(jù)量超過了1PB。
即使如此,這些數(shù)據(jù)量與那些世界領(lǐng)先的公司所正在生產(chǎn)和管理著的驚人數(shù)據(jù)量相比較仍然是蒼白的,而這都要?dú)w功于云計(jì)算、Web2.0、高性能計(jì)算和大數(shù)據(jù)的出現(xiàn),F(xiàn)如今的數(shù)據(jù)量是如此的驚人以至于傳統(tǒng)的數(shù)據(jù)中心如果沒有巨額投資迅速的升級到靈活的、可擴(kuò)展的解決方案的話,正在變得過時(shí)。
數(shù)據(jù)分析的重要性
除了可擴(kuò)展性的問題,企業(yè)還面臨一系列其他的挑戰(zhàn),這包括對大量數(shù)據(jù)信息的組織、備份和恢復(fù)等。但也許其中最重要的挑戰(zhàn)是如何分析和關(guān)聯(lián)數(shù)據(jù),來改善企業(yè)的決策和促進(jìn)利潤的增長。數(shù)據(jù)分析是企業(yè)在模擬用戶行為方面進(jìn)行的模型努力,以便改進(jìn)生產(chǎn),銷售和營銷決策,并避免用戶對企業(yè)產(chǎn)生消極的印象和發(fā)生其他欺詐活動(dòng)。
通過數(shù)據(jù)整理,找出規(guī)律和趨勢,以采取相關(guān)的行動(dòng)是至關(guān)重要的。那些成功進(jìn)行數(shù)據(jù)分析的企業(yè)很可能在未來站在領(lǐng)先決策的制高點(diǎn)。
數(shù)據(jù)中心的演變
隨著數(shù)據(jù)量的飆升和企業(yè)試圖適應(yīng)這一迫切需要分析如此海量數(shù)據(jù)的趨勢,數(shù)據(jù)中心被迫已經(jīng)經(jīng)歷了一系列的演變以應(yīng)對不斷變化的需求。除了不斷調(diào)整數(shù)據(jù)中心的存儲(chǔ)容量來處理如此龐大的數(shù)據(jù)量之外,數(shù)據(jù)中心體系結(jié)構(gòu)必須適應(yīng)更快和更強(qiáng)大的數(shù)據(jù)分析需求。
要理解這一演變,探索一下數(shù)據(jù)中心從其最基本的根源發(fā)展到今天擁有巨大設(shè)施的歷史,以及在這一過程中所經(jīng)歷的基本技術(shù)原理的變化是相當(dāng)有用的。
最早版本的數(shù)據(jù)中心只不過是一臺電腦包含一個(gè)CPU、內(nèi)存緩存和存儲(chǔ)的主機(jī)。彼時(shí)尚未有網(wǎng)絡(luò)的概念,所以數(shù)據(jù)中心的所有功能都包含在一個(gè)中心位置。
而隨著網(wǎng)絡(luò)被引入,將存儲(chǔ)元件從網(wǎng)絡(luò)上的計(jì)算組件進(jìn)行分離變得普及。這較之與CPU捆綁在一起,可以讓專用的存儲(chǔ)的優(yōu)勢得到充分的利用。
圖1:原始數(shù)據(jù)中心架構(gòu)
然而,在過去十年,數(shù)據(jù)量的增加以及隨之導(dǎo)致的數(shù)據(jù)分析需求的相應(yīng)的增加再次改變了典型的數(shù)據(jù)中心的結(jié)構(gòu)。現(xiàn)有互連技術(shù)過于緩慢,無法適應(yīng)實(shí)時(shí)(甚至相當(dāng)快)的處理大批量的數(shù)據(jù)需求,以及分析信息相關(guān)應(yīng)對措施的要求。大多數(shù)數(shù)據(jù)分析的請求需要幾周的時(shí)間來完成,屆時(shí)信息利用為時(shí)已晚。
為了解決互連性能較差的問題,數(shù)據(jù)中心解決方案開始提供將存儲(chǔ)捆綁到計(jì)算服務(wù)器。通過將計(jì)算和存儲(chǔ)之間的距離降低到接近零,使得企業(yè)獲得了立即訪問數(shù)據(jù)的能力,從而實(shí)現(xiàn)更快的分析和提高他們的業(yè)務(wù)決策能力。