當(dāng)前,眾多企業(yè)都面對(duì)從四面八方涌來的數(shù)據(jù)流的沖擊。涓涓細(xì)流匯成大河,而科技企業(yè)、專家、分析師和技術(shù)顧問們紛紛將這條數(shù)據(jù)之河定義為大數(shù)據(jù)。但是,在這些眾說紛紜的大數(shù)據(jù)定義中,不乏大量的常見誤解。大量的企業(yè)都面臨著挑戰(zhàn),需要辨別具有價(jià)值的數(shù)據(jù)流,挖掘這些價(jià)值,協(xié)助企業(yè)做出最佳決策以形成強(qiáng)大的競爭優(yōu)勢。
“大數(shù)據(jù)”這一術(shù)語的內(nèi)涵遠(yuǎn)遠(yuǎn)超越了“大”或是“數(shù)據(jù)”的含義。大數(shù)據(jù)的確體現(xiàn)為數(shù)量龐大,但它仍有更多特性有待了解。在Forrester分析師布賴恩·霍普金斯(Brian Hopkins)和鮑里斯·埃韋爾松(Boris Evelson)撰寫的《首席信息官,請(qǐng)用大數(shù)據(jù)擴(kuò)展數(shù)字視野》報(bào)告中,他們提出大數(shù)據(jù)的4項(xiàng)典型特征——海量(Volume)、多樣性(Variety)、高速(Velocity)和易變性(Variability)。下文將簡要介紹這些特性,并重點(diǎn)闡述大數(shù)據(jù)對(duì)前瞻性商界領(lǐng)袖的重大意義。
海量
企業(yè)面臨著數(shù)據(jù)量的大規(guī)模增長。例如,IDC最近的報(bào)告預(yù)測稱,到2020年,全球數(shù)據(jù)量將擴(kuò)大50倍。目前,大數(shù)據(jù)的規(guī)模尚是一個(gè)不斷變化的指標(biāo),單一數(shù)據(jù)集的規(guī)模范圍從幾十TB到數(shù)PB不等。簡而言之,存儲(chǔ)1PB數(shù)據(jù)將需要兩萬臺(tái)配備50GB硬盤的個(gè)人電腦。
此外,各種意想不到的來源都能產(chǎn)生數(shù)據(jù)。例如,從巴塞羅那至沙特首府利雅得的單程航行中,一架商用噴氣飛機(jī)上收集的傳感器數(shù)據(jù)量將超過1PB。當(dāng)用一次飛行的數(shù)據(jù)量乘以每天所有飛行的航班數(shù),數(shù)據(jù)總量將非常驚人。
多樣性
一個(gè)普遍觀點(diǎn)認(rèn)為,人們使用互聯(lián)網(wǎng)搜索是形成數(shù)據(jù)多樣性的主要原因,這一看法部分正確。然而,數(shù)據(jù)多樣性的增加主要是由于新型多結(jié)構(gòu)數(shù)據(jù),以及包括網(wǎng)絡(luò)日志、社交媒體、互聯(lián)網(wǎng)搜索、手機(jī)通話記錄及傳感器網(wǎng)絡(luò)等數(shù)據(jù)類型造成。其中,部分傳感器安裝在火車、汽車和飛機(jī)上,每個(gè)傳感器都增加了數(shù)據(jù)的多樣性。
高速
高速描述的是數(shù)據(jù)被創(chuàng)建和移動(dòng)的速度。在高速網(wǎng)絡(luò)時(shí)代,通過基于實(shí)現(xiàn)軟件性能優(yōu)化的高速電腦處理器和服務(wù)器,創(chuàng)建實(shí)時(shí)數(shù)據(jù)流已成為流行趨勢。企業(yè)不僅需要了解如何快速創(chuàng)建數(shù)據(jù),還必須知道如何快速處理、分析并返回給用戶,以滿足他們的實(shí)時(shí)需求。
根據(jù)IMS Research研究機(jī)構(gòu)關(guān)于數(shù)據(jù)創(chuàng)建速度的調(diào)查,通過跟蹤可聯(lián)網(wǎng)設(shè)備的激活量,發(fā)現(xiàn)聯(lián)網(wǎng)設(shè)備增長的第二波浪潮正在加速到來。本輪增長后,將涌現(xiàn)更多新型可聯(lián)網(wǎng)設(shè)備增長的浪潮。據(jù)預(yù)測,到2020年全球?qū)碛?20億部互聯(lián)網(wǎng)連接設(shè)備。
易變性
大數(shù)據(jù)具有多層結(jié)構(gòu),這意味著大數(shù)據(jù)會(huì)呈現(xiàn)出多變的形式和類型。相較傳統(tǒng)的業(yè)務(wù)數(shù)據(jù),大數(shù)據(jù)存在不規(guī)則和模糊不清的特性,造成很難甚至無法使用傳統(tǒng)的應(yīng)用軟件進(jìn)行分析。傳統(tǒng)業(yè)務(wù)數(shù)據(jù)隨時(shí)間演變已擁有標(biāo)準(zhǔn)的格式,能夠被標(biāo)準(zhǔn)的商務(wù)智能軟件識(shí)別。目前,企業(yè)面臨的挑戰(zhàn)是處理并從各種形式呈現(xiàn)的復(fù)雜數(shù)據(jù)中挖掘價(jià)值。
新型分析法
“大數(shù)據(jù)”這一術(shù)語也與從數(shù)據(jù)中獲得價(jià)值所采用的分析法類型相關(guān)。由于出現(xiàn)從既有及新興數(shù)據(jù)類型中獲得商業(yè)智能的需求,對(duì)現(xiàn)有應(yīng)用系統(tǒng)造成極大壓力,迫使企業(yè)尋求新的解決方案。創(chuàng)建新的分析應(yīng)用進(jìn)行多結(jié)構(gòu)數(shù)據(jù)分析,通常需要進(jìn)行專業(yè)資源和工具的戰(zhàn)略性投資。
對(duì)于企業(yè),大數(shù)據(jù)既是機(jī)遇也是威脅。那些能夠管理復(fù)雜數(shù)據(jù)并從中獲得精準(zhǔn)商業(yè)洞察力的企業(yè)將擁有超越競爭對(duì)手的重要優(yōu)勢。反之,那些不能精明管理數(shù)據(jù)的企業(yè)將在競爭中處于劣勢。