云和大數據重塑科技和商業(yè)生態(tài)
不太為人所知的是,云計算和大數據的結合,最先影響到的是科學研究界。
2007年1月,我在微軟的同事、也是我非常尊敬的一位科學家吉姆·格雷(Jim Gray)在計算機科學與電信委員會上的一次演講中描繪了“科學研究的第四范式”的圖景。所謂“第四范式”是指基于數據密集型計算的科學研究——吉姆·格雷呼吁資助開發(fā)用戶數據采集、管理和分析的工具,呼吁資助一個交流與發(fā)布的基礎設施。在他的設想中,數據密集型科學由三個基本活動組成:采集、管理和分析。數據的源頭是各種不同規(guī)模和屬性的國際科學聯(lián)盟、實驗室甚至于個人生活,需要創(chuàng)建一系列通用工具來支持從數據采集、驗證、管理到分析、存儲的整個流程,而數據分析則覆蓋整個工作流程的所有環(huán)節(jié),包括建立數據庫、建模和分析、數據可視化等等。吉姆·格雷的最后一次演講體現了這位圖靈獎大師的遠見和雄心。
在商業(yè)領域,大數據具備極大的想象空間。
上個世紀七十年代,紐約的治安狀況很糟糕。一位名叫杰克•邁普(Jack Maple)的年輕警察根據個人警務經驗,發(fā)明了一種名為“未來圖表”(Charts of the future)的犯罪預測方法論,可以根據過往搶劫案的記錄數據來推測新案件可能發(fā)生的時間與地點。這種方法真的有效,1994年,新上任的紐約市警察局局長開發(fā)了“未來圖表”的電子版,將之更名為“CompStat”,推廣至全市的警務系統(tǒng)。CompStat的技術核心是犯罪測繪系統(tǒng)(Crime Mapping System)和數據庫采集系統(tǒng)(Database Collection System),而微軟的Microsoft MapPoint、Access、Excel等產品為兩個系統(tǒng)提供了堅實的支撐——基于大量的數據采擷、挖掘和分析工作,紐約警察局嘗試對歷史上犯罪分子的行為規(guī)律進行歸納和總結,并有效地改善了城市的治安。數據顯示,在CompStat得到推廣應用后,1995年,紐約的兇殺案發(fā)生率降低了約25%,車輛盜竊案發(fā)生率降低了約24%,而且這些數字還隨著IT軟硬件技術的持續(xù)更新和CompStat系統(tǒng)的不斷完善而逐年下降。
未來,透過技術手段完全遏制犯罪行為,讓每一個城市和地區(qū)的居民時時刻刻都安全無虞——這或許不是夢想。2012年8月,紐約市長邁克爾•布隆伯格(Michael Bloomberg)親手揭開了紐約警察局與微軟攜手開發(fā)的城域感知系統(tǒng)(DAS,Domain Awareness System)的面紗。該系統(tǒng)將覆蓋整個紐約市的3000多個監(jiān)控攝像頭、2600多枚輻射探測器、幾百個車牌信息讀取裝置所收集的信息匯總到警方數據庫中,可結合探測數據、實時影像、911報警電話和警方積累的罪案歷史檔案,幫助警方更準確地偵測并鎖定即將發(fā)生的犯罪活動及嫌疑人。
對商業(yè)競爭的參與者們來說,大數據意味著激動人心的業(yè)務與服務創(chuàng)新機會。零售連鎖企業(yè)、電商業(yè)巨頭都已在大數據挖掘與營銷創(chuàng)新方面有著很多的成功案例,它們都是商業(yè)嗅覺極其敏銳、敢于投資未來的公司,也因此獲得了豐厚的回報。
而對于那些擁有行業(yè)經驗,并熟練掌握云計算開發(fā)和應用技能的小型企業(yè),尤其是初創(chuàng)企業(yè)來說,則更是意義非凡。最近幾年,我們看到的一些明星初創(chuàng)公司,比如Cloudera, Splunk, Klout, TellApart等,人員規(guī)模只在數十人,但對某個行業(yè)擁有深厚知識,并能通過云和大數據的技術手段,快速解決該行業(yè)的共性需求和痛點——在未來數年,這樣的“小而精”、“快而準”企業(yè)會越來越多,并做出有可能改變世界的顛覆性產品。很高興看到,在北京中關村,在微軟的云加速器二期,也有類似的初創(chuàng)企業(yè)加入,和硅谷、海法的創(chuàng)業(yè)者們一起,把握住了時代的脈搏。
總而言之,云計算和大數據的結合,將對今后的政治、經濟、科技、民生產生難于估量的影響。無論是做硬件、做平臺,還是做應用、做服務,歸根結底都是以數據為核心、以數據為動力,來提升產品對用戶的引力、強化企業(yè)競爭力、創(chuàng)造新的商業(yè)機遇。數據已經被認為是寶貴資源,任何一家有雄心、渴望獲取洞察力的企業(yè),都應及早制定大數據戰(zhàn)略和方案。否則,所有的機會將被“數據鴻溝”所延宕。