本文來自路透社,揭示了亞馬遜與谷歌在基因“云服務”上初露崢嶸的競爭。如果說未來是一個數(shù)據(jù)時代,而基因的數(shù)據(jù)又將是一個至關重要的領域。不知國內的云服務商們有沒有在展開類似的服務,又會不會以此為題材作為發(fā)展本土云服務重要性的有力依據(jù)呢?
為了在人類DNA數(shù)據(jù)存儲服務市場和醫(yī)學研究領域掌握話語權,亞馬遜已經(jīng)與谷歌展開競賽。
業(yè)內人士表示,學術研究機構和醫(yī)療公司將選擇在Google Genomics和亞馬遜云服務之間站隊。為了贏得備受矚目的基因組研究業(yè)務,雙方你追我趕。
個體化治療正在推動人類DNA數(shù)據(jù)存儲服務市場增長。個體化治療方案可以依據(jù)病人的DNA信息選擇治療方法。為此,我們需要大量的DNA數(shù)據(jù),以發(fā)現(xiàn)不同治療方法與具體基因信息之間的關系。
目前,美國大學和藥品制造商正在對數(shù)十萬人的基因組進行排序。人類基因組是包含在人類DNA中的全部遺傳信息,幾乎每一個人體細胞都包含同樣的基因信息。
在基因數(shù)據(jù)存儲方面,谷歌和亞馬遜的數(shù)據(jù)處理、安全性、成本控制和分享能力勝過學術機構和醫(yī)療公司。除了存儲服務,兩家云計算公司還提供數(shù)據(jù)分析服務,旨在讓科學家利用DNA數(shù)據(jù)。微軟和IBM同樣計劃進軍這個市場。
投資銀行FBR Capital分析師尼爾·艾夫斯(Daniel Ives)預計,目前全球云基因市場規(guī)模約為1億至3億美元,到2018年這個數(shù)字將增長到10億美元。屆時,整個云計算市場年營收將達500億至750億美元,高于現(xiàn)在的300億美元。
美國生物學家克萊格·凡特(Craig Venter)表示:“云計算是該領域的全部未來。”1990年代,凡特的公司開始測序人類基因組序列。
凡特表示,以前的數(shù)據(jù)傳輸方法非常落后,科學家必須通過聯(lián)邦快遞和專人運送磁盤和U盤,有時還要親自跑一趟,F(xiàn)在,凡特的公司已經(jīng)使用亞馬遜云服務。
美國制藥公司Regeneron Pharmaceuticals和醫(yī)療機構Geisinger Health Systems還合作測序了250,000個基因組序列。這些DNA數(shù)據(jù)被上傳到亞馬遜云服務。
免費存儲
為了展現(xiàn)谷歌和亞馬遜對這項業(yè)務的重視程度,以及對現(xiàn)有客戶的重視程度,兩家公司為知名基因組項目提供免費存儲服務。
谷歌和亞馬遜都沒有公布基因組信息存儲量,但根據(jù)分析師、基因科學家和公司披露的相關數(shù)據(jù),亞馬遜云服務可能略勝一籌。
作為“千人基因組計劃”項目的一位贊助人,美國國立衛(wèi)生研究院的凱西·克萊文迪(Kathy Cravedi)表示,“千人基因組計劃”項目數(shù)據(jù)同時免費存儲于谷歌和亞馬遜的服務。
但是,付費客戶往往選擇一款存儲服務。
例如,谷歌贏得了來自自閉癥之聲(Autism Speaks)的一個項目,該項目旨在收集和分析10,000名自閉癥兒童和他們父母的基因信息。谷歌的另一個付費客戶是基因數(shù)據(jù)創(chuàng)業(yè)公司Tute Genomics。
亞馬遜為Multiple Myeloma Foundation的項目提供存儲服務,該項目旨在為新型藥物靶標提供病人基因信息。亞馬遜還贏得了Alzheimer's Disease Sequencing Project項目。
亞馬遜每月針對每個完整的人類基因組收取大約4至5美元費用。谷歌的月費約為3至5美元。當科學家利用分析軟件處理存儲數(shù)據(jù),兩家公司還針對數(shù)據(jù)傳輸或計算時間收費。
亞馬遜數(shù)據(jù)庫分析工具Redshif按照25美元/小時或1,000美元/TB/年計費。1 TB空間足以存儲300小時時長高清視頻。
基因黃金
云服務還有另一個優(yōu)勢,就是它們的分析工具可以在基因組數(shù)據(jù)中“淘出黃金”,即預測疾病風險的DNA變異。所有基因黃金都屬于數(shù)據(jù)擁有者。
Alzheimer's Disease Sequencing Project項目負責人杰拉德·舍倫貝格(Gerard Schellenberg)表示,在大學服務器上,執(zhí)行一次數(shù)據(jù)分析可能需要數(shù)月時間。但在亞馬遜服務器上,“你想多快就多快”。
云服務的另一個賣點是安全性。計算器安全公司Cylance首席科學家瑞安·帕瑪(Ryan Permeh)表示,大學服務器存在很多漏洞。
Google Genomics工程主管大衛(wèi)·格雷澤(David Glazer)認為,目前學術和藥物研究項目是基因云服務的最大客戶,但未來10年臨床應用規(guī)模將超過它們。
未來,醫(yī)生可以定期進入云服務,了解病人基因信息引起各類疾病的風險,或者選擇適合病人的治療方案。
“我們現(xiàn)在處在這個拐點之上。”格雷澤說道。
亞馬遜云服務數(shù)據(jù)科學部門經(jīng)理馬特·伍德(Matt Wood)認為,基因組數(shù)據(jù)非常龐大,科學家需要協(xié)同研究這些數(shù)據(jù),而且基因組進入臨床治療的速度也在加速,基因組云服務的需求將飛速增長。
DNA研究專家認為,如果沒有云服務,現(xiàn)代基因組學就會止步不前。