1月20日,2016云棲大會上海峰會在上?萍拣^召開。全球領(lǐng)先的云計算服務(wù)提供商阿里云和全球視覺計算的行業(yè)領(lǐng)導(dǎo)者NVIDIA(英偉達)簽署戰(zhàn)略合作協(xié)議,雙方將共同推廣阿里云高性能計算平臺HPC,大力拓展深度學(xué)習市場,并建立聯(lián)合實驗室,進行高性能計算領(lǐng)域相關(guān)技術(shù)的聯(lián)合攻關(guān)。
阿里云HPC于去年底正式對外商用,每個計算節(jié)點配備2顆專屬NVIDIATeslaK40GPU和2顆CPU。用戶可通過阿里云官網(wǎng)(www.aliyun.com/product/hpc)購買GPU服務(wù)器實例。這是中國首個云上高性能計算平臺。
阿里云首席科學(xué)家章文嵩表示:“深度學(xué)習領(lǐng)域的創(chuàng)業(yè)創(chuàng)新企業(yè)是阿里云HPC最重要的客戶群之一,未來阿里云將發(fā)揮自身在公共云計算領(lǐng)域的優(yōu)勢和高性能計算領(lǐng)域積累的應(yīng)用經(jīng)驗,與英偉達一起為深度學(xué)習的新興企業(yè)提供更加強大的支持。”
NVIDIA全球副總裁ShankerTrivedi表示:“我們非常高興能夠基于中國最大的云服務(wù)平臺——阿里云為客戶提供GPU計算服務(wù),用戶不僅可以通過云體驗到最新的GPU技術(shù),NVIDIA也將發(fā)揮在技術(shù)平臺、生態(tài)系統(tǒng)和全球用戶經(jīng)驗,與阿里云一起為人工智能、深度學(xué)習等領(lǐng)域的新興企業(yè)創(chuàng)新提供有力的支持。”
深度學(xué)習火爆,GPU比CPU更受追捧
近幾年,基于互聯(lián)網(wǎng)和人工智能技術(shù)的創(chuàng)業(yè)風起云涌,格靈深瞳、Face++、神馬語音等公司在圖像、語音、安全等領(lǐng)域進行著人工智能的創(chuàng)新,以圖形圖象和音視頻為代表的深度學(xué)習是典型的計算密集型應(yīng)用,由此催生了互聯(lián)網(wǎng)行業(yè)對高性能計算的需求。
早在去年10月阿里云HPC對外公測期間,上百家用戶找到阿里云申請使用,客戶類型涵蓋深度學(xué)習、科研、金融甚至國家超算用戶,市場需求旺盛。
專注于計算機視覺識別的明星創(chuàng)業(yè)公司格靈深瞳HPC負責人張洋表示:“阿里云HPC產(chǎn)品性能強勁,配置簡單,作為線上預(yù)測服務(wù)平臺是很棒的選擇。”
據(jù)悉,阿里云將聯(lián)合英偉達一起合作拓展深度學(xué)習市場,大力扶持深度學(xué)習創(chuàng)新企業(yè),包括深度學(xué)習、人工智能、機器人等方向。阿里云也將成為英偉達官方推薦云上深度學(xué)習平臺。
基于英偉達在HPC領(lǐng)域多年積累的豐富生態(tài)資源,阿里云將進一步拓展包括教育與科研、政府、媒體和娛樂、醫(yī)療等行業(yè)的HPC客戶使用阿里云HPC平臺,發(fā)展更多的HPC應(yīng)用。
建立聯(lián)合實驗室阿里云“軟實力”受青睞
高性能計算不僅需要硬件設(shè)施,更需要匹配技術(shù)“軟實力”,才能最大限度發(fā)揮硬件性能。
阿里云HPC負責人王琤介紹,阿里云不僅提供硬件和基本系統(tǒng),更為HPC準備了Docker實例、調(diào)度系統(tǒng)、監(jiān)控平臺,以及針對深度學(xué)習的訓(xùn)練、預(yù)測中間件和工具。
尤其值得一提的是,阿里云開放了全世界唯一的NVIDIAKepler架構(gòu)GPU原生匯編器及NVIDIACUDA(ComputeUnifiedDeviceArchitecture)占用計算器,這是阿里內(nèi)部性能調(diào)優(yōu)的“獨門秘技”。阿里用這款匯編器優(yōu)化出了目前在Kepler架構(gòu)GPU上最快的卷積、矩陣乘法實現(xiàn)。
此次上海云棲大會,阿里云也聯(lián)合英偉達宣布建立聯(lián)合實驗室,共同進行GPU高性能計算、CDN增值服務(wù)應(yīng)用、深度學(xué)習等領(lǐng)域的技術(shù)合作和攻關(guān),共同支持重點客戶HPC應(yīng)用的移植和優(yōu)化。
此外,阿里云將為英偉達CUDA培訓(xùn)提供學(xué)習訓(xùn)練平臺,英偉達將把阿里云HPC平臺作為CUDA培訓(xùn)的指定平臺,雙方將聯(lián)合在高校等渠道推廣。
據(jù)介紹,阿里在高性能計算領(lǐng)域已實踐多年,內(nèi)部部署了大規(guī)模GPU異構(gòu)計算集群,從設(shè)備選型、準入測試、運維監(jiān)控,到系統(tǒng)架構(gòu)、性能優(yōu)化等,整個鏈條都有深入積累。
王琤表示,脫胎于阿里“母體”的HPC不僅是一款產(chǎn)品,更是一種服務(wù)能力,這是阿里云的核心競爭力。