比起Google等同行,微軟的AI研究似乎“藏”得更深。除了會打電話、會寫詩和會聊天的微軟小冰,微軟的AI還做了哪些事?微軟對一些前沿AI應用的理解是什么?微軟如何看待人們對AI的過度恐懼?以及,微軟為什么不像Google那樣做TPU機器學習芯片?
圍繞這些問題,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士與PingWest品玩創(chuàng)始人駱軼航進行了一次對話,回應了關于微軟人工智能的終極“七問”。
一問:人工智能應該被更溫暖地使用
駱軼航:今天我們主要聊聊微軟的人工智能特色優(yōu)點。我們會聊到一些AI教育、AI應用和關注普適性、普遍性的問題。開始我還是想先請您講一個故事。您跟羅徹斯特理工學院的BrianTrager在Build大會上有過對話,但BrianTrager本人失聰是聽不到的,而您當時講的中文。那么兩個人是怎么溝通的,原理是什么?背后的場景和技術都是什么樣?這個東西可能很多人都會很關心。
沈向洋:是的,我可以給你講一下這個故事。BrianTrager非常了不起,因為他天生聽不到。我以前對這些東西也不懂,跟他一起工作了兩天我才知道,失聰以后其實聽力是沒有反饋的,不像我們,講話自己還可以聽到。雖然我們聽到的也不是完全真正的聲音,是通過耳骨傳過來的,但已經(jīng)足夠好了。Brian因為說話聲音沒有反饋,所以他講話的聲音就不太對,一般人聽起來覺得有點怪怪的。
羅徹斯特理工學院設立了一個非常好的項目,有很多專門培養(yǎng)聾啞學生的課程。他們后來知道我們微軟有相關的人工智能技術之后,就跟我們合作,在項目里加入人工智能技術。其中有兩大技術比較重要。
一類技術是定制語音識別服務。對于通用的語音識別,比如你講的話、我講的話,微軟的技術就可以聽懂,這是通用的模型。但是聾啞學生那樣的語音很特別,發(fā)聲很奇怪,可能以前模型里沒有搜集到過這樣的數(shù)據(jù)。所以,在微軟人工智能的認知服務里面,我們提供了定制服務。這是我們的強項,可以用少量的數(shù)據(jù)令你做得很好。不光是語音識別,還有語音合成。
另外一類技術是翻譯。翻譯這一塊,我們做了很長時間,最近取得了非常大的進展。今天會場上黃學東博士演示的一款魔芋AI翻譯機,賣得非常好,后臺就是微軟做的。
駱軼航:所以概括一下,其中主要用的是兩個技術,一個是語音識別,包括定制化、識別特殊的人聲,通過大量的數(shù)據(jù)把它合成成普通人能夠聽得懂的人聲、機器能夠聽得懂的發(fā)聲;第二是翻譯技術。結合這兩者做到這樣的事情。
沈向洋:其實很了不起。像我的英語,其實是Chinglish;我的中文,也有南方口音。所以你提到Brian這個例子,今天我也很激動。我們還有一個類似的例子。有一個叫做宋昊旻的南京孩子,從小就已經(jīng)聽不到了。他非常了不起,唇語閱讀的能力非常強。他今天跟我做了一次交流,而且我反過來用英文跟他說話。
這是一件很感動的事情。我覺得更加重要的是,微軟讓人工智能有正能量。對盲人、聾啞人這類人群而言,技術上已經(jīng)好到足夠的地步了。做人工智能不見得要完全從商業(yè)利益出發(fā),我們很希望能夠做一些這樣正能量的事情。
二問:微軟小冰會打電話是真的,但GoogleAI給餐廳打電話是真的還是假的?
駱軼航:我們剛才提到了微軟兩個非常重要的引領性的AI技術,我很感興趣。這個牽出第二個非常感興趣的事——微軟小冰。小冰是一個溝通式、對話式的人工智能。小冰打電話這件事兩年前我們就見過,不過上周另一家總部在Moutain View的廠商(Google)也演示了一個很酷的AI的打電話的演示,當時我也在現(xiàn)場。
沈向洋:很激動人心,那個演示得很好。
駱軼航:能不能簡單評價一下,讓人工智能跟人打電話能夠做得很順暢、很無阻,聽起來不像是一個機器,最需要做到的東西是什么?以及在這個方面微軟和那家公司(指Google)做得更不一樣的地方是什么?
沈向洋:首先我覺得Google做得蠻好的。當時演示以后大家都非常激動,因為他做了一個全雙工(Full Duplex)。視頻演示出來之后,我們也去看了一下,認真學習了一下,其實是很認真地研究了一下。這個跟我們在一年多、兩年前跟小冰打電話不太一樣的地方是在這里:
第一,我們在中國做了以后,沒有想到把這件事情包裝一下,講的范圍更大一些。因為對整體技術的成熟度來說還比較早。我待會兒會講到里面真正的技術難點。
第二,他們選擇了一個場景,這個特定場景對于用戶來講,能讓他們一下子就明白技術是什么。
駱軼航:但人工智能通電話不僅僅是給餐廳打電話。
沈向洋:對,人工智能不僅是一個服務型的場景,它其實是一個專業(yè)領域。我們現(xiàn)在技術落地有兩個領域。小冰是一個大眾領域,她是一個聊天機器人,你什么都可以跟她聊。你打電話去餐館就是定餐,不會是跟餐館的人說我明天去哪里旅游之類的話題。所以相對來講比較容易一些,技術上的難點反而少一點。
如果要講到其他領域的事情,它就會講,你問這個問題我不知道,問的人其實可以理解這種回答。人跟小冰一起聊天的話,總希望小冰慢慢變得越來越聰明,什么都知道一些,但這需要時間。不過,我覺得這個特定場景是Google做得很好的地方,我們要不斷向他們學習,希望我們以后有更多更新的技術去做得更好。
既然大家這么有興趣,我就再講一下我們剛發(fā)布的“全雙工語音技術”,F(xiàn)ullDuplex。
我們不光做了中文的,日語也做了,未來會把它推廣到英語和其他語言。最重要的是,我們會把這個技術開放給三方開發(fā)者,大家——包括其他的開發(fā)者——都可以用我們的技術來開發(fā)他們的應用。
駱軼航:開發(fā)者開發(fā)后,會把它變成自己的專業(yè)領域的應用。
沈向洋:對,為什么大家覺得做“全雙工語音技術”很有道理呢?其實全雙工語音技術已經(jīng)應用到一些IoT的產(chǎn)品里,比如小米之家。
從演示的視頻可以看出,你有沒有連續(xù)對話的能力,用戶有直觀的感知。不然老是講“什么什么同學”,問一句;接著講“什么什么同學”,再問一句;它只能是一個玩具。不像我們兩個人講話,不需要反復提及人名。講幾句提一個“Harry”好像親切一點,但不能每句話提一次。在這些方面,大家逐漸在重視這個問題。如果我們把技術開放給第三方的話,對這樣的對話式人工智能的發(fā)展具有非常有正面的促進意義。
駱軼航:我理解在人工智能對話中,雙方的努力點不一樣。微軟更多是大眾領域,Google更多是先在一個專業(yè)領域。但是微軟正在努力把這個FullDuplex的技術開放給第三方,讓第三方基于大眾領域創(chuàng)造自己的專業(yè)領域。這樣能驗證人工智能在不同場景、和非常特定條件之下的對話能力。
沈向洋:我們也做專業(yè)領域,很努力地做專業(yè)領域。我們覺得有一些非常有價值的專業(yè)領域,比如客服。餐館訂餐當然也很有趣,但相對來說,客服的商業(yè)價值更加可圈可點。其實我們非常希望Google能很快做出他們的產(chǎn)品,我們可以真正地試一下。最近我不知道你有沒有看到有人挑戰(zhàn)說這個演示是假的。
駱軼航:對,結果第二天Alphabet(Google母公司)董事長出來講我們這個已經(jīng)通過圖靈測試了。
沈向洋:后來有一個媒體就挑戰(zhàn)說演示是假的,為什么是假的?你聽整個對話當中一點噪聲都沒有。而且記者很認真,說你不是在Mountain View嗎?他就在Mountain View打了二十幾家餐館的電話。結果發(fā)現(xiàn)電話接通后,餐館的人一定會說“Hello,XXXRestaurant,May I help you?”但整個演示里面都沒有。
那個記者很執(zhí)著,就問他們能不能告訴我是哪家餐館,我要驗證一下是不是真的有人給餐館打過這個電話。Google拒絕給出名字,記者就生氣了,說你是不是假的?Google不肯回應。
我覺得這都是小插曲。技術肯定會越來越進步,但是現(xiàn)在肯定還會有很多難度。
首先是語音方面,接下來是語言理解方面,這是一個長期的過程。但有一件事情是肯定的,就是質(zhì)量會越來越好——隨著數(shù)據(jù)越來越多,用戶越來越多,大家用得越來越多,毫無疑問質(zhì)量會越來越好。
三問:對人工智能來說,EQ(情商)比IQ(智商)重要
駱軼航:這很有意思,之前人們對于小冰的很多理解是娛樂性的:小冰跟我推測一下,我講的是哪一個人?小冰跟我聊聊天。小冰給我隨便打個電話。打一打電話,隨便聊幾句,給你祝賀個生日。大家覺得這個是娛樂性的,但是大眾領域要做的東西很多,大家更多是期望看到在具體場景之下的應用。
小冰是AI一個出口,尤其是中文的角度。它有中文自然語義處理、語義分析,還有翻譯都要用進來。所以小冰寫詩,是對我比較震撼和刺激的一件事情。因為過去我們認為創(chuàng)作是人面對人工智能最后一道心靈壁壘。
前不久我跟劉慈欣聊天,我們說這個壁壘沒有了。劉慈欣開導我說,你不要這么去想這個問題。你管它是怎么創(chuàng)造的,管它有沒有情感,創(chuàng)造出來比你厲害不就夠了。所以我非常想知道,我們?yōu)槭裁匆鲂”鶎懺娺@件事情,以及微軟內(nèi)部這件事情的看法,這件事情之后有哪些反思?
沈向洋:這是很好的話題,這個話題可以聊很久。做小冰聊天機器人的時候我很支持。但一開始我總覺得聊天機器人這件事情可有可無,結果產(chǎn)品團隊跟我說:其實聊天是剛需。
后來我做了一下研究,原來真是這樣。一個人一天內(nèi),聊天要聊幾千句,女生還要再多一點。中國互聯(lián)網(wǎng)還有相對特別的地方,就是網(wǎng)民中大概有三分之一,上網(wǎng)發(fā)表一個意見以后,從來沒有人回應。比如說一些到城里來打工的人群,就算有一個朋友圈,大家相互之間的隔膜也比較多。他們其是希望有一個可以相互理解、交流的過程。我同事說像你這樣的人,微信隨便發(fā)個東西,只有200個贊,就好像很不滿意。但是很多其他人不是這樣的情況,通常沒人理。所以后來我們做了聊天機器人。
其實小冰最最了不起的,是促使我們真正研究EQ這件事兒。我們今天整個大會議程里也專門提到了EQ(情商)。人工智能是在增強人類智能,當然有不同的方法定義智能,你可以講IQ(智商)和EQ。但EQ究竟是什么?它是有定義的,EQ包括你自己的理解和別人的理解。
我們覺得小冰最了不起的事情,就是在所有聊天機器人里面,對EQ這件事情是真正去建模、真正去研究、真正去實現(xiàn)的。再回頭講到,小冰有很多很多技能,像寫詩、唱歌,我們產(chǎn)品團隊的確有很多思路。
比如寫詩,在微軟亞洲研究院已經(jīng)有很多年的歷史了。很多年前,我們做過一個對聯(lián)系統(tǒng),現(xiàn)在可以上那個網(wǎng)站還可以看到,出個上聯(lián)它給你對個下聯(lián),還有橫批,對這個對聯(lián)不滿意還可以固定幾個字重新生成一下,做的還挺好。后來開始有人說,說不定可以寫詩,比如寫個七律什么的。而小冰寫詩,稍微有一點取巧了。因為創(chuàng)作的東西,最難的一件事情是創(chuàng)意,是Cold Start(冷啟動)。而寫一首詩需要的是感覺,所以當時他們就走了一個捷徑——說那這樣吧,感覺在圖里面,你上傳一張圖,我給你分析一下這個圖的大概樣子。
駱軼航:這就是人和機器理解事物方式的不同,機器要從視覺識別才可能有“靈感”。
沈向洋:對,從視覺識別開始的。我們有一個研究隊伍寫了一篇論文,講的就是怎樣從一張圖找出它的意境里的關鍵詞,再用這樣的一些詞串起來。寫的挺好,F(xiàn)在小冰寫詩越做越好,今天我們還跟中國青年總社一起合作做了一個工具,讓人和小冰聯(lián)合創(chuàng)作寫詩。我們希望在不遠的將來,選一批寫得很好的詩出來。我們相信以后人類和小冰可以共同創(chuàng)作,說不定可以創(chuàng)作出更好的內(nèi)容。
駱軼航:可能不只是詩了,人和AI一起創(chuàng)作關于AI的科幻小說。
沈向洋:也可以的。人其實最難的就是出個初稿,有了初稿以后,你就有了一些想法,然后這里改改那里改改,越寫越好。我自己也和小冰寫過一首詩,就改了一些字。
我們講好,所有IP都是用戶的,小冰不會占你的IP,你直接發(fā)表。你改一個字改兩個字好也好,這都是你的IP。所以大家都很高興,當時上了線一個星期還是一個月,就好像有幾百萬,我忘記那個數(shù)字了。那個詩歌數(shù)量的總數(shù),比中華人民共和國建國以來所有發(fā)表詩歌的總和還要多。
駱軼航:所以機器下起棋來比人可怕,這是Google證明的,因為人和機器理解圍棋的方式是不一樣的,現(xiàn)在看寫起詩來也是。
沈向洋:其實AlphaGo這個事情對亞洲人、對東亞人而言,不是觸動很大,而是打擊很大。我們小時候,小學進圍棋隊就很聰明了;中學進圍棋隊就說明你很牛了;你進了清華還能進圍棋隊那就不是一般人了。但在今天,這些都不算什么了,因為機器隨便就能把你干掉。我們小時候人家都說最了不起的、很聰明的,智能的,就是下圍棋了。
駱軼航:既有意志又聰明,甚至有對哲學和“形而上”的感悟,現(xiàn)在這些東西徹底被消滅了。
沈向洋:對,就徹底被消滅被殺害掉了。
駱軼航:所以對亞洲人打擊非常大。其實小冰,它也瓦解了人們另外的一部分,就是人們覺得我智能上不能跟機器相比,但是創(chuàng)作上可以——現(xiàn)在這件事看起來也沒有那么重要了。
沈向洋:沒有那么重要了。我覺得很多新生事物剛出現(xiàn)的時候,大家不是很清楚,不知道怎么理解。我小時候在鄉(xiāng)下長大,人家老講鄉(xiāng)下農(nóng)民的故事:以前剛裝喇叭的時候,喇叭里面播新聞,農(nóng)民總是跑喇叭后面看看人在哪兒。新生事物大家總是得慢慢接受,我們沒有什么選擇,我們是第一代跟人工智能共生存的一代,所以必須要找出方法和人工智能一起生存,甚至怎樣利用人工智能讓我們的生活更豐富。
四問:人類對人工智能的過度恐懼,來自對“AI服務于人類”的懷疑
駱軼航:所以接下來說另一個我們想去探討的話題。您講的農(nóng)民回到喇叭后面看那個事情,他是一種好奇,未必是一種恐懼。我過去覺得中國是一個非常“ProTechnology”(熱衷科技)的國度,尤其是互聯(lián)網(wǎng)給中國過去十年的改變太大了,美國人相對保守一點。但是去年我發(fā)現(xiàn)整個全球范圍之內(nèi),人民對人工智能恐懼心里普遍嚴重了。
而中國是對人工智能有過度的憂思。比如我正在跟媽媽聊關于裝修的事,怎么突然某個工具給我推了一條裝修廣告,它是不是開啟了我的語音麥克風推了一個東西?我們雖然知道不可能,但這種恐懼非常普遍。在美國,有OpenAI這個組織,他們在過去一年反復提醒人們關于人工智能的一些警惕,比爾·蓋茨也曾參與過他們的一些討論,也與扎克伯格有一些爭論。在中國,AlphaGo給大家的刺激挺大的,大家知道機器的“可怕”了,所以有過度恐懼在里面。我現(xiàn)在想了解的是,微軟包括您個人在這樣的一個過程中是什么樣的看法和角色?
沈向洋:非常好的問題,其實對人工智能的擔憂,我個人覺得有幾個不同的層次。
大概三年前,尼克·鮑爾森的文章就說,當AI出來,這個世界就要完蛋了。特別是他寫的很詳細什么叫Super Intelligence(超級智能),什么時候會超越人類。另外因為AI用了你很多數(shù)據(jù),你覺得很恐懼,比如甚至會影響到大選和你平常的生活,這是另外一個層次。
微軟研究人工智能的技術已經(jīng)很多很多年了。這些年我們開始做產(chǎn)品,做人工智能這些產(chǎn)品的時候,我們認識到,以后人工智能一定會進入到所有的產(chǎn)品里。所以我們非常認真的思考一些事情,比如AI是不是應該有倫理道德,我們?yōu)槭裁匆鯝I?倫理這件事情,最基本意思是說,不能為所欲為,要有約束。
微軟對人工智能的觀點是很清楚的,做人工智能的目標是幫助人類,方式就是要讓人工智能普及化。所以最重要的一點,是看大家是不是對這個事情足夠重視?微軟一年前成立了一個AI倫理委員會(AETHER),這個委員會把全公司的產(chǎn)品部門、業(yè)務部門,還有更重要的法務部門集合在一起,研究院的一個同事和法務部同事做聯(lián)合主席。
我們覺得這里有多方面的問題。第一,偏見的問題,人工智能是不是公正的;第二,透明性,為什么人工智能會是這樣一個情況;第三,可靠性,如果你利用AI導致了怎樣的結果,最后是誰來負責,是誰來做這個決定的?比如自動駕駛出事故了,往左邊會撞死一個老頭,往右邊會撞死一個小孩,那該往哪邊撞?或者往左邊撞的是一個人,往右邊是一頭豬,你會往哪邊撞?這些事情,今天還沒有法律約束。再比如自動駕駛突然出車禍了,警察來了,你說我都蒙掉了。警察很同情你,他可以理解,肯定所有的事情都是預先編程在里面的。但這個問題很嚴重,誰來負這樣的責任?
所以,有很多很多這樣的問題需要解決。我們剛起步,在這個行業(yè)中還需要大家認真對待、真正去研究這些問題。不光是高科技企業(yè),包括社會、包括政府、包括法律,都需要不斷的跟上。
五問:AI不是互聯(lián)網(wǎng)上的“風口”,而是nextto互聯(lián)網(wǎng)的下一代基礎設施
駱軼航:其實微軟的人工智能,包括我們談到的對話式人工智能、翻譯、神經(jīng)網(wǎng)絡、自然語義處理和分析,我們提到這些應用,還是在和人溝通一些層面上的應用。大家還沒有更多的往實際場景去做,比如自動駕駛,那么微軟對這些事情的想法是什么?
沈向洋:首先,微軟是一個“藍領階層”的公司,我們做的都是比較初始的工作。我們一直都覺得微軟是一個平臺公司,我們的使命是去予力全球每一人、每一組織,成就不凡。我們相信,能夠讓其他人做的好,就很好了。
說到自動駕駛,我們有很多技術應用在自動駕駛里面。我們幾乎跟所有的車廠都有合作,但是自己沒有去做一個自動駕駛,然后把整個汽車行業(yè)顛覆掉。微軟不是這樣的方式。
我們在智能云這方面有四大部分:第一,認知服務。我們有一批API,所有想要寫AI應用的開發(fā)者都可以用這個服務。第二,對話式人工智能。懂語言者得天下。這是人的交流,一定要對自然語言有理解。其實人的一生就是不斷在學語言。第三,開放的平臺和工具,讓你的開發(fā)更加方便。第四,基礎設施。特別是實時的人工智能基礎設施,讓開發(fā)者和企業(yè),能夠用微軟的云和AI進步得更快。
同時我們也對垂直行業(yè)很重視。比如,客服是一個巨大商機,不過現(xiàn)在沒有很好的產(chǎn)品和平臺。另外,我們覺得必須要認真對待和鉆研人工智能醫(yī)療。在這方面,我對中國的情況不太了解,但美國現(xiàn)在全國GDP的18.5%是用在醫(yī)療上的。
駱軼航:美國是相對來說比較高的比例。
沈向洋:非常高。我老是跟同事開玩笑說,一幫老美,身體沒有比英國人好。英國一年只有9%的GDP用于醫(yī)療這塊,美國用于醫(yī)療方面的經(jīng)費超過人家的一倍,也沒看到身體比人家好。所以我覺得,在這方面,AI會給我們帶來一些新的機會。
駱軼航:也就是說AI是相當于“互聯(lián)網(wǎng)”這樣的基礎設施,而不是互聯(lián)網(wǎng)之上的某一個“風口”?
沈向洋:對,不是這樣的。AI實際上是注入到所有的東西里去的。我最近經(jīng)常跟美國一些大企業(yè)的領導交流,我老是跟他們講:你一定要明白一件事情——AI到來的時候,你肯定會被顛覆掉的。那時,你只會有兩個選擇,要么被別人顛覆掉,要么你就自己顛覆自己。
你自己顛覆自己的話,需要有技術合作伙伴。那么微軟可能是一個很好的合作伙伴,我們可以幫助你,讓你自己能夠顛覆自己,走向一個新的自我。
六問:基礎研究在云和AI時代的微軟,比Windows時代有哪些不同?
駱軼航:其實2009年左右我就見過微軟總部研究院的一些演示,我們會覺得這個東西好好,這個東西好有意思,但是就是沒法用,離現(xiàn)實有點遠。那么產(chǎn)品在哪里?那時是Windows時代的微軟,前沿技術研究和現(xiàn)實產(chǎn)品的距離很遙遠,現(xiàn)在我們到了一個“云和AI時代”的微軟。而且您身處的這個位置,又是從全球研發(fā)、基礎研究,邁向到商業(yè)化、產(chǎn)品化的角色,F(xiàn)在,前沿的基礎研究和實際產(chǎn)品之間的距離,這個距離比過去大概有一種什么樣的拉近嗎?
沈向洋:這個問題非常非常好。這也是我自己不斷思考的問題。我自己比較幸運,可能我是很少幾個做過很多年非常深的科研——我博士以后進微軟大概做了11年自己的基礎研究——后來接下來11年在商業(yè)、產(chǎn)品也有經(jīng)歷的人。很好談不上了。我覺得很幸運有這樣一個經(jīng)歷,lifeisajourney,這樣一個很好的機會令到我兩邊都可以觀察到。很多年來,我在微軟研究院一直提倡一件事情,叫做Deployment-orientedResearch(基于實施的研究)。研究不是只是寫寫論文,而是在于你東西做出來了以后,應該把它建立出來,放出去。放出去最大的好處就是,你有了用戶,有了數(shù)據(jù),你可以看到新的問題,甚至可以看到原來做的是不是真的有道理。
如果你真正是一流的高手,有幸到微軟研究院做科研的話,有一件事情是重要的——你是不是真正想做了不起的事情,這件事對這個社會,對這個行業(yè),對這個專業(yè)會不會真正產(chǎn)生影響。公司里的小成功是必然的,問題就是在于你是不是追求一個大成功。
我舉一個例子,微軟在Azure上面做的一個我個人覺得非常激動人心的項目,叫做AzureSphere。它實際上是物聯(lián)網(wǎng)的一套整體解決方案,我們做了一個非常小的芯片。做嵌入式系統(tǒng)的時候,冰箱里會有這種很多很多這種小的東西,以前所有這種東西都不聯(lián)網(wǎng),所以很便宜。而我們做了一些改變。第一,我們把整個東西改進了,以后可以上網(wǎng),并且是嵌入的。第二,它是安全的,一旦東西聯(lián)網(wǎng)了以后,最大的問題就是安全。所以我們首先做了一個安全的芯片設計,然后在上面做安全的操作系統(tǒng),聯(lián)網(wǎng)到安全的云端服務。
這個就是接下來大的風口。我覺得這是我們看得很清楚的地方。手機慢慢變成一個夕陽產(chǎn)業(yè),手機整體的量已經(jīng)往下走了,不要講PC了。接下來大的東西在哪里?肯定是物聯(lián)網(wǎng),因為這些設備數(shù)目還在拼命漲,而且會越漲越多。這些可以連接網(wǎng)絡的設備,以后會給你帶來無限多的商機。現(xiàn)在已經(jīng)是90億數(shù)量的級別了,但是到現(xiàn)在為止,不到1%的設備是互聯(lián)的。這里面有一個非常大想象的空間。
一旦連起來,就有數(shù)據(jù)了,一旦有數(shù)據(jù)就可以做分析,一旦有數(shù)據(jù)就可以有智能,很多很多都可以連接在一起。我們做了四年的研究項目,一開始的時候,大家覺得這件事情不能做。
駱軼航:離當時的現(xiàn)實太遠。
沈向洋:我覺得很了不起的地方,就是到最后,還是有這樣的一批研究人員或者是工程師,想要做一些前人覺得做不了的事情。這個才是最最了不起的。
駱軼航:如果沒有當年這樣基礎研究技術投入的話,今天就不會迎來這樣的物聯(lián)網(wǎng)連接的市場。
沈向洋:對,需要有這樣的一個技術投入,而且你真的愿意去做。為什么我講Deployment-orientedResearch呢?不是我有一個方法、有一個算法就結束了,真正有用的東西實際上是需要經(jīng)過一個用戶檢驗的過程。
七問:為什么微軟不做TPU?
駱軼航:既然說到了芯片,看來微軟在芯片的領域,AI和物聯(lián)網(wǎng)芯片的領域有一個更早的接觸和積累。這個非常有意思,我們隨便聊聊,微軟為什么不做類似于TPU(張量處理器,tensorprocessingunit,Google為機器學習定制的專用芯片)這樣的事情?
沈向洋:也有做。其實每家公司芯片都是心中之痛,都是在學蘋果,基本上就是做行業(yè)集成。大家可能不知道,微軟一直有做芯片,我們做有做Xbox的,也做HoloLens的芯片。其實,剛才提到TPU和數(shù)據(jù)中心。我們走的一條技術路線跟TPU不太一樣,我們走的是FPGA(Field-ProgrammableGateArray,現(xiàn)場可編程邏輯門陣列)的道路。今天我在會場也給大家放了一段Real-timeAI(實時人工智能)的視頻。FPGA現(xiàn)在是非常適合在AI方面執(zhí)行的。
AI分為兩個部分,一個是建模,你會用很多GPU去運行。另一個是AI的執(zhí)行,算法弄好了、調(diào)好了,你要跑起來,而且要跑得很快。我們現(xiàn)在FPGA整個這套體系做得非常好,已經(jīng)全面鋪開。兩個星期前我們發(fā)布了FPGA,你可以把它想象成可編程的硬件。我們也非常關注GPU,因為一旦你的工作流很清楚了,你把這些東西帶到芯片層面,這是很正常的事情。
駱軼航:是,但是這個過程也是需要錢的。到現(xiàn)在谷歌TPU那邊,還完全是自主的,完全沒有跟大廠合作生產(chǎn),自己做。
沈向洋:他們做了一個TPUTools。其實它技術上不是那么簡單,還是有一些挑戰(zhàn)。比如說BatchSize(計算批量),什么樣的BatchSize才可以用到它這個性能做得更好。我們寫了一篇FPGA的文章,跟像TPU這一類的東西做過比較。相對來講,微軟是有一些技術上的優(yōu)勢的。但是做技術人都有自己不同的看法,真正的贏家是能夠把這些東西做到產(chǎn)品、做到服務,真正有用戶,真正有用戶能夠從中得益。這才是最了不起的事情。