最近自動(dòng)駕駛新聞?lì)l頻,如沃爾沃Uber聯(lián)手自動(dòng)駕駛,福特、Uber爭相發(fā)布無人駕駛商用時(shí)間線,comma。ai開源,tesla首例自動(dòng)駕駛致死車禍......由此我們也能看到自動(dòng)駕駛的熱度,看起來像未來商務(wù),但我們是否清楚這份技術(shù)離我們到底有多遠(yuǎn)?
InfoQ有幸采訪到圖森互聯(lián)CTO,聯(lián)合創(chuàng)始人侯曉迪。
侯曉迪,2003年進(jìn)入上海交大,并于大三發(fā)表了高引用論文;加州理工計(jì)算與神經(jīng)系統(tǒng)博士,計(jì)算機(jī)視覺和認(rèn)知科學(xué)領(lǐng)域?qū)<。?chuàng)立了基于頻域的視覺注意機(jī)制理論。是近10年來在視覺注意機(jī)制最有影響力的研究。是計(jì)算機(jī)視覺領(lǐng)域全球華人博士中學(xué)術(shù)文章被引用最多的作者,學(xué)術(shù)論文Saliency detection: A spectral residual approach(發(fā)表于CVPR)、Image signature: Highlighting sparse salient regions(發(fā)表于IEEE transactions on pattern analysis and machine intelligence )在學(xué)術(shù)領(lǐng)域具有重要影響。
InfoQ:在加州理工讀完博士后,是什么原因誘使您選擇創(chuàng)業(yè)呢?
侯曉迪:對我而言,創(chuàng)業(yè)是早在讀PhD之初就已經(jīng)決定了的。我希望能夠用更先進(jìn)的生產(chǎn)關(guān)系,試著沖破玻璃天花板,解決一些學(xué)術(shù)圈本身解決不了的問題。
在外人看來,Caltech是個(gè)標(biāo)準(zhǔn)的faculty的搖籃。但其實(shí),沐浴在加州的資本陽光下,在校內(nèi)跨領(lǐng)域跨學(xué)科合作浪潮的鼓動(dòng)下,我校畢業(yè)生的創(chuàng)業(yè)比例卻高得嚇人。比如我所在的Computation & Neural Systems系,上下三屆20位同學(xué)中就有4個(gè)人選擇畢業(yè)后直接創(chuàng)業(yè)。
InfoQ:請問有l(wèi)idar和無lidar優(yōu)缺點(diǎn)是什么?他們的可靠性差別有多大 ?圖森是如何選擇的?
侯曉迪:信息量非負(fù),多加任何傳感器,肯定不會(huì)幫倒忙。哪怕該信息已經(jīng)可以通過其他渠道獲得,加入后也可以起到交叉校驗(yàn)、降低噪音等功能。
通過發(fā)射激光,LiDAR可以很準(zhǔn)確地測出光朝著某個(gè)方向前進(jìn),走多遠(yuǎn)會(huì)碰到障礙物。這個(gè)信息雖然很有用,但也不過是自動(dòng)駕駛千里長征的第一步。光靠分析點(diǎn)的距離,我們并不能直接讀出一坨點(diǎn)云對應(yīng)的是什么物體,物體如何運(yùn)動(dòng);更無法猜出汽車牌照、車道線標(biāo)記、交通標(biāo)志內(nèi)容這些無法反映在3D點(diǎn)云上的信息。而且,一旦遇到下雨下雪或者重度霧霾這種會(huì)干擾激光的場景,LiDAR都會(huì)罷工。
LiDAR的好處是,可以一步跨越3D測距這個(gè)非常難的問題,從一個(gè)比較容易的起點(diǎn)開始做自動(dòng)駕駛。
我司沒有用LiDAR,主要的考慮是成本。今天32線LiDAR的市價(jià)是8萬美元,在三年后,LiDAR的成本會(huì)不會(huì)是自動(dòng)駕駛普及的最大攔路虎?這個(gè)問題現(xiàn)在當(dāng)然沒人知道,圖森選擇的道路是,寧可從比較難的起點(diǎn)多花些功夫,做我們擅長做的事(不借助LiDAR,直接基于機(jī)器視覺研發(fā)算法),也不要讓我們的商業(yè)化之路受制于我們無法控制的事情。
InfoQ:最近tesla出現(xiàn)的識(shí)別失敗導(dǎo)致的車禍?zhǔn)鹿士梢员苊鈫?或者誤識(shí)別的概率多大,以tesla最近的車禍場景為例?針對輔助駕駛/無人駕駛有哪些算法上的改進(jìn)?(是否有paper或者專利?)
侯曉迪:首先,Mobileye的EyeQ3本身只是一個(gè)輔助駕駛系統(tǒng)。但是市場接受TESLA的概念的時(shí)候,是作為自動(dòng)駕駛來炒作的。這相當(dāng)于TESLA提前消費(fèi)了大眾對自動(dòng)駕駛這項(xiàng)技術(shù)的信任。這是很糟糕的事情。
其次,小概率事件不意味著它絕對不會(huì)發(fā)生,所以哪怕是一百年后,我相信自動(dòng)駕駛的車禍?zhǔn)鹿室膊粫?huì)100%完全避免。所以我在這里只談?wù)劕F(xiàn)行系統(tǒng)的問題。
當(dāng)前的模式識(shí)別學(xué)術(shù)界(以及衍生自學(xué)術(shù)界的工業(yè)界)過度地以“正確率”作為單一的優(yōu)化目標(biāo)。一方面大家都知道,算法正確率越高,進(jìn)一步攀升的難度也就越大;另一方面,卻很少有人關(guān)注“如果識(shí)別錯(cuò)了怎么辦”這一問題。通用的做法是錯(cuò)一次就扣一分,不管你是沒看到一輛近在眼前的大卡車,還是把路旁的兔子識(shí)別成了狗。
在圖森,我們一直非常強(qiáng)調(diào)的一項(xiàng)技術(shù)積累是self-consciousness of AI——即,我們的算法不但需要進(jìn)行各種識(shí)別,還需要對“自己是否識(shí)別對了”進(jìn)行預(yù)估。從而進(jìn)一步提升系統(tǒng)可靠性。
我們申請了一些專利,也有paper發(fā)表。
InfoQ:您對最近開源的comma。ai的有何看法?
侯曉迪:comma。ai是典型的深度學(xué)習(xí)福音派。這種思路一般稱作end-to-end learning,認(rèn)為只要把大量輸入(攝像頭拍攝畫面)輸出(油門角度、方向盤力度)數(shù)據(jù)扔給深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,就能教會(huì)機(jī)器如何駕駛。所有的算法的問題,最終都可以轉(zhuǎn)化為訓(xùn)練數(shù)據(jù)的問題,并乘著大數(shù)據(jù)的東風(fēng)迎刃而解。
這個(gè)想法聽起來很棒。但實(shí)際操作起來卻隱患重重。當(dāng)系統(tǒng)碰到訓(xùn)練集里沒有的突發(fā)情況時(shí),誰也無法保證會(huì)發(fā)生什么。其實(shí)end-to-end的問題并不是第一天才發(fā)現(xiàn),業(yè)界很多人都嘗試過,并匯報(bào)了類似結(jié)果。比如今年GTC 16上,NVidia也介紹了他家的end-to-end driving system,一個(gè)最大的特點(diǎn)是,如果一切在預(yù)料中,汽車可以很神奇地保持行進(jìn)路線;但只要稍微偏離,錯(cuò)誤變會(huì)積累,偏差越來越大。換言之,系統(tǒng)不具備把自己從未知的意料之外的狀態(tài)中修正回來的能力。
相比來說,我司并不反對deep learning,但是我們堅(jiān)持認(rèn)為不能簡單粗暴地把deep learning等價(jià)于machine learning,因?yàn)檫@種“未知的意料之外”是無論積累多少訓(xùn)練數(shù)據(jù)都還是會(huì)存在的。接著我剛才講的self-consciousness of AI,我們需要讓算法發(fā)現(xiàn)自己的錯(cuò)誤,并將自我糾錯(cuò)以先驗(yàn)的形式加入到系統(tǒng)中來。想做到這一步,還時(shí)需要回過頭來借助許多傳統(tǒng)的,非deep的machine learning方法。
另外,comma。ai已經(jīng)公布的代碼和數(shù)據(jù)都很業(yè)余,充其量是研究生課程《自動(dòng)駕駛》的期末課程作業(yè),跟工業(yè)級(jí)算法系統(tǒng)完全沒有可比性(可能也正因此,comma。ai才舍得將其開源吧)。
InfoQ:對于智能駕駛,您覺得是應(yīng)該以改進(jìn)算法為主還是以積累駕駛數(shù)據(jù)訓(xùn)練優(yōu)化為主?對于在中國,普及實(shí)現(xiàn)自動(dòng)駕駛主要難點(diǎn)有哪些?是否存在“中國特色”?
侯曉迪:改進(jìn)算法和積累駕駛數(shù)據(jù)訓(xùn)練優(yōu)化是一對相輔相成的過程,缺一不可。我認(rèn)為一個(gè)健康的商業(yè)模式一定會(huì)同時(shí)促進(jìn)這兩者。
在中國做自動(dòng)駕駛,一個(gè)難點(diǎn)在于很多公開的學(xué)術(shù)圈數(shù)據(jù)集都是國外采集的(德國最多)。另一個(gè)難點(diǎn)是由于政策原因?qū)е聹y繪數(shù)據(jù)的不完整。這兩點(diǎn)會(huì)對沒人手也沒錢的學(xué)術(shù)工作者和超早期創(chuàng)業(yè)團(tuán)隊(duì)增加一些麻煩。我也確實(shí)見過有幾家國內(nèi)公司,為了給自己強(qiáng)行造壁壘,每次在談到Mobileye的時(shí)候,都拿中國馬路上常見的超載大貨車說事兒。但說實(shí)話,只要Mobileye想把有中國特色的大貨車納入到他們的平臺(tái)里,從采數(shù)據(jù)到訓(xùn)練/遷移模型,分分鐘就能做好,根本不會(huì)有什么戰(zhàn)略壁壘。
算法的遷移和泛化相比整套系統(tǒng),只是非常小的一部分工作量。更何況到了產(chǎn)品層,各家肯定都是自己在準(zhǔn)備數(shù)據(jù)。所以自動(dòng)駕駛各家比拼到最后,還是得硬碰硬。