有些人總喜歡夸口說:“我從來不會忘記別人的長相。”在人工智能研究突飛猛進的今天,還要這么夸口就有點奇怪了。事實上,現(xiàn)在有些電腦能記住2.6億張臉。上周,谷歌公司的三位研究人員發(fā)表了一篇有關(guān)全新人工智能系統(tǒng)的研究論文。這一系統(tǒng)名為FaceNet,谷歌號稱它是迄今為止最精確的人臉識別技術(shù)。
姿勢和光線一直都是人臉識別的大難題。該圖顯示了兩張臉在不同組合中所體現(xiàn)出來的“差距”(差距為0.0意味著兩張臉完全一樣)。
面對一個名為“人面數(shù)據(jù)庫”(Labeled Faces in the Wild)的常用人臉識別數(shù)據(jù)庫時,F(xiàn)aceNet識別的準(zhǔn)確率近乎百分之百。這個數(shù)據(jù)庫容納了網(wǎng)上搜集的一萬三千多張人臉照片。而在面對一個含有2.6億張人臉照片的龐大數(shù)據(jù)庫時,這個系統(tǒng)的準(zhǔn)確率也超過86%。
研究人員聲稱,面對“人面數(shù)據(jù)庫”時,他們主要測試該系統(tǒng)的“確認(rèn)能力”。就本質(zhì)而言,他們衡量的是這套算法在判斷兩張照片是否同屬一人時到底有多準(zhǔn)確。
去年12月,一個中國研究團隊也聲稱,對這套數(shù)據(jù)庫的識別準(zhǔn)確率超過99%。去年,F(xiàn)acebook公司的研究人員發(fā)表論文稱,他們也能做到超過97%的準(zhǔn)確率。根據(jù)這篇論文援引的一些研究人員的說法,人類對該數(shù)據(jù)庫的識別準(zhǔn)確率僅有97.5%。
不過,谷歌研究人員采用的方法絕不只是確認(rèn)兩張臉是否一樣這么簡單。這套系統(tǒng)還能將人名和臉匹配——經(jīng)典的人臉識別技術(shù),甚至能把看起來最像或最不像的臉歸集在一起。
目前這還僅僅是研究而已,但它預(yù)示著,在不遠(yuǎn)的將來,我們經(jīng)常在網(wǎng)上視頻或大片里看到的那種能懲治犯罪、加強監(jiān)控的電腦將更加觸手可及。比起在交友應(yīng)用Tinder上劃來劃去,它可能會使網(wǎng)上交友更加簡單(也更停留于表面)。
很喜歡1998年左右時的布拉德·皮特這個數(shù)據(jù)庫里有500張看起來很像他的臉。
一開始,我們會看到谷歌的FaceNet及Facebook的DeepFace系統(tǒng)在各自的網(wǎng)絡(luò)平臺上運行。它們會讓用戶更加方便地(或者說更加自動化地)給照片貼上標(biāo)簽,找到要找的人,因為這些算法知道照片中的這個人是誰,即使這些照片并沒有姓名標(biāo)記。此外,這類系統(tǒng)還能讓網(wǎng)絡(luò)公司更加方便地基于照片人物的身份,來分析它們的用戶社交網(wǎng)絡(luò),評判全球流行趨勢及名人的受歡迎程度。
盡管谷歌和Facebook在人臉識別技術(shù)上最近才取得這類進步,但與之類似的電腦系統(tǒng)早就無處不在。它們都含有一種名為“深度學(xué)習(xí)”的人工智能技術(shù)。事實證明,這種技術(shù)能夠極其有效地完成識別物體(按照某些標(biāo)準(zhǔn)來看,機器在這方面已經(jīng)比人類要強了)、識別語音及理解書面文字等機器辨別任務(wù)。
除了谷歌和Facebook外,微軟、百度和雅虎也在“深度學(xué)習(xí)”研究上投入重金。這種算法已經(jīng)應(yīng)用在一些我們常用的功能上了,比如智能手機語音控制、Skype實時翻譯、短信預(yù)測輸入法及先進的圖像搜索等(如果你已經(jīng)將一些圖片上傳至Google+賬戶里,你就可以試試用它們來搜索特定目標(biāo))。Spotify和Netflix公司正在研究如何利用深度學(xué)習(xí)技術(shù)更智能地推薦視頻。貝寶公司則將其用于打擊欺詐。
還有幾家科技創(chuàng)業(yè)公司正將深度學(xué)習(xí)技術(shù)用于實時分析醫(yī)療圖像,并提供諸如文本分析、計算機視覺及語音識別這類云計算服務(wù)項目。近年來,Twitter、Pinterest,、Dropbox、雅虎和谷歌等公司都收購了一些專攻深度學(xué)習(xí)技術(shù)的創(chuàng)業(yè)公司。IBM公司剛剛收購了一家位于丹佛,名為AlchemyAPI的初創(chuàng)企業(yè),用以提升其Watson超級計算機的智能水平,并支持其全新的Bluemix云平臺(該平臺的理念是:開發(fā)者可以方便地將移動和網(wǎng)絡(luò)應(yīng)用與云服務(wù)連接起來,借以打造一些智能應(yīng)用,而無需再鉆研人工智能背后復(fù)雜的計算機科學(xué))。
不止于此。隨著消費級機器人、無人駕駛汽車及智能家居逐漸成為現(xiàn)實,深度學(xué)習(xí)技術(shù)也將如影隨形,為我們這些新玩具提供耳目和一些頭腦功能。美國國防部高級研究計劃局(DARPA)也在探索如何借助深度學(xué)習(xí)技術(shù)來實時理解龐大的情報信息流。
我猜想,DARPA正在關(guān)注谷歌的FaceNet系統(tǒng),并為之激動。