語音識別技術是實現(xiàn)人機對話的一項重大突破,在國外近年來發(fā)展得十分迅速,其應用也逐步得到了推廣。語音識別系統(tǒng)利用計算機技術和網(wǎng)絡技術優(yōu)勢,采用人機對話方式,人們只要像平常一樣對著話筒說出所需服務項目,即可輕松獲取自動系統(tǒng)提供的信息和服務。
說起語音識別技術,大家比較熟悉的是蘋果語音助手Siri、谷歌公司的Googlenow,以及百度語音搜索等個人終端應用產(chǎn)品,但這些公司只能說是語音識別技術領域的新貴,Nuance公司才是語音識別技術的始祖。Naunce公司曾經(jīng)是語音識別領域的老大,全球超過80%的語音識別系統(tǒng)都應用過Nuance識別引擎技術,其語音產(chǎn)品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業(yè),就連蘋果Siri、三星語音助手S-Voice剛開始都是應用他們的語音識別引擎技術。目前,每天仍有許多人通過撥打基于Nuance公司語音識別、語言理解和聲紋鑒別技術的電話,進行旅行產(chǎn)品預訂、股票交易,或與互聯(lián)網(wǎng)系統(tǒng)進行交互等。美國航空、聯(lián)邦快遞等公司的呼叫中心也采用了Naunce公司的語音識別技術。
但是,隨著技術的發(fā)展,Naunce公司在專利和算法方面的優(yōu)勢越來越不明顯。語音識別是機器智能的重要技術基礎,但一款用戶體驗較好的語音識別系統(tǒng),在很大程度上依靠數(shù)據(jù)和經(jīng)驗,特別是神經(jīng)網(wǎng)絡等機器學習技術的發(fā)展使得數(shù)據(jù)和經(jīng)驗方面的積累更為重要。因此,自進入21世紀以來,蘋果、谷歌、三星等IT巨頭越發(fā)重視人工智能領域的發(fā)展,Naunce公司在語音識別技術方面的領先優(yōu)勢逐步縮小。谷歌等公司不僅收購了在語音識別技術領域有領先優(yōu)勢的中小公司,在技術研發(fā)上投入了巨額資金,而且花費重金從Naunce公司挖走了大量技術人才,其中包括在2004年挖走Nuance聯(lián)合創(chuàng)始人邁克·科恩,讓他出任谷歌公司的語音技術總監(jiān)。蘋果Siri也不是蘋果公司自己研發(fā)的技術,而是2010年收購的Siri Inc。公司的產(chǎn)品。2011年,蘋果公司便將該技術融入iPhone 4S并推出了Siri語音助理應用程序。其在此后的多個版本中逐步升級優(yōu)化,利用超過2.45億個短語的識別輔助理解上下文,以增強語境識別能力。
當然,語音識別技術領域不能不提的是軟件巨頭微軟公司。目前,微軟公司有兩款機器智能的終端產(chǎn)品,分別是微軟小娜Cortana和微軟小冰。Cortana是微軟推出的第一款個人應用輔助智能程序,是微軟公司在機器學習和人工智能領域的首次嘗試。它可以記錄用戶的日常使用行為和使用習慣,利用云計算、搜索引擎和非結構化數(shù)據(jù)分析,讀取和學習文本文件、電子郵件、圖片、視頻等數(shù)據(jù),理解用戶的語義和語境,從而更好地實現(xiàn)人機交互。微軟小冰是由微軟Bing搜索中國團隊開發(fā)的一款跨平臺人工智能聊天機器人,用戶可在新浪微博、微信、米聊等平臺上與其進行智能對話。此外,微軟小冰還兼具群提醒、百科、天氣、星座、笑話、交通指南、餐飲點評等實用技能。