欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

您當(dāng)前的位置是:  首頁 > 新聞 > 國內(nèi) >
 首頁 > 新聞 > 國內(nèi) >

語音技術(shù)的未來——對話交互?

2014-04-23 09:57:37   作者:   來源:AI剪刀手   評論:0  點擊:


  自蘋果iPhone 4S內(nèi)置語音助手Siri以來,語音識別技術(shù)近年來經(jīng)歷了前所未有的繁榮。穿戴式設(shè)備、智能家居和車載設(shè)備的興起,更是將語音識別技推到應(yīng)用的臺前。語言的創(chuàng)造原本就是人類歷史的一個拐點,而當(dāng)將語言與科技結(jié)合時,所謂的人機交互的革命史又翻開了新篇章。

  《Her》的啟示:所謂的語音助手只是用來耳提面命的嗎?

  像在國內(nèi),目前除了手機內(nèi)自帶的語音助手,不少第三方語音助手應(yīng)用也如雨后春筍般涌現(xiàn),譬如訊飛語點、百度語音助手、搜狗語音助手、蟲洞語音助手、智能360語音助手等。這項曾沉寂幾十年的雞肋技術(shù)之所以如今風(fēng)頭正旺,原因無非是搭上了移動互聯(lián)網(wǎng)的順風(fēng)車,從而滿足了語音技術(shù)普及更廣泛所需的兩件事情:更好、更方便的應(yīng)用和主要使用語音的生活場景。

  初次使用Siri或訊飛旗下的“靈犀語音助手”的用戶都會對這種新的人機交互方式感到很新奇,不僅可以通過語音搜索內(nèi)容、查詢信息,還可以聊天解悶、講故事、唱歌,真可謂是得力的小助手。

  正好,最近筆者重溫了一部講述人機交互的電影《Her》,這幾乎構(gòu)建了人機語音交互的一個非常理想化的境界。片中女主角Samantha(人工智能系統(tǒng))沒有身體,只能發(fā)出聲音。表面上看,這只是一個具有升級版的的語音助手。實際上,與目前的語音助手們相比,其又具備了以下幾個進(jìn)階點:

  1、對話交互。雖然你可能反駁說,如今的語音助手也能進(jìn)行對話,但只要一體驗就會知道那只不過是“講話”而已,用戶一聽就能感覺到機械感太強、體驗太差。實際上,目前參與對話的人與機之間的地位懸殊太大,很多語音助手是作為人類任務(wù)助手、被調(diào)戲助手的角色出現(xiàn)的。而對話的話,則講究的是兩個主體之間關(guān)系的平等性。

  2、十分流暢的情感流露。倘若未來的人工智能真的以“與人類無異”為目標(biāo),那么最應(yīng)該在乎的是它能否讀懂人類的情感并給用戶人類般的反饋。影片中,Samantha和男一號Theodor交談、戀愛,最終她還憑借其飛快的進(jìn)化速度與數(shù)千個人進(jìn)行交談,同時與幾百人維持著浪漫的戀愛關(guān)系,將Theodore無情地拋在身后。機器的不斷進(jìn)化注入了Samantha超乎尋常的情感靈魂。

  而在現(xiàn)實生活中,機器的冷冰冰已司空見慣。人類飽含感情、追求自我,每個人的獨特性構(gòu)成了他自己的整個世界;而機器的本質(zhì)則是通過無限復(fù)制、并行計算來追求效率最大化。這個不可調(diào)和的矛盾或許只能寄托未來,未來出現(xiàn)像Samantha一樣的高級人工智能。

  無縫的語音交互境界有多難?

  從技術(shù)上講,要達(dá)到未來無縫的語音交互境界還相當(dāng)難:

  雖然近年來語音技術(shù)門檻逐漸降低,但不可否認(rèn)的是,語音技術(shù)在人機交互中的尷尬局面。比如語音識別的正確率,其在實際應(yīng)用中依然不夠“聽話”。比如,人說話時單個字母或詞、字的語音特性受上下文的影響,以致改變了重音、音調(diào)、音量和發(fā)音速度等;比如環(huán)境噪聲和干擾對語音識別有嚴(yán)重影響,致使識別率低。

  有業(yè)內(nèi)人士也對此坦承,語音識別的遺憾是再努力做也做不到百分之百。這無疑是整體語音技術(shù)應(yīng)用中的一個最大痛點。

  這里存在一對天然的矛盾:人的本性是傾向于用非精確的信息,因為其傳輸量更大,更方便。然而,機器卻需要用精確信息來處理才能讓識別和自然語言處理更準(zhǔn)確。所以說,一家相對專業(yè)公司的語音識別可以做到90%就已經(jīng)不錯了。

  從目前人機交互的形態(tài)而言,顯然,用戶還是更偏向于直接能產(chǎn)生觸感的手動式人機交互。蘋果近日在iOS7.1的升級當(dāng)中也對語音助手Siri作出的升級亦直接在觸控方面做出了調(diào)整,在Siri界面當(dāng)中,具體實現(xiàn)方式類似于目前在微信當(dāng)中的語音交流,說話前按住Home鍵不放,在說話完畢后放下Home鍵即可手動控制輸入識別。蘋果未單獨再對聲音方面做出調(diào)整,畢竟比起語音,手動更具有實體存在感,而且目前在語音交互上不斷推進(jìn)會大幅增加用戶認(rèn)知負(fù)擔(dān)。

  未來,要想達(dá)到無縫語音交互的技術(shù)奇點,必須,不是更多地發(fā)展真正的人工智能,更多地模仿人類的智能而非模仿人類的行為或聲音。或許,將類似一大堆的神經(jīng)元細(xì)胞注入機器是人工智能的爆發(fā)點。這不是天方夜譚,真的有人已經(jīng)在做這件事了。據(jù)悉,牛津大學(xué)人類未來研究所近日發(fā)布了一份報告,便闡述了向機器上傳意識的技術(shù)要求。“唯有生物才具有意識”的觀念正將被擊得粉碎!

【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題