欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

語音技術(shù)的未來——對話交互？

2014-04-23 09:57:37 作者：來源：AI剪刀手評論：0 　點擊：

　　自蘋果iPhone 4S內(nèi)置語音助手Siri以來，語音識別技術(shù)近年來經(jīng)歷了前所未有的繁榮。穿戴式設(shè)備、智能家居和車載設(shè)備的興起，更是將語音識別技推到應(yīng)用的臺前。語言的創(chuàng)造原本就是人類歷史的一個拐點，而當(dāng)將語言與科技結(jié)合時，所謂的人機交互的革命史又翻開了新篇章。

　　《Her》的啟示：所謂的語音助手只是用來耳提面命的嗎？

　　像在國內(nèi)，目前除了手機內(nèi)自帶的語音助手，不少第三方語音助手應(yīng)用也如雨后春筍般涌現(xiàn)，譬如訊飛語點、百度語音助手、搜狗語音助手、蟲洞語音助手、智能360語音助手等。這項曾沉寂幾十年的雞肋技術(shù)之所以如今風(fēng)頭正旺，原因無非是搭上了移動互聯(lián)網(wǎng)的順風(fēng)車，從而滿足了語音技術(shù)普及更廣泛所需的兩件事情：更好、更方便的應(yīng)用和主要使用語音的生活場景。

　　初次使用Siri或訊飛旗下的“靈犀語音助手”的用戶都會對這種新的人機交互方式感到很新奇，不僅可以通過語音搜索內(nèi)容、查詢信息，還可以聊天解悶、講故事、唱歌，真可謂是得力的小助手。

　　正好，最近筆者重溫了一部講述人機交互的電影《Her》，這幾乎構(gòu)建了人機語音交互的一個非常理想化的境界。片中女主角Samantha（人工智能系統(tǒng)）沒有身體，只能發(fā)出聲音。表面上看，這只是一個具有升級版的的語音助手。實際上，與目前的語音助手們相比，其又具備了以下幾個進(jìn)階點：

　　1、對話交互。雖然你可能反駁說，如今的語音助手也能進(jìn)行對話，但只要一體驗就會知道那只不過是“講話”而已，用戶一聽就能感覺到機械感太強、體驗太差。實際上，目前參與對話的人與機之間的地位懸殊太大，很多語音助手是作為人類任務(wù)助手、被調(diào)戲助手的角色出現(xiàn)的。而對話的話，則講究的是兩個主體之間關(guān)系的平等性。

　　2、十分流暢的情感流露。倘若未來的人工智能真的以“與人類無異”為目標(biāo)，那么最應(yīng)該在乎的是它能否讀懂人類的情感并給用戶人類般的反饋。影片中，Samantha和男一號Theodor交談、戀愛，最終她還憑借其飛快的進(jìn)化速度與數(shù)千個人進(jìn)行交談，同時與幾百人維持著浪漫的戀愛關(guān)系，將Theodore無情地拋在身后。機器的不斷進(jìn)化注入了Samantha超乎尋常的情感靈魂。

　　而在現(xiàn)實生活中，機器的冷冰冰已司空見慣。人類飽含感情、追求自我，每個人的獨特性構(gòu)成了他自己的整個世界；而機器的本質(zhì)則是通過無限復(fù)制、并行計算來追求效率最大化。這個不可調(diào)和的矛盾或許只能寄托未來，未來出現(xiàn)像Samantha一樣的高級人工智能。

　　無縫的語音交互境界有多難？

　　從技術(shù)上講，要達(dá)到未來無縫的語音交互境界還相當(dāng)難：

　　雖然近年來語音技術(shù)門檻逐漸降低，但不可否認(rèn)的是，語音技術(shù)在人機交互中的尷尬局面。比如語音識別的正確率，其在實際應(yīng)用中依然不夠“聽話”。比如，人說話時單個字母或詞、字的語音特性受上下文的影響，以致改變了重音、音調(diào)、音量和發(fā)音速度等；比如環(huán)境噪聲和干擾對語音識別有嚴(yán)重影響，致使識別率低。

　　有業(yè)內(nèi)人士也對此坦承，語音識別的遺憾是再努力做也做不到百分之百。這無疑是整體語音技術(shù)應(yīng)用中的一個最大痛點。

　　這里存在一對天然的矛盾：人的本性是傾向于用非精確的信息，因為其傳輸量更大，更方便。然而，機器卻需要用精確信息來處理才能讓識別和自然語言處理更準(zhǔn)確。所以說，一家相對專業(yè)公司的語音識別可以做到90%就已經(jīng)不錯了。

　　從目前人機交互的形態(tài)而言，顯然，用戶還是更偏向于直接能產(chǎn)生觸感的手動式人機交互。蘋果近日在iOS7.1的升級當(dāng)中也對語音助手Siri作出的升級亦直接在觸控方面做出了調(diào)整，在Siri界面當(dāng)中，具體實現(xiàn)方式類似于目前在微信當(dāng)中的語音交流，說話前按住Home鍵不放，在說話完畢后放下Home鍵即可手動控制輸入識別。蘋果未單獨再對聲音方面做出調(diào)整，畢竟比起語音，手動更具有實體存在感，而且目前在語音交互上不斷推進(jìn)會大幅增加用戶認(rèn)知負(fù)擔(dān)。

　　未來，要想達(dá)到無縫語音交互的技術(shù)奇點，必須，不是更多地發(fā)展真正的人工智能，更多地模仿人類的智能而非模仿人類的行為或聲音。或許，將類似一大堆的神經(jīng)元細(xì)胞注入機器是人工智能的爆發(fā)點。這不是天方夜譚，真的有人已經(jīng)在做這件事了。據(jù)悉，牛津大學(xué)人類未來研究所近日發(fā)布了一份報告，便闡述了向機器上傳意識的技術(shù)要求。“唯有生物才具有意識”的觀念正將被擊得粉碎！

【免責(zé)聲明】本文僅代表作者本人觀點，與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立，不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔(dān)全部責(zé)任。