在之前的文章中我們談到Nuance在人工智能方面具有四大核心技術(shù),即智能交互技術(shù),個(gè)性化,情境化及知識(shí)。本文將就這四大核心技術(shù)進(jìn)行更為具體的介紹。
智能交互
智能交互需要運(yùn)用語音、自然語言理解和對(duì)話技術(shù)以支持高質(zhì)量以及類人的協(xié)作式對(duì)話。這其中包括:
深度自然語言理解。想必大家對(duì)自然語言理解技術(shù)都有一定的了解,F(xiàn)在大部分的自然語言理解技術(shù)能夠?qū)崿F(xiàn)的是從一句話中提取一個(gè)指令。但如果一句話中包含了多個(gè)主題,甚至語義發(fā)生了轉(zhuǎn)折,現(xiàn)在的自然語言理解技術(shù)還不是能夠很好的理解這樣的指令。
例如下面這句指令“我想去一家意大利餐廳,之后再看一個(gè)法國(guó)電影。”這一句話中至少包含了兩個(gè)事件,“意大利餐廳吃飯”以及“看法國(guó)電影”,這不僅需要技術(shù)對(duì)兩個(gè)事件進(jìn)行關(guān)鍵信息搜索,還需要對(duì)兩個(gè)事件進(jìn)行先后順序的排列,這就超出了一般自然語言理解技術(shù)的范疇,需要運(yùn)用深度自然語言理解進(jìn)行處理。
自然語言生成,F(xiàn)在的語音交互系統(tǒng)大部分是經(jīng)過提前設(shè)計(jì)的,需要遵循一個(gè)固定的流程,當(dāng)對(duì)話到達(dá)某一個(gè)固定的階段,系統(tǒng)的反饋一定是類似的,有的時(shí)候甚至是一成不變的。這樣的交互并不能夠提供和人一樣交流的體驗(yàn)。而自然語言生成能夠結(jié)合用戶的個(gè)性化信息以及情境化信息做出反饋,而每次的反饋也是不一樣的。
例如我們發(fā)出指令“導(dǎo)航到附近的洗車中心”,現(xiàn)在我們能夠預(yù)料的系統(tǒng)反饋基本是會(huì)為我們提供一個(gè)列表,讓我們選擇去哪一個(gè)洗車中心。而擁有了人工智能之后,系統(tǒng)會(huì)結(jié)合分析更多的信息,給出“明天有降雨,您確定要洗車嗎?”這樣更加貼心,類人化的回饋。
個(gè)性化和情境化
個(gè)性化指的是運(yùn)用機(jī)器學(xué)習(xí)的用戶模式提供了高度針對(duì)性的預(yù)測(cè)和建議。
情境化指的是汽車助手可以根據(jù)當(dāng)前駕駛員和汽車的環(huán)境對(duì)自己的行為作出調(diào)整。二者相結(jié)合能夠?yàn)橛脩籼峁└淤N心的使用體驗(yàn)。
當(dāng)用戶發(fā)出一個(gè)語音指令,指令通過語音識(shí)別和自然語言理解之后,這一指令并沒有被直接送往內(nèi)容庫和知識(shí)庫,去尋找相關(guān)的答案或者觸發(fā)相關(guān)的操作,在此之前系統(tǒng)會(huì)再綜合集成用戶的個(gè)人偏好。例如用戶在搜索停車場(chǎng)時(shí),系統(tǒng)就會(huì)考慮用戶是比較關(guān)注價(jià)格,還是比較關(guān)注距離,以及天氣,燃油剩余,地理位置的情境化的信息。之后再給出一個(gè)優(yōu)化的搜索結(jié)果。
知識(shí)
知識(shí)是指系統(tǒng)在原始數(shù)據(jù)和內(nèi)容變得相關(guān)時(shí)提供給駕駛員。
例如在上圖“在Texas廣場(chǎng)附近找一個(gè)停車場(chǎng)”的任務(wù)中:
知識(shí)負(fù)責(zé)從傳感器、本地?cái)?shù)據(jù)庫、云和其他來源的有價(jià)值的情境化信息的融合。
個(gè)性化和情境化負(fù)責(zé)高度針對(duì)性的例如“更加便宜”“距離更近”等個(gè)性化和情景化的推薦。
智能交互能夠讓駕駛員很自然表達(dá)自己的意圖,通過自然語言生成將建議反饋給駕駛員,駕駛員還可以進(jìn)一步選擇改進(jìn)建議,最終駕駛員確認(rèn)并觸發(fā)系統(tǒng)后續(xù)行為。
通過智能交互,分析用戶個(gè)性化以及情境化信息,經(jīng)過推理引擎,最終結(jié)合知識(shí)庫,Nuance為用戶提供了協(xié)助式的對(duì)話管理。它是基于任務(wù)的,具有協(xié)助功能,旨在幫助用戶簡(jiǎn)化交互過程,幫助用戶更快更有效的找到他們想要的,更符合他們意圖的內(nèi)容或完成相應(yīng)的操作。這樣,在駕駛的過程中,盡量減輕他們的手,眼,大腦思維產(chǎn)生的額外負(fù)擔(dān),更加方便快捷的完成任務(wù)。