你可能不知道Nuance是做什么的,但你一定知道iPhone 4S帶來的一項革 命性的人機(jī)交互產(chǎn)品——“Siri”。事實上,為“Siri”提供語音數(shù)據(jù)庫支持的正是Nuance,此前曾用過一段時間Vlingo的平臺。
作為全球領(lǐng)先的語音和語言解決方案提供商,Nuance因為是T9輸入法的擁有者被業(yè)界所熟知,目前全球90%以上的手機(jī)都采用T9輸入法,這個輸入法原本是一家名為“Tegic Communications”所開發(fā),后來被Nuance買了下來。Nuance同時也在近期收購了滑動輸入法的公司Swype。
關(guān)鍵的數(shù)據(jù)收集
近日Nuance在深圳舉行了“2012年Nuance移動論壇”,這家以往“隱身”于各大國際公司背后的企業(yè)出現(xiàn)在了國內(nèi),吸引了深圳諸多廠商的興趣。Nuance在會上展示了三段不同的Video,這三段Video其中就有大家所熟知的Siri的廣告片,另外一段則是Nuance自己的“聲龍”系列產(chǎn)品,最后一段則是將語音技術(shù)結(jié)合手勢控制應(yīng)用到智能電視的場景。通過短片,Nuance不但展示了目前語音技術(shù)發(fā)展的最新動態(tài)和趨勢,同時也展示了諸多國際企業(yè)所重視的關(guān)鍵點——用戶體驗,這將是在未來企業(yè)競爭中取勝的殺手锏。而Nuance的目標(biāo),也就是幫助這些企業(yè)提高用戶體驗。
語音技術(shù)的出現(xiàn)顯著改變了人機(jī)互動的方式,但如果你對Siri有一定的研究,你會發(fā)現(xiàn)其實語音識別技術(shù)(ASR)只占到其中的20%,真正重要的則是語義識別技術(shù)。語義識別能幫助用戶更準(zhǔn)確地能否搜索出想要的結(jié)果。這種技術(shù)基于Statistic Language model(語言模型統(tǒng)計),需要大量的數(shù)據(jù)來完善搜索的結(jié)果。同時對于自然語言的理解(NLU技術(shù)),也需要數(shù)據(jù)庫的數(shù)據(jù),來進(jìn)行語法的收集!霸蕉嗟臄(shù)據(jù),越容易幫助我們配對用戶所需要的內(nèi)容,了解用戶的意圖,將意圖翻譯成行動,效果最終也是取決于本身數(shù)據(jù)的質(zhì)量!盢uance大中華區(qū)總經(jīng)理鄭裕慶表示。
Nuance的Dragon Go憑借在美國的Apple App Store和Android Market兩大移動應(yīng)用平臺巨大的下載量而被用戶熟知。Dragon Go將Nuance的聲龍語音識別和自然語言理解技術(shù)與人工智能技術(shù)相結(jié)合,從而顯著簡化了搜索移動內(nèi)容的體驗。因此,用戶僅憑借語音便能得到他們想要的內(nèi)容,并能將更多的時間用于瀏覽而非查找在線內(nèi)容。也就是說,Dragon Go能聽懂用戶說的話并能理解用戶意圖。用戶僅需說出一個簡單的短語,他們所喜愛和最相關(guān)的內(nèi)容提供商便會顯示在眼前,用戶能輕松地獲取餐廳評述、購買電影票、觀看流媒體電影和電視節(jié)目、在線購物、查找方向、聽喜愛的音樂、還可以通過Expedia預(yù)定酒店。
如何提供更好的用戶體驗?
據(jù)了解,目前Nuance主要采用兩種商業(yè)模式。一種是直接向OEM廠商和制造廠商提供語音技術(shù)和解決方案,同時收取授權(quán)費(fèi)用。這里不僅包括了手機(jī)、TV、PC等消費(fèi)電子產(chǎn)品,還包括大量的企業(yè)級行業(yè)應(yīng)用。另一方面,Nuance提供了自主研發(fā)的產(chǎn)品“如Dragon go”,供智能手機(jī)用戶方便的在AppStore以及Android Market免費(fèi)下載。通過向消費(fèi)者提供免費(fèi)下載使用,Nuance得以收集龐大的語音數(shù)據(jù),從而對語音引擎進(jìn)行訓(xùn)練,從而提高引擎的準(zhǔn)確度。
“我們的DragonDictation(聲龍聽寫)和DragonSearch(聲龍搜索)這兩個應(yīng)用,是比蘋果的Siri出來還要早,就是因為我們要先做前期投入,只有收集了這個數(shù)據(jù)庫,才能提高產(chǎn)品體驗。”鄭裕慶表示,數(shù)據(jù)庫的豐富程度會直接影響到語音和語義的辨識度。所以Nuance早在1999年就已經(jīng)開始在PC上應(yīng)用語音引擎,到目前為止已經(jīng)更新了11個版本,可以說是一個非常成熟的引擎。
“除了成熟的引擎,我們最大的優(yōu)勢,其實是如何能把用戶體驗做得更好的經(jīng)驗。事實上語音識別率已經(jīng)不是目前最重要的因素了,因為大家可能差距都不太大。但是用戶體驗就不一樣了。”鄭裕慶表示,包括如何解決噪音問題、如何優(yōu)化語音控制界面,這些提高用戶體驗的東西,Nuance有著豐富的經(jīng)驗以及完善的解決方案。
據(jù)統(tǒng)計,2011年通過云端訪問Nuance的語音數(shù)據(jù)庫便有20億的訪問量。而據(jù)鄭裕慶介紹,Nuance目前已經(jīng)跟不少國際知名的品牌進(jìn)行了合作。其中就包括三星智能電視,以及BMW汽車。而在今天年年初,Nuance也發(fā)布了跟Intel的合作,未來Nuance將為Urtrabook提供語音服務(wù),包括開啟軟件、寫email、更新社群網(wǎng)站、控制音樂播放等操作都可通過語音完成。
電子工程專輯
相關(guān)熱詞搜索:
相關(guān)閱讀:
分享到:
收藏