Nuance:車載信息平臺(tái)邁入語音時(shí)代
2010/12/27
2010年12月8日,Nuance通訊公司全球車載業(yè)務(wù)部副總裁 Arnd Weil、大中華區(qū)總經(jīng)理鄭裕慶和上海研發(fā)中心總監(jiān)張亞昕博士就Nuance車載業(yè)務(wù)和自然語音技術(shù)等方面接受了蓋世汽車網(wǎng)的專訪。
從左至右,Nuance通訊公司上海研發(fā)中心總監(jiān)張亞昕、全球車載業(yè)務(wù)部副總裁Arnd Weil和大中華區(qū)總經(jīng)理鄭裕慶。
蓋世汽車網(wǎng):請(qǐng)介紹一下Nuance車載業(yè)務(wù)及在中國的發(fā)展情況。
Arnd Weil:簡(jiǎn)單來講,Nuance提供移動(dòng)免提的解決方案,用于打電話、發(fā)信息、讀信息,通過語音操作來播放音樂、選歌和進(jìn)行導(dǎo)航。在導(dǎo)航方面,比如用戶報(bào)出一個(gè)地點(diǎn),我們的產(chǎn)品就可以進(jìn)行路線搜索。
車載業(yè)務(wù)是屬于Nuance移動(dòng)的汽車業(yè)務(wù)部旗下的一個(gè)業(yè)務(wù)。汽車業(yè)務(wù)部的產(chǎn)品和服務(wù)范圍,不單有車內(nèi)應(yīng)用方案,還有重點(diǎn)開發(fā)互聯(lián)服務(wù)和車載解決方案,將用戶介面設(shè)計(jì)結(jié)合連接服務(wù)器端車內(nèi)應(yīng)用和互聯(lián)服務(wù)。目前前裝和后裝市場(chǎng)已經(jīng)分別有超過三千五百萬的汽車已經(jīng)在用Nuance 語音技術(shù)。
Nuance一直跟國際的廠家有合作關(guān)系,通過Continental和Bosch等公司進(jìn)入中國市場(chǎng)。我們的汽車業(yè)務(wù)在過去10年合作的公司包括福特、戴姆勒、寶馬、奧迪、通用、豐田等公司。我們同福特公司從十年前開始在語音技術(shù)方面有合作,現(xiàn)在是其語音技術(shù)直接供應(yīng)商和用戶界面設(shè)計(jì)的合作伙伴。
Nuance對(duì)中國市場(chǎng)很重視,去年開始也跟中國本土汽車廠家合作。我們?cè)谥袊袌?chǎng)建立了專業(yè)的團(tuán)隊(duì)研發(fā)新產(chǎn)品,像上海的語音技術(shù)開發(fā)中心,除了有本土工程師參與開發(fā)過程,全球的專業(yè)團(tuán)隊(duì)也在開發(fā)更適合中國市場(chǎng)的語音解決方案。
蓋世汽車網(wǎng):Nuance公司有什么競(jìng)爭(zhēng)的技術(shù)上的優(yōu)勢(shì)?
Arnd Weil:Nuance提供非常好的語音用戶界面和車用人機(jī)界面,支持 30多種語言,無論是車內(nèi)應(yīng)用連接終端、服務(wù)器終端或聯(lián)網(wǎng)服務(wù),我們都可以支持。Nuance還可以提供多模式輸入技術(shù),包括手寫和應(yīng)用于觸摸屏的智能文本輸入。
在語音方面,Nuance 語音技術(shù)已經(jīng)通過很多國家的認(rèn)證和測(cè)試,證明Nuance的識(shí)別技術(shù)準(zhǔn)確率相當(dāng)高。Nuance能為不同國家的語言提供非常好的支持。這么多年累計(jì)下來的經(jīng)驗(yàn)和成功的案例就是很好的證明。這是其他的競(jìng)爭(zhēng)對(duì)手無法超越的。
蓋世汽車網(wǎng):Nuance語音識(shí)別技術(shù)對(duì)帶口音的普通話的辨識(shí)度有多少?
張亞昕:Nuance從一開始做中文語音識(shí)別的時(shí)候,就意識(shí)到中國面積廣大,各種口音繁雜。但是要去做每一個(gè)地方方言的語音識(shí)別是不太現(xiàn)實(shí)的,再加上中國政府一直在鼓勵(lì)全國推行普通話,所以我們還是爭(zhēng)取把普通話識(shí)別技術(shù)做到更好。所以我們從采集數(shù)據(jù)階段就開始著手,從全中國采集聲音樣本,南到廣州、福建,北到黑龍江甚至西北。因此我們的語音識(shí)別對(duì)各種帶口音的普通話的識(shí)別率是很高的。
曾經(jīng)有客戶將我們的引擎拿去和另外一家公司做對(duì)比測(cè)試,在口音測(cè)試方面,我們的競(jìng)爭(zhēng)對(duì)手在不同人的測(cè)試上,識(shí)別率差異非常大,大部分人可能普通話還比較標(biāo)準(zhǔn),個(gè)別的口音不標(biāo)準(zhǔn),曲線波動(dòng)很明顯。但是Nuance的測(cè)試曲線變化非常小,個(gè)人之間的差異非常小,說明我們?cè)诳谝舻母采w上面做的非常好。
蓋世汽車網(wǎng):請(qǐng)談?wù)務(wù)Z音識(shí)別技術(shù)研發(fā)難點(diǎn)和未來發(fā)展趨勢(shì)。
張亞昕:我想難點(diǎn)和趨勢(shì)要一起說,因?yàn)殡y點(diǎn)是我們將來要攻克的,也是我們以后要發(fā)展的方向。傳統(tǒng)的語音識(shí)別都會(huì)限定命令詞,比如命令里定義“打開空調(diào)”,你就只能說“打開空調(diào)”,多說、少說一個(gè)字,或者換種方式說,它都無法識(shí)別。這實(shí)際上是對(duì)人的限制,用戶必須將每個(gè)命令詞記的非常準(zhǔn)確。如果命令詞將來定義越來越多,普通用戶很難嚴(yán)格記準(zhǔn)每一個(gè)命令詞。
所以解決方案里面,我們通過語音技術(shù)讓用戶能夠很輕松的進(jìn)行自然且直觀的交流與互動(dòng)。我們只定義任務(wù),不定義命令詞,只要你把任務(wù)用你自己的表達(dá)方式表達(dá)出來就能完成。這個(gè)叫自然語言理解技術(shù),已應(yīng)用在北美市場(chǎng)銷售的福特汽車上,配合新一代MyFord Touch技術(shù)的SYNC系統(tǒng)中實(shí)現(xiàn)。
鄭裕慶:其實(shí)自然語言處理的難度我們已經(jīng)攻克。我們有引擎設(shè)在呼叫中心,可以實(shí)現(xiàn)隨便你說什么,都能夠做出相應(yīng)的處理。但是用于車載和手機(jī)的引擎是比較小的,一旦壓縮,識(shí)別率會(huì)受到限制。因此怎樣進(jìn)一步提升車載系統(tǒng)的語音識(shí)別性能,是我們目前工作的目標(biāo)之一。
蓋世汽車網(wǎng):自然語音技術(shù)的價(jià)格定位在哪個(gè)級(jí)別?
鄭裕慶:針對(duì)高端市場(chǎng),我們可以提供所謂“ one shot”的解決方案,就是一句話輸入,系統(tǒng)會(huì)分析你要做什么。這個(gè)成本比較高。如果只是打電話或者控制音樂,價(jià)格就會(huì)便宜很多。所以我們是用不同的功能來定位市場(chǎng)價(jià)格。
蓋世汽車網(wǎng):有不同的市場(chǎng)定位。
鄭裕慶:對(duì)。比如通過語音控制手機(jī)撥號(hào)在低端車?yán)锩嬉部梢詫?shí)現(xiàn),價(jià)格會(huì)相對(duì)較低。但是有一些汽車包含控制整個(gè)系統(tǒng),包括空調(diào),音樂,導(dǎo)航,再加上云端的服務(wù),價(jià)格就比較高,當(dāng)然這些只在高端車?yán)锩娉霈F(xiàn)。因?yàn)槠鋵?shí)你要做這么多東西,除了我們的軟件技術(shù)價(jià)格會(huì)高以外,其他的東西好像內(nèi)存、CPU,整個(gè)硬件配置也會(huì)相應(yīng)提高。
蓋世汽車網(wǎng):就Nuance目前的業(yè)務(wù)來看,語音、文字智能輸入和圖象解決方案,三大塊業(yè)務(wù)的比重各占多少?
鄭裕慶: 語音的業(yè)務(wù)是最核心的,占到85%。你可以看到我們覆蓋到手機(jī)、汽車,我們現(xiàn)在可以做到的就是電子書、電腦。接下來我們要做IPTV,交互式網(wǎng)絡(luò)電視。還有在呼叫中心和醫(yī)療,都做得很大。醫(yī)療方面是用語音來輸入那些病人的病例并存檔。因此語音是Nuance最主要的一個(gè)業(yè)務(wù)。
蓋世汽車網(wǎng):Nuance在中國推廣車載語音系統(tǒng)產(chǎn)品時(shí)采取了怎樣的市場(chǎng)策略?
鄭裕慶:中國用戶追求物美價(jià)廉,因此我們?cè)谒麄兲峁┑臈l件下調(diào)整策略,在中國實(shí)施比較靈活的價(jià)格策略,根據(jù)市場(chǎng)需求去定價(jià)。在支持服務(wù)方面我們會(huì)選擇一些比較好的廠家,投入我們的人力、時(shí)間同他們一起去按照他們的需求開發(fā)相應(yīng)產(chǎn)品,以保證產(chǎn)品出來以后有高質(zhì)量和非常高的客戶滿意度。
蓋世汽車網(wǎng):Nuance最近在中國進(jìn)行了用戶對(duì)車載語音應(yīng)用的調(diào)研,可否分享其中一些調(diào)查結(jié)果。
張亞昕:我們最近在中國做了一個(gè)汽車GPS用戶調(diào)研,幾百位中國的汽車駕駛者參與了我們的調(diào)研,主要圍繞車內(nèi)是否裝有語音系統(tǒng)和使用頻率等問題。接近30%的車內(nèi)有語音控制功能,它超出了我的預(yù)想。實(shí)際上很多人都對(duì)語音控制、語音撥號(hào)感興趣。比如空調(diào)升高兩度,收音機(jī)調(diào)到97.7Hz,或者是打電話給張三,這種命令他們非常感興趣。
蓋世汽車網(wǎng):這個(gè)應(yīng)該在您意料之中的吧?
張亞昕:這個(gè)是在我意料之中的,但是有一件事情在我意料之外。43.5%接受調(diào)研的人會(huì)一邊開車一邊發(fā)短信,這是非常危險(xiǎn)的事。其中的15.5%是一邊行車一邊發(fā)短信,還有28%的人表示在等紅燈的時(shí)候發(fā)短信,但是你可以想象如果變成綠燈,他們會(huì)繼續(xù)把沒有發(fā)完,很不安全。
鄭裕慶:所以很多時(shí)間我在等紅綠燈,前面的車等到了綠燈還沒有走,很有可能是在發(fā)短信或者打電話。
張亞昕:國外很多國家已經(jīng)頒布法令,嚴(yán)格要求開車期間不許打手機(jī),不允許發(fā)短信,但是在中國有這么多人邊開車,邊發(fā)短信,是不可想象的事情。
還有一個(gè)問題出乎我意料之外的。車載語音識(shí)別因?yàn)檐噧?nèi)環(huán)境特殊,噪音比較大,識(shí)別率會(huì)偏低,效果不如安靜環(huán)境下,但依然有82.3%的人認(rèn)為它是合格的。
鄭裕慶:現(xiàn)時(shí)應(yīng)用車載語音識(shí)技術(shù)基本上都是高端車。因?yàn)槲乙仓绹鴥?nèi)有些廠家在低端車上配置語音識(shí)別,效果很不好。其實(shí)是沒有達(dá)到這個(gè)標(biāo)準(zhǔn),F(xiàn)在一些用戶同我們合作,就是因?yàn)橐郧坝杏靡恍﹪鴥?nèi)的技術(shù),然后發(fā)覺真的不行了,再找我們重新做。其實(shí)門檻是比較高的,過不了這個(gè)門檻無法滿足用戶最終需求。比如福特在美國,打廣告是賣它的語音控制系統(tǒng)。通過改變用戶體驗(yàn),坐上來覺得安全的同時(shí)還能更加有賣點(diǎn)。我相信今后國內(nèi)很多車企也會(huì)朝這個(gè)方向走。
蓋世汽車網(wǎng)
相關(guān)閱讀: