首頁>>廠商>>語音識別與合成>>Nuance

Nuance:車載信息平臺邁入語音時代

2010/12/27

  2010年12月8日,Nuance通訊公司全球車載業(yè)務(wù)部副總裁 Arnd Weil、大中華區(qū)總經(jīng)理鄭裕慶和上海研發(fā)中心總監(jiān)張亞昕博士就Nuance車載業(yè)務(wù)和自然語音技術(shù)等方面接受了蓋世汽車網(wǎng)的專訪。


  從左至右,Nuance通訊公司上海研發(fā)中心總監(jiān)張亞昕、全球車載業(yè)務(wù)部副總裁Arnd Weil和大中華區(qū)總經(jīng)理鄭裕慶。

  蓋世汽車網(wǎng):請介紹一下Nuance車載業(yè)務(wù)及在中國的發(fā)展情況。

  Arnd Weil:簡單來講,Nuance提供移動免提的解決方案,用于打電話、發(fā)信息、讀信息,通過語音操作來播放音樂、選歌和進(jìn)行導(dǎo)航。在導(dǎo)航方面,比如用戶報出一個地點,我們的產(chǎn)品就可以進(jìn)行路線搜索。

  車載業(yè)務(wù)是屬于Nuance移動的汽車業(yè)務(wù)部旗下的一個業(yè)務(wù)。汽車業(yè)務(wù)部的產(chǎn)品和服務(wù)范圍,不單有車內(nèi)應(yīng)用方案,還有重點開發(fā)互聯(lián)服務(wù)和車載解決方案,將用戶介面設(shè)計結(jié)合連接服務(wù)器端車內(nèi)應(yīng)用和互聯(lián)服務(wù)。目前前裝和后裝市場已經(jīng)分別有超過三千五百萬的汽車已經(jīng)在用Nuance 語音技術(shù)。

  Nuance一直跟國際的廠家有合作關(guān)系,通過Continental和Bosch等公司進(jìn)入中國市場。我們的汽車業(yè)務(wù)在過去10年合作的公司包括福特、戴姆勒、寶馬、奧迪、通用、豐田等公司。我們同福特公司從十年前開始在語音技術(shù)方面有合作,現(xiàn)在是其語音技術(shù)直接供應(yīng)商和用戶界面設(shè)計的合作伙伴。

  Nuance對中國市場很重視,去年開始也跟中國本土汽車廠家合作。我們在中國市場建立了專業(yè)的團(tuán)隊研發(fā)新產(chǎn)品,像上海的語音技術(shù)開發(fā)中心,除了有本土工程師參與開發(fā)過程,全球的專業(yè)團(tuán)隊也在開發(fā)更適合中國市場的語音解決方案。

  蓋世汽車網(wǎng):Nuance公司有什么競爭的技術(shù)上的優(yōu)勢?

  Arnd Weil:Nuance提供非常好的語音用戶界面和車用人機界面,支持 30多種語言,無論是車內(nèi)應(yīng)用連接終端、服務(wù)器終端或聯(lián)網(wǎng)服務(wù),我們都可以支持。Nuance還可以提供多模式輸入技術(shù),包括手寫和應(yīng)用于觸摸屏的智能文本輸入。

  在語音方面,Nuance 語音技術(shù)已經(jīng)通過很多國家的認(rèn)證和測試,證明Nuance的識別技術(shù)準(zhǔn)確率相當(dāng)高。Nuance能為不同國家的語言提供非常好的支持。這么多年累計下來的經(jīng)驗和成功的案例就是很好的證明。這是其他的競爭對手無法超越的。

  蓋世汽車網(wǎng):Nuance語音識別技術(shù)對帶口音的普通話的辨識度有多少?

  張亞昕:Nuance從一開始做中文語音識別的時候,就意識到中國面積廣大,各種口音繁雜。但是要去做每一個地方方言的語音識別是不太現(xiàn)實的,再加上中國政府一直在鼓勵全國推行普通話,所以我們還是爭取把普通話識別技術(shù)做到更好。所以我們從采集數(shù)據(jù)階段就開始著手,從全中國采集聲音樣本,南到廣州、福建,北到黑龍江甚至西北。因此我們的語音識別對各種帶口音的普通話的識別率是很高的。

  曾經(jīng)有客戶將我們的引擎拿去和另外一家公司做對比測試,在口音測試方面,我們的競爭對手在不同人的測試上,識別率差異非常大,大部分人可能普通話還比較標(biāo)準(zhǔn),個別的口音不標(biāo)準(zhǔn),曲線波動很明顯。但是Nuance的測試曲線變化非常小,個人之間的差異非常小,說明我們在口音的覆蓋上面做的非常好。

  蓋世汽車網(wǎng):請談?wù)務(wù)Z音識別技術(shù)研發(fā)難點和未來發(fā)展趨勢。

  張亞昕:我想難點和趨勢要一起說,因為難點是我們將來要攻克的,也是我們以后要發(fā)展的方向。傳統(tǒng)的語音識別都會限定命令詞,比如命令里定義“打開空調(diào)”,你就只能說“打開空調(diào)”,多說、少說一個字,或者換種方式說,它都無法識別。這實際上是對人的限制,用戶必須將每個命令詞記的非常準(zhǔn)確。如果命令詞將來定義越來越多,普通用戶很難嚴(yán)格記準(zhǔn)每一個命令詞。

  所以解決方案里面,我們通過語音技術(shù)讓用戶能夠很輕松的進(jìn)行自然且直觀的交流與互動。我們只定義任務(wù),不定義命令詞,只要你把任務(wù)用你自己的表達(dá)方式表達(dá)出來就能完成。這個叫自然語言理解技術(shù),已應(yīng)用在北美市場銷售的福特汽車上,配合新一代MyFord Touch技術(shù)的SYNC系統(tǒng)中實現(xiàn)。

  鄭裕慶:其實自然語言處理的難度我們已經(jīng)攻克。我們有引擎設(shè)在呼叫中心,可以實現(xiàn)隨便你說什么,都能夠做出相應(yīng)的處理。但是用于車載和手機的引擎是比較小的,一旦壓縮,識別率會受到限制。因此怎樣進(jìn)一步提升車載系統(tǒng)的語音識別性能,是我們目前工作的目標(biāo)之一。

  蓋世汽車網(wǎng):自然語音技術(shù)的價格定位在哪個級別?

  鄭裕慶:針對高端市場,我們可以提供所謂“ one shot”的解決方案,就是一句話輸入,系統(tǒng)會分析你要做什么。這個成本比較高。如果只是打電話或者控制音樂,價格就會便宜很多。所以我們是用不同的功能來定位市場價格。

  蓋世汽車網(wǎng):有不同的市場定位。

  鄭裕慶:對。比如通過語音控制手機撥號在低端車?yán)锩嬉部梢詫崿F(xiàn),價格會相對較低。但是有一些汽車包含控制整個系統(tǒng),包括空調(diào),音樂,導(dǎo)航,再加上云端的服務(wù),價格就比較高,當(dāng)然這些只在高端車?yán)锩娉霈F(xiàn)。因為其實你要做這么多東西,除了我們的軟件技術(shù)價格會高以外,其他的東西好像內(nèi)存、CPU,整個硬件配置也會相應(yīng)提高。

  蓋世汽車網(wǎng):就Nuance目前的業(yè)務(wù)來看,語音、文字智能輸入和圖象解決方案,三大塊業(yè)務(wù)的比重各占多少?

  鄭裕慶: 語音的業(yè)務(wù)是最核心的,占到85%。你可以看到我們覆蓋到手機、汽車,我們現(xiàn)在可以做到的就是電子書、電腦。接下來我們要做IPTV,交互式網(wǎng)絡(luò)電視。還有在呼叫中心和醫(yī)療,都做得很大。醫(yī)療方面是用語音來輸入那些病人的病例并存檔。因此語音是Nuance最主要的一個業(yè)務(wù)。

  蓋世汽車網(wǎng):Nuance在中國推廣車載語音系統(tǒng)產(chǎn)品時采取了怎樣的市場策略?

  鄭裕慶:中國用戶追求物美價廉,因此我們在他們提供的條件下調(diào)整策略,在中國實施比較靈活的價格策略,根據(jù)市場需求去定價。在支持服務(wù)方面我們會選擇一些比較好的廠家,投入我們的人力、時間同他們一起去按照他們的需求開發(fā)相應(yīng)產(chǎn)品,以保證產(chǎn)品出來以后有高質(zhì)量和非常高的客戶滿意度。

  蓋世汽車網(wǎng):Nuance最近在中國進(jìn)行了用戶對車載語音應(yīng)用的調(diào)研,可否分享其中一些調(diào)查結(jié)果。

  張亞昕:我們最近在中國做了一個汽車GPS用戶調(diào)研,幾百位中國的汽車駕駛者參與了我們的調(diào)研,主要圍繞車內(nèi)是否裝有語音系統(tǒng)和使用頻率等問題。接近30%的車內(nèi)有語音控制功能,它超出了我的預(yù)想。實際上很多人都對語音控制、語音撥號感興趣。比如空調(diào)升高兩度,收音機調(diào)到97.7Hz,或者是打電話給張三,這種命令他們非常感興趣。

  蓋世汽車網(wǎng):這個應(yīng)該在您意料之中的吧?

  張亞昕:這個是在我意料之中的,但是有一件事情在我意料之外。43.5%接受調(diào)研的人會一邊開車一邊發(fā)短信,這是非常危險的事。其中的15.5%是一邊行車一邊發(fā)短信,還有28%的人表示在等紅燈的時候發(fā)短信,但是你可以想象如果變成綠燈,他們會繼續(xù)把沒有發(fā)完,很不安全。

  鄭裕慶:所以很多時間我在等紅綠燈,前面的車等到了綠燈還沒有走,很有可能是在發(fā)短信或者打電話。

  張亞昕:國外很多國家已經(jīng)頒布法令,嚴(yán)格要求開車期間不許打手機,不允許發(fā)短信,但是在中國有這么多人邊開車,邊發(fā)短信,是不可想象的事情。

  還有一個問題出乎我意料之外的。車載語音識別因為車內(nèi)環(huán)境特殊,噪音比較大,識別率會偏低,效果不如安靜環(huán)境下,但依然有82.3%的人認(rèn)為它是合格的。

  鄭裕慶:現(xiàn)時應(yīng)用車載語音識技術(shù)基本上都是高端車。因為我也知道國內(nèi)有些廠家在低端車上配置語音識別,效果很不好。其實是沒有達(dá)到這個標(biāo)準(zhǔn)。現(xiàn)在一些用戶同我們合作,就是因為以前有用一些國內(nèi)的技術(shù),然后發(fā)覺真的不行了,再找我們重新做。其實門檻是比較高的,過不了這個門檻無法滿足用戶最終需求。比如福特在美國,打廣告是賣它的語音控制系統(tǒng)。通過改變用戶體驗,坐上來覺得安全的同時還能更加有賣點。我相信今后國內(nèi)很多車企也會朝這個方向走。
共 2 頁:1 2 

蓋世汽車網(wǎng)



相關(guān)閱讀:
Nuance楊文弘專訪:滑行輸入法將成主流 2010-12-22
Nuance新推“龍游戲語音包” 語音識別操作游戲 2010-12-10
Nuance進(jìn)軍中國語音識別市場 2010-10-25
NUANCE T9 Trace中文滑行輸入發(fā)布 2010-10-14
Nuance:語音識別技術(shù)引領(lǐng)呼叫中心全新客戶體驗 2010-09-30

熱點專題:  語音合成TTS 語音識別ASR