首頁>>廠商>>語音識別與合成>>科大訊飛

訊飛語音引領(lǐng)車載導(dǎo)航新世代

2009/06/09

  語音技術(shù)與車載導(dǎo)航設(shè)備的結(jié)合是大勢所趨,既是用戶實(shí)際與迫切的需求,又是導(dǎo)航產(chǎn)品的必然發(fā)展方向,市場空間極為廣闊。在不遠(yuǎn)的將來,語音車載導(dǎo)航技術(shù)以及整車語音技術(shù)的應(yīng)用水平,將成為衡量高端車型的一個(gè)重要標(biāo)準(zhǔn)。未來,語音技術(shù)在汽車上的應(yīng)用將更為普遍,成為汽車的一項(xiàng)基本配置和功能?拼笥嶏w作為全球領(lǐng)先的智能語音技術(shù)提供商,以從語音合成到語音識別全面領(lǐng)先的核心技術(shù)為車載導(dǎo)航提供“能聽會說”的完整的、交互式語音解決方案,正攜手廣大汽車與車載設(shè)備廠商共同引領(lǐng)語音導(dǎo)航新世代的來臨。

語音導(dǎo)航是汽車產(chǎn)業(yè)發(fā)展的必然

  從全球汽車產(chǎn)業(yè)發(fā)展?fàn)顩r來看,語音技術(shù)在車載導(dǎo)航中的應(yīng)用是一種新的趨勢。目前,雷克薩斯與奧迪都正專注于改善語音識別在其所產(chǎn)車型上的應(yīng)用效果,奧迪于近期推出了新的升級版軟件來更新其MMI,使其用戶體驗(yàn)更加友好、準(zhǔn)確、便捷。同時(shí),更多整車廠商也在為車載導(dǎo)航產(chǎn)品積極尋求適合的語音技術(shù)提供商和解決方案。特別是從長遠(yuǎn)發(fā)展考慮,語音合成與語音識別必將融合為交互式的語音應(yīng)用,因此廠商對于語音技術(shù)提供商具備合成與識別全面技術(shù)優(yōu)勢與提供完整解決方案的能力高度關(guān)注,而這也正是科大訊飛與廠商建立普遍合作占據(jù)市場主導(dǎo)地位的核心優(yōu)勢所在。

  傳統(tǒng)的車載導(dǎo)航產(chǎn)品,是用眼睛看的方式獲取相關(guān)信息,對汽車駕駛者而言存在一定的安全隱患。而車載語音導(dǎo)航系統(tǒng)則從根本上變革了信息獲取方式,變看為聽,并以說的方式進(jìn)行設(shè)備操控,使車載導(dǎo)航更具人性化,使駕駛者、乘車者出行更安全、方便。

  當(dāng)前,將車載導(dǎo)航設(shè)備與語音技術(shù)結(jié)合也成為了國內(nèi)各廠商普遍關(guān)注的增加產(chǎn)品亮點(diǎn)和競爭力的一條重要途徑。對于車載導(dǎo)航來說,有了語音合成,無論是千變?nèi)f化的道路名稱,還是隨時(shí)到來的路況信息,都能隨時(shí)播報(bào);有了語音識別,目的地設(shè)定、路況信息查詢,只需說出命令即可完成操作!昂铣桑R別”的理念和解決方案,真正實(shí)現(xiàn)了交互式的語音導(dǎo)航系統(tǒng),從根本上解決了安全隱患,提升了汽車駕駛樂趣。

語音應(yīng)用的技術(shù)難點(diǎn)

  語音技術(shù)在車載導(dǎo)航中的應(yīng)用存在兩大難點(diǎn):語音合成方面技術(shù)難點(diǎn)在于語音合成的技術(shù)水平與質(zhì)量。語音識別方面的技術(shù)難點(diǎn)主要表現(xiàn)在對眾多口音和方言的支持、對車內(nèi)噪音環(huán)境的適應(yīng)和處理,以及命令中關(guān)鍵詞的提取上。

  中國地大物博,方言有幾千種,部分方言與普通話差別甚大,基于標(biāo)準(zhǔn)普通話的語音識別系統(tǒng)在識別帶有方言口音的普通話時(shí),識別率會下降很多。

  對于中文語音識別應(yīng)用中經(jīng)常面臨的方言口音、復(fù)雜信道和背景噪聲等問題,依據(jù)從實(shí)際業(yè)務(wù)系統(tǒng)中收集的涵蓋不同方言和不同環(huán)境噪聲的海量語音數(shù)據(jù),采用最新的區(qū)分性訓(xùn)練方法進(jìn)行語音建模,從而使語音識別產(chǎn)品在復(fù)雜應(yīng)用環(huán)境下可以擁有良好的一致性效果表現(xiàn)。

  “隨意說”的難點(diǎn)在于核心命令詞的提取、語意分析。該技術(shù)使用戶可以自如地以自然語言與智能語音信息服務(wù)系統(tǒng)進(jìn)行交互,經(jīng)過引擎的自然語意分析理解而得到用戶的意圖,再反饋給用戶對應(yīng)的需求信息,從而引導(dǎo)用戶達(dá)到其預(yù)想的目標(biāo)。

  另外,在車輛使用過程中,發(fā)送機(jī)的運(yùn)轉(zhuǎn)聲、空調(diào)噪音、窗外環(huán)境的噪聲和風(fēng)噪等各類噪音會對車內(nèi)的語音識別效果形成一定的影響?偠灾鉀Q應(yīng)用技術(shù)難點(diǎn)的核心在于語音技術(shù)供應(yīng)商在核心技術(shù)、語音資源庫等方面的長期積累、研究。

科大訊飛為業(yè)界提供完美解決之道

  目前國內(nèi)已推出的具有語音功能的導(dǎo)航產(chǎn)品中絕大部分應(yīng)用的都是科大訊飛的語音合成技術(shù),實(shí)現(xiàn)信息語音播報(bào)、語音操作提示等功能,并對于語音識別技術(shù)在導(dǎo)航產(chǎn)品中的應(yīng)用與廠商共同合作進(jìn)行預(yù)研和應(yīng)用探討。

  作為中國最大的智能語音技術(shù)提供商的科大訊飛,在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在中文語音合成、語音識別、口語評測等多項(xiàng)技術(shù)上擁有國際領(lǐng)先的成果?拼笥嶏w中文語音合成技術(shù)在近年來歷屆國內(nèi)、國際權(quán)威機(jī)構(gòu)的評測中,主要關(guān)鍵技術(shù)指標(biāo)均名列第一,并被信息產(chǎn)業(yè)部確定為中文語音交互技術(shù)標(biāo)準(zhǔn)工作組組長單位,牽頭制定中文語音技術(shù)標(biāo)準(zhǔn)?拼笥嶏w中文語音合成技術(shù)2005年在業(yè)界首次超過普通人口語水平(普通人口語自然度得分4.0分,訊飛中文語音合成技術(shù)自然度達(dá)到4.3分)。2003年,科大訊飛獲迄今中國語音產(chǎn)業(yè)唯一的“國家科技進(jìn)步獎(二等)”,2005年獲中國信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽(yù)“信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎”。

  2006年、2007年、2008年連續(xù)三屆英文語音合成國際大賽(Blizzard Challenge )榮獲第一名。2008年獲國際說話人識別評測大賽桂冠。科大訊飛已實(shí)現(xiàn)了從中文到英文等多語種,從語音合成到語音識別的全面技術(shù)領(lǐng)先。

  經(jīng)過多年的研究,公司積累了大量的方言數(shù)據(jù)庫,語音合成技術(shù)已經(jīng)達(dá)到不僅能生成標(biāo)準(zhǔn)流暢的普通話,而且可以支持四川話、河南話、湖南話、東北話等幾乎全部的主流方言,語音識別技術(shù)支持接近普通話的方言,有效解決了語音技術(shù)的應(yīng)用難點(diǎn)。

  語音識別技術(shù)的應(yīng)用對硬件設(shè)備及軟件系統(tǒng)的支持能力會有更高的要求:其一,在硬件配合上,需要更高性能的處理器,區(qū)別于一般性能的高品質(zhì)麥克風(fēng)和適合錄音數(shù)據(jù)傳送的音頻電路,以此來保證識別引擎接受數(shù)據(jù)的完整性和可用性;其二,在導(dǎo)航軟件上,需要軟件開發(fā)商在搜索引擎的接口中加入便于語音識別系統(tǒng)可以調(diào)用的數(shù)據(jù)和命令菜單,以此來實(shí)現(xiàn)分類信息搜索、POI搜索和交叉路口搜索等功能。

  語音導(dǎo)航的操作非常簡單,不過需要具備兩個(gè)前提:第一,需要導(dǎo)航軟件廠商將車載設(shè)備可以支持的命令詞內(nèi)容信息告知用戶(這些內(nèi)容可能是在導(dǎo)航菜單界面的功能名稱,也可能是用戶自行設(shè)置的目的地名稱及手機(jī)聯(lián)系人的名稱等);第二,車載設(shè)備商可以在方向盤或車載導(dǎo)航儀上安裝一個(gè)語音識別啟動按鍵,通過按動識別鍵啟動語音控制系統(tǒng),用戶對著識別麥克說出自己的需求,系統(tǒng)通過識別用戶的語言,實(shí)現(xiàn)用戶的需求。

  語音技術(shù)在車載導(dǎo)航中的應(yīng)用,當(dāng)關(guān)閉車窗時(shí),只要是普通話或與普通話相近的方言,訊飛語音一次性識別正確率都可以達(dá)到90%以上。此外,語音識別功能的成本已經(jīng)大大降低,加入的硬件和軟件授權(quán)費(fèi)都在廠商和用戶的接受范圍之內(nèi),與語音車載導(dǎo)航的高性能、高附加值相比,可以說是微不足道。

  在實(shí)際使用中,如用戶需要語音導(dǎo)航儀尋找當(dāng)前所在位置附近的加油站,按動識別鍵后直接對著麥克風(fēng)說“導(dǎo)航到附近加油站”,語音導(dǎo)航儀會將搜索到的附近加油站的位置和具體信息通過圖形顯示和語音回饋給用戶。

  當(dāng)用戶需要查詢某一位置時(shí)可以說出此POI的名稱,如“家樂福超市”,識別系統(tǒng)便會結(jié)合搜索引擎按照由近至遠(yuǎn)的方式為用戶列出附近的家樂福超市的位置信息;另外,用戶也可以說出希望去往的某個(gè)交叉路口的名稱,如“深南大道和農(nóng)林路交叉口”等找到目的地。

  隨著智能語音識別技術(shù)的不斷完善,數(shù)據(jù)資源的不斷積累,用戶可以不拘于固定的語言表達(dá)方式而用較為自然的語音進(jìn)行命令輸入,如“導(dǎo)航到某某地”這樣的命令也可以說成“我想去某某地”、“某某地在哪”或“帶我去某某地”等多種表述方式,語音系統(tǒng)都可以正確識別并處理。

  總而言之,科大訊飛之所以能夠?yàn)闃I(yè)界提供完美解決之道,受到廠商的普遍青睞,核心技術(shù)的全面領(lǐng)先、長期的研究積累是根本原因,科大訊飛的先發(fā)優(yōu)勢和資源積累形成了短期內(nèi)難以仿效的競爭優(yōu)勢,樹立了牢固的市場領(lǐng)導(dǎo)者地位。

市場前景分析

  一項(xiàng)統(tǒng)計(jì)表明,中國的車載導(dǎo)航市場前景廣闊:日本的汽車車載導(dǎo)航安裝率高達(dá)59%,歐美市場為25%,而中國車載導(dǎo)航安裝率尚不足2%。中國地大物博、交通情況復(fù)雜的特點(diǎn)也決定了導(dǎo)航設(shè)備在中國的應(yīng)用更具必要性與現(xiàn)實(shí)意義,且中國導(dǎo)航產(chǎn)品具有突出的性價(jià)比優(yōu)勢。

  隨著語音技術(shù)與車載導(dǎo)航的結(jié)合,將進(jìn)一步增強(qiáng)汽車的安全、娛樂和舒適功能。語音系統(tǒng)可以實(shí)現(xiàn)CD、MP3、收音機(jī)功能控制,也可以實(shí)現(xiàn)語音點(diǎn)歌搜索:用戶只要說出歌手或歌曲名稱,或者哼唱一段歌詞,車載MP3就會搜索到你想要聽的音樂。車載設(shè)備通過藍(lán)牙與手機(jī)連接后,只要對其說出人名或號碼,手機(jī)就會進(jìn)行自動撥號。另外,通過聲控可以實(shí)現(xiàn)車內(nèi)溫度、亮度等調(diào)節(jié),使駕駛者能夠真正享受到車內(nèi)舒適生活。除了語音識別技術(shù),語音合成系統(tǒng)可以實(shí)現(xiàn)對汽車油量、電量、胎壓以及速度的播報(bào)及聲控結(jié)果的反饋確認(rèn)等。

  未來,語音系統(tǒng)將成為車載內(nèi)信息獲取、互動娛樂、程序操控的重要工具,真正成為車載設(shè)備綜合控制終端,解放駕駛者的雙手,為改善行車安全、提升車載娛樂價(jià)值、促進(jìn)車載信息化發(fā)揮舉足輕重的作用。

  目前,隨著中國汽車工業(yè)的快速發(fā)展和汽車保有量的增加,智能語音技術(shù)在車載導(dǎo)航設(shè)備上的創(chuàng)新應(yīng)用,為汽車用戶多增添了一份安全感和舒適感,亦對整個(gè)產(chǎn)業(yè)鏈的拓展、發(fā)展具有重要意義,為汽車制造和設(shè)備廠商提供了新的、廣闊的增值空間。以語音技術(shù)應(yīng)用為標(biāo)志的車載導(dǎo)航新世代正在來臨,科大訊飛與合作伙伴攜手,正昂首闊步引領(lǐng)未來。

CTI論壇報(bào)道


相關(guān)鏈接:
訊飛語音牽手中興通訊 共同打造TD無線座機(jī) 2009-06-08
訊飛語音助城商銀行征戰(zhàn)新市場 2009-05-15
科大訊飛語音技術(shù)帶來手機(jī)行業(yè)變革 2009-05-13
訊飛語音讓MP3開口說話 2009-04-30
科大訊飛即將推出新一代語音合成芯片XF-S4041 2009-04-29