首頁>>廠商>>語音識別與合成>>科大訊飛

嵌入式語音技術(shù)應(yīng)用 未來將實現(xiàn)爆發(fā)式增長

2009/07/02

  在2008年美國國際消費電子展(CES 2008)上,比爾•蓋茨在演講中描述了下一個“數(shù)字十年”的發(fā)展趨勢,將智能語音技術(shù)視為未來技術(shù)發(fā)展三大關(guān)鍵趨勢之首,認(rèn)為智能語音將帶來人機交互模式的根本性變革。

  語音技術(shù)作為人機交互的重要方式,作為戰(zhàn)略性和前瞻性的重要新興產(chǎn)業(yè),語音技術(shù)市場領(lǐng)域一直是國內(nèi)外科學(xué)界和產(chǎn)業(yè)界的關(guān)注焦點和競爭熱點,世界各國都力爭取得關(guān)鍵技術(shù)突破,占據(jù)產(chǎn)業(yè)先機位置,并取得對語音產(chǎn)業(yè)的領(lǐng)導(dǎo)權(quán)。隨著導(dǎo)航、手機等移動信息終端和學(xué)習(xí)機、MP3等便攜式消費電子產(chǎn)品的日益普及,語音技術(shù)在嵌入式設(shè)備中的應(yīng)用也越來越廣泛,語音技術(shù)開始真正走進(jìn)了千家萬戶。

  那么,目前嵌入式語音技術(shù)應(yīng)用表現(xiàn)在哪里?未來,嵌入式應(yīng)用又該向何處發(fā)展?帶著這些問題,我們將為你一一揭開嵌入式語音技術(shù)應(yīng)用的神秘面紗。

嵌入式語音技術(shù)應(yīng)用現(xiàn)狀

  嵌入式產(chǎn)品的應(yīng)用無處不在,語音技術(shù)的加入讓嵌入式產(chǎn)品能“聽”會“說”,變得更加智能和方便。特別是嵌入式產(chǎn)品體積受限,“看”屏幕信息不方便,利用語音技術(shù)“聽”信息和語音命令操作機器,將嵌入式產(chǎn)品的便攜性和實用性完美的結(jié)合起來。典型的應(yīng)用環(huán)境包括以手機為代表的移動通信環(huán)境、以GPS導(dǎo)航為代表的汽車環(huán)境和以MP3/MP4、學(xué)習(xí)機為代表的隨身電子數(shù)碼娛樂環(huán)境。而隨著中國手機、汽車和數(shù)碼電子等市場的快速發(fā)展,嵌入式語音產(chǎn)品市場必將在最近幾年呈現(xiàn)出爆發(fā)式增長。目前,嵌入式語音技術(shù)應(yīng)用,主要表現(xiàn)在:

以GPS導(dǎo)航為代表的汽車環(huán)境

  語音技術(shù)在車載導(dǎo)航行業(yè)中的應(yīng)用,充分考慮了車載導(dǎo)航應(yīng)用領(lǐng)域的語音需求,提升了語音合成與語音識別在車載條件下的效果,并針對該行業(yè)的應(yīng)用需求提供全方面的解決方案。有了語音合成,千變?nèi)f化的道路名稱,隨時到來的路況信息、區(qū)域信息,都能及時準(zhǔn)確播報,有了語音識別,目的地設(shè)定、路況信息查詢,只要說出命令就可以實現(xiàn)操作,真正解放了雙手,大大提高了駕駛的安全性。

  未來,語音系統(tǒng)將成為車載內(nèi)信息獲取、互動娛樂、程序操控的重要工具,真正成為車載設(shè)備綜合控制終端,解放駕駛者的雙手,為改善行車安全、提升車載娛樂價值、促進(jìn)車載信息化發(fā)揮舉足輕重的作用。

以手機為代表的移動通信環(huán)境

  現(xiàn)在,手機“能聽會說”早已不是一件稀奇的事。手機不再受屏幕大小、常處于移動狀態(tài)、信息容量大難以獲取的限制,語音交互的手機,使用更加方便、時尚。通過語音合成技術(shù)實現(xiàn)來電播報、短信播報、電子書朗讀以及語音提醒、語音報時等功能,通過語音識別實現(xiàn)語音撥號、語音檢索、語音命令操作手機等功能,朗讀效果清晰、自然,語音識別效率高、反應(yīng)快、實用性強。

  隨著科技的快速發(fā)展和3G時代的到來,智能化、人性化已成為了手機發(fā)展的主要方向!澳苈爼f”功能為手機行業(yè)帶來了革命性變化,徹底改變了人與手機之間的交互方式,使人與手機之間的“溝通”變得更加自然與順暢。

以電子詞典、數(shù)碼電子為代表的隨身學(xué)習(xí)、娛樂環(huán)境

  語音技術(shù)在以學(xué)習(xí)機為代表教育行業(yè)中的應(yīng)用,讓所見即所聽,特別對于不清楚單詞發(fā)音,不清楚句子如何連貫朗讀情況下尤為重要。教育電子行業(yè)所采用的語音系統(tǒng)在字詞覆蓋率和多音字合成準(zhǔn)確率方面有較大的提升,朗讀更準(zhǔn)確流暢。語音合成技術(shù)的應(yīng)用,實現(xiàn)中英文混讀、英文篇章級朗讀,以及聲韻母和英文音標(biāo)的朗讀;語音識別技術(shù)的應(yīng)用,實現(xiàn)語音搜索、聲控命令操作等功能;口語評測技術(shù),讓用戶可以進(jìn)行跟讀訓(xùn)練,跟讀后系統(tǒng)給出分?jǐn)?shù)和檢錯提示,針對性更強,進(jìn)步更快。

  目前,嵌入式語音技術(shù)應(yīng)用已實現(xiàn)從教育電子行業(yè)到MP3/MP4/PMP、數(shù)字電視等數(shù)碼電子領(lǐng)域的滲透。強大的語音功能,使得數(shù)碼產(chǎn)品的使用價值得到巨大提升,成為新一代數(shù)碼產(chǎn)品的最大亮點與賣點!澳苈爼f”的功能將進(jìn)一步加強消費者與數(shù)碼產(chǎn)品之間的交流互動,從而為消費者帶來更便捷、更時尚的新潮體驗。

科大訊飛的獨特優(yōu)勢

  需要在有限的資源(運算和存儲資源)環(huán)境下完成良好的語音效果(包括語音合成的準(zhǔn)確度、自然度等,語音識別的準(zhǔn)確度),一直是語音技術(shù)在嵌入式環(huán)境應(yīng)用的最大壁壘,同時,由于嵌入式環(huán)境的硬件和軟件平臺千差萬別,存在多種硬件平臺、操作系統(tǒng)和軟件環(huán)境,傳統(tǒng)的語音系統(tǒng)在適用性和移植性上也難以滿足多樣的嵌入式環(huán)境需求。 因此,系統(tǒng)資源占用、語音合成效果和系統(tǒng)移植性等一直是國內(nèi)嵌入式中文語音技術(shù)廠商研發(fā)的重點。在嵌入式語音技術(shù)應(yīng)用上,智能語音技術(shù)全球領(lǐng)先的科大訊飛不論是技術(shù)上還是市場應(yīng)用上都具備了突出的領(lǐng)先優(yōu)勢。

綜合實力優(yōu)勢

  目前,國內(nèi)手機、車載導(dǎo)航、電子詞典等嵌入式設(shè)備制造廠商對于語音技術(shù)的應(yīng)用已經(jīng)達(dá)成了廣泛的共識,都在積極尋求語音技術(shù)提供商。語音技術(shù)屬于新興的高科技技術(shù),廠商在尋求合作伙伴時也會重點關(guān)注供應(yīng)商的綜合實力,一方面綜合實力強的企業(yè)在保證語音效果最優(yōu)的同時,能夠讓語音合成和識別的差錯最低,中文語言博大精深,多音多義字眾多,需要專業(yè)的團(tuán)隊長期不斷的積累和研發(fā),才能保證優(yōu)秀的朗讀效果和準(zhǔn)確率。另一方面,從長遠(yuǎn)考慮,要求技術(shù)供應(yīng)商具有從語音合成到語音識別的全面技術(shù)領(lǐng)先,才能保證解決方案的更加完善,和后續(xù)產(chǎn)品不斷升級的需求。

  作為中國最大的智能語音技術(shù)提供商,科大訊飛在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在語音合成、語音識別、口語評測等多項技術(shù)上擁有國際領(lǐng)先的成果。科大訊飛中文語音合成技術(shù)在近年來歷屆國內(nèi)、國際權(quán)威機構(gòu)的評測中,主要關(guān)鍵技術(shù)指標(biāo)均名列第一,并被信息產(chǎn)業(yè)部確定為中文語音交互技術(shù)標(biāo)準(zhǔn)工作組組長單位,牽頭制定中文語音技術(shù)標(biāo)準(zhǔn)。2006年、2007年、2008年連續(xù)三屆英文語音合成國際大賽(Blizzard Challenge)榮獲第一名。2008年獲國際說話人識別評測大賽桂冠,標(biāo)志著科大訊飛取得了從語音合成到語音識別的全面技術(shù)領(lǐng)先。

  基于擁有自主知識產(chǎn)權(quán)的世界領(lǐng)先智能語音技術(shù),科大訊飛已推出從大型電信級應(yīng)用到小型嵌入式應(yīng)用,從電信、金融等行業(yè)到企業(yè)和家庭用戶,從PC到手機到MP3/MP4/PMP和玩具,能夠滿足不同應(yīng)用環(huán)境的多種產(chǎn)品。科大訊飛占有中文語音技術(shù)市場70%以上市場份額,在電信、金融、電力、社保等主流行業(yè)的份額更達(dá)80%以上,以訊飛為核心的中文語音產(chǎn)業(yè)鏈已初具規(guī)模。

“軟件+硬件”雙重解決方案優(yōu)勢

  科大訊飛嵌入式語音技術(shù)通過嵌入式語音軟件和硬件兩種方式提供給客戶,不同的應(yīng)用形式更好的滿足了不同客戶的需求。

  在軟件方面,科大訊飛輕量級智能語音交互系統(tǒng)被科技部評為“2007年度國家重點新產(chǎn)品”,已達(dá)到大規(guī)模產(chǎn)業(yè)化的要求,其核心產(chǎn)品為:輕量級語音合成系統(tǒng)Aisound、輕量級語音識別系統(tǒng)Aitalk。針對嵌入式系統(tǒng)資源受限的特點,訊飛輕量級智能語音交互系統(tǒng)通過深入的優(yōu)化后,不僅保證良好的語音效果,而且在資源占用、可移植性等方面取得了突破性進(jìn)展。

  在硬件方面,科大訊飛語音合成芯片XF-S3011和XF-S4041以及語音合成模塊XF-S4240,分別屬于低端、中端、高端的語音應(yīng)用產(chǎn)品,語音芯片、模塊通過異步串口、I2C、SPI接口接收待合成的文本,直接合成自然、流暢的語音輸出。體積小、使用方便,是一套面向各類電子設(shè)備的高性價比的語音解決方案。已成功應(yīng)用于車載GPS調(diào)度、車載電話、信息家電、智能儀表、稅控機、智能玩具等領(lǐng)域。

市場應(yīng)用優(yōu)勢

  自成立以來,科大訊飛就確立了“頂天立地”的發(fā)展戰(zhàn)略,“頂天”是保持核心技術(shù)國際領(lǐng)先,成為全球著名的語音和語言研究高地;“立地”是將研究成果大規(guī)模產(chǎn)業(yè)化,推動語音技術(shù)進(jìn)入億萬家庭,造福普通百姓。

  近年來,隨著科大訊飛語音技術(shù)的不斷進(jìn)步,嵌入式應(yīng)用得到了快速的發(fā)展,在車載導(dǎo)航、手機、學(xué)習(xí)機等主流應(yīng)用領(lǐng)域應(yīng)用不斷深入。在車載導(dǎo)航領(lǐng)域,公司已經(jīng)與豐田、西門子、奇瑞、新科等制造廠商進(jìn)行了合作;在手機終端領(lǐng)域,典型的開發(fā)商有三星、多普達(dá)、聯(lián)想、海爾等。在教育電子領(lǐng)域,諾亞舟、步步高、好記星、文曲星等國內(nèi)前6名的知名學(xué)習(xí)機品牌商都與科大訊飛建立良好的合作關(guān)系;在MP3/MP4/PMP領(lǐng)域,愛國者、0PPO、臺電、魅族等知名品牌都是科大訊飛的合作伙伴。不論是車載導(dǎo)航還是手機、教育電子等主流應(yīng)用市場,科大訊飛市場占有率均在80%以上。

  通過與手機、車載導(dǎo)航、電子詞典等嵌入式設(shè)備制造廠商的大力合作,科大訊飛的語音技術(shù)與應(yīng)用都得到了快速的提升,同時公司品牌影響力也得到相應(yīng)的提高,嵌入式應(yīng)用爆發(fā)式發(fā)展已經(jīng)具備了良好的基礎(chǔ)條件。

未來市場發(fā)展前景

  隨著在越來越多的領(lǐng)域,人們對語音交互價值的認(rèn)識不斷深化,并開始習(xí)慣使用,語音技術(shù)已經(jīng)從錦上添花的點綴變?yōu)閷崒嵲谠谔峁┙o用戶便利的重要特性,也成為衡量電子設(shè)備智能化的一個重要指標(biāo)。除了在技術(shù)指標(biāo)方面繼續(xù)改進(jìn)外,功能上,語音技術(shù)在各行業(yè)的全面解決方案將成為未來嵌入式語音技術(shù)與應(yīng)用的發(fā)展方向。

  目前,嵌入式語音技術(shù)應(yīng)用主要集中在以手機為代表的移動通信應(yīng)用、以GPS導(dǎo)航為代表的汽車應(yīng)用和以電子書和電子詞典為代表的隨身數(shù)碼娛樂應(yīng)用。未來,在手機、學(xué)習(xí)機、車載導(dǎo)航儀等終端設(shè)備中的應(yīng)用開始加速推廣的基礎(chǔ)上,語音技術(shù)在各領(lǐng)域?qū)玫娇v深的發(fā)展。在車載領(lǐng)域,語音系統(tǒng)將成為車載內(nèi)信息獲取、互動娛樂、程序操控的重要工具,真正成為車載設(shè)備綜合控制終端。同時,語音技術(shù)將從現(xiàn)在的讀書機、學(xué)習(xí)機、MP3/MP4/MPM、智能玩具等數(shù)碼終端進(jìn)入到更廣闊的領(lǐng)域,如家用電器、智能機器人等方向。

  隨著網(wǎng)絡(luò)的普及以及3G時代的到來,純粹的單一應(yīng)用將難以滿足用戶的需要,融合語音技術(shù)、網(wǎng)絡(luò)應(yīng)用和其他技術(shù)業(yè)務(wù)于一身的綜合應(yīng)用服務(wù),將會為各行業(yè)發(fā)展帶來新的機遇。

  對于科大訊飛來說,中國語音市場以及嵌入式語音應(yīng)用即將迎來產(chǎn)業(yè)爆發(fā)期,公司已經(jīng)具備了規(guī);、產(chǎn)業(yè)化大發(fā)展的技術(shù)條件。未來,科大訊飛將抓住這一難得的歷史機遇,真正使智能語音技術(shù)走進(jìn)千家萬戶,造福億萬百姓生活。

CTI論壇報道


相關(guān)鏈接:
訊飛語音助力安徽評標(biāo)專家?guī)炜头到y(tǒng) 2009-07-14
電視讀報:為用戶打造專屬讀報人 2009-07-08
科大訊飛推出語音合成芯片XFS3031CN 2009-07-07
2009 NIST語種識別大賽科大訊飛再獲桂冠 2009-07-01
解放雙手 車載語音導(dǎo)航時代來臨 2009-06-30