嵌入式語(yǔ)音技術(shù)應(yīng)用 未來(lái)將實(shí)現(xiàn)爆發(fā)式增長(zhǎng)
2009/07/02
在2008年美國(guó)國(guó)際消費(fèi)電子展(CES 2008)上,比爾•蓋茨在演講中描述了下一個(gè)“數(shù)字十年”的發(fā)展趨勢(shì),將智能語(yǔ)音技術(shù)視為未來(lái)技術(shù)發(fā)展三大關(guān)鍵趨勢(shì)之首,認(rèn)為智能語(yǔ)音將帶來(lái)人機(jī)交互模式的根本性變革。
語(yǔ)音技術(shù)作為人機(jī)交互的重要方式,作為戰(zhàn)略性和前瞻性的重要新興產(chǎn)業(yè),語(yǔ)音技術(shù)市場(chǎng)領(lǐng)域一直是國(guó)內(nèi)外科學(xué)界和產(chǎn)業(yè)界的關(guān)注焦點(diǎn)和競(jìng)爭(zhēng)熱點(diǎn),世界各國(guó)都力爭(zhēng)取得關(guān)鍵技術(shù)突破,占據(jù)產(chǎn)業(yè)先機(jī)位置,并取得對(duì)語(yǔ)音產(chǎn)業(yè)的領(lǐng)導(dǎo)權(quán)。隨著導(dǎo)航、手機(jī)等移動(dòng)信息終端和學(xué)習(xí)機(jī)、MP3等便攜式消費(fèi)電子產(chǎn)品的日益普及,語(yǔ)音技術(shù)在嵌入式設(shè)備中的應(yīng)用也越來(lái)越廣泛,語(yǔ)音技術(shù)開(kāi)始真正走進(jìn)了千家萬(wàn)戶。
那么,目前嵌入式語(yǔ)音技術(shù)應(yīng)用表現(xiàn)在哪里?未來(lái),嵌入式應(yīng)用又該向何處發(fā)展?帶著這些問(wèn)題,我們將為你一一揭開(kāi)嵌入式語(yǔ)音技術(shù)應(yīng)用的神秘面紗。
嵌入式語(yǔ)音技術(shù)應(yīng)用現(xiàn)狀
嵌入式產(chǎn)品的應(yīng)用無(wú)處不在,語(yǔ)音技術(shù)的加入讓嵌入式產(chǎn)品能“聽(tīng)”會(huì)“說(shuō)”,變得更加智能和方便。特別是嵌入式產(chǎn)品體積受限,“看”屏幕信息不方便,利用語(yǔ)音技術(shù)“聽(tīng)”信息和語(yǔ)音命令操作機(jī)器,將嵌入式產(chǎn)品的便攜性和實(shí)用性完美的結(jié)合起來(lái)。典型的應(yīng)用環(huán)境包括以手機(jī)為代表的移動(dòng)通信環(huán)境、以GPS導(dǎo)航為代表的汽車環(huán)境和以MP3/MP4、學(xué)習(xí)機(jī)為代表的隨身電子數(shù)碼娛樂(lè)環(huán)境。而隨著中國(guó)手機(jī)、汽車和數(shù)碼電子等市場(chǎng)的快速發(fā)展,嵌入式語(yǔ)音產(chǎn)品市場(chǎng)必將在最近幾年呈現(xiàn)出爆發(fā)式增長(zhǎng)。目前,嵌入式語(yǔ)音技術(shù)應(yīng)用,主要表現(xiàn)在:
以GPS導(dǎo)航為代表的汽車環(huán)境
語(yǔ)音技術(shù)在車載導(dǎo)航行業(yè)中的應(yīng)用,充分考慮了車載導(dǎo)航應(yīng)用領(lǐng)域的語(yǔ)音需求,提升了語(yǔ)音合成與語(yǔ)音識(shí)別在車載條件下的效果,并針對(duì)該行業(yè)的應(yīng)用需求提供全方面的解決方案。有了語(yǔ)音合成,千變?nèi)f化的道路名稱,隨時(shí)到來(lái)的路況信息、區(qū)域信息,都能及時(shí)準(zhǔn)確播報(bào),有了語(yǔ)音識(shí)別,目的地設(shè)定、路況信息查詢,只要說(shuō)出命令就可以實(shí)現(xiàn)操作,真正解放了雙手,大大提高了駕駛的安全性。
未來(lái),語(yǔ)音系統(tǒng)將成為車載內(nèi)信息獲取、互動(dòng)娛樂(lè)、程序操控的重要工具,真正成為車載設(shè)備綜合控制終端,解放駕駛者的雙手,為改善行車安全、提升車載娛樂(lè)價(jià)值、促進(jìn)車載信息化發(fā)揮舉足輕重的作用。
以手機(jī)為代表的移動(dòng)通信環(huán)境
現(xiàn)在,手機(jī)“能聽(tīng)會(huì)說(shuō)”早已不是一件稀奇的事。手機(jī)不再受屏幕大小、常處于移動(dòng)狀態(tài)、信息容量大難以獲取的限制,語(yǔ)音交互的手機(jī),使用更加方便、時(shí)尚。通過(guò)語(yǔ)音合成技術(shù)實(shí)現(xiàn)來(lái)電播報(bào)、短信播報(bào)、電子書(shū)朗讀以及語(yǔ)音提醒、語(yǔ)音報(bào)時(shí)等功能,通過(guò)語(yǔ)音識(shí)別實(shí)現(xiàn)語(yǔ)音撥號(hào)、語(yǔ)音檢索、語(yǔ)音命令操作手機(jī)等功能,朗讀效果清晰、自然,語(yǔ)音識(shí)別效率高、反應(yīng)快、實(shí)用性強(qiáng)。
隨著科技的快速發(fā)展和3G時(shí)代的到來(lái),智能化、人性化已成為了手機(jī)發(fā)展的主要方向!澳苈(tīng)會(huì)說(shuō)”功能為手機(jī)行業(yè)帶來(lái)了革命性變化,徹底改變了人與手機(jī)之間的交互方式,使人與手機(jī)之間的“溝通”變得更加自然與順暢。
以電子詞典、數(shù)碼電子為代表的隨身學(xué)習(xí)、娛樂(lè)環(huán)境
語(yǔ)音技術(shù)在以學(xué)習(xí)機(jī)為代表教育行業(yè)中的應(yīng)用,讓所見(jiàn)即所聽(tīng),特別對(duì)于不清楚單詞發(fā)音,不清楚句子如何連貫朗讀情況下尤為重要。教育電子行業(yè)所采用的語(yǔ)音系統(tǒng)在字詞覆蓋率和多音字合成準(zhǔn)確率方面有較大的提升,朗讀更準(zhǔn)確流暢。語(yǔ)音合成技術(shù)的應(yīng)用,實(shí)現(xiàn)中英文混讀、英文篇章級(jí)朗讀,以及聲韻母和英文音標(biāo)的朗讀;語(yǔ)音識(shí)別技術(shù)的應(yīng)用,實(shí)現(xiàn)語(yǔ)音搜索、聲控命令操作等功能;口語(yǔ)評(píng)測(cè)技術(shù),讓用戶可以進(jìn)行跟讀訓(xùn)練,跟讀后系統(tǒng)給出分?jǐn)?shù)和檢錯(cuò)提示,針對(duì)性更強(qiáng),進(jìn)步更快。
目前,嵌入式語(yǔ)音技術(shù)應(yīng)用已實(shí)現(xiàn)從教育電子行業(yè)到MP3/MP4/PMP、數(shù)字電視等數(shù)碼電子領(lǐng)域的滲透。強(qiáng)大的語(yǔ)音功能,使得數(shù)碼產(chǎn)品的使用價(jià)值得到巨大提升,成為新一代數(shù)碼產(chǎn)品的最大亮點(diǎn)與賣點(diǎn)!澳苈(tīng)會(huì)說(shuō)”的功能將進(jìn)一步加強(qiáng)消費(fèi)者與數(shù)碼產(chǎn)品之間的交流互動(dòng),從而為消費(fèi)者帶來(lái)更便捷、更時(shí)尚的新潮體驗(yàn)。
科大訊飛的獨(dú)特優(yōu)勢(shì)
需要在有限的資源(運(yùn)算和存儲(chǔ)資源)環(huán)境下完成良好的語(yǔ)音效果(包括語(yǔ)音合成的準(zhǔn)確度、自然度等,語(yǔ)音識(shí)別的準(zhǔn)確度),一直是語(yǔ)音技術(shù)在嵌入式環(huán)境應(yīng)用的最大壁壘,同時(shí),由于嵌入式環(huán)境的硬件和軟件平臺(tái)千差萬(wàn)別,存在多種硬件平臺(tái)、操作系統(tǒng)和軟件環(huán)境,傳統(tǒng)的語(yǔ)音系統(tǒng)在適用性和移植性上也難以滿足多樣的嵌入式環(huán)境需求。 因此,系統(tǒng)資源占用、語(yǔ)音合成效果和系統(tǒng)移植性等一直是國(guó)內(nèi)嵌入式中文語(yǔ)音技術(shù)廠商研發(fā)的重點(diǎn)。在嵌入式語(yǔ)音技術(shù)應(yīng)用上,智能語(yǔ)音技術(shù)全球領(lǐng)先的科大訊飛不論是技術(shù)上還是市場(chǎng)應(yīng)用上都具備了突出的領(lǐng)先優(yōu)勢(shì)。
綜合實(shí)力優(yōu)勢(shì)
目前,國(guó)內(nèi)手機(jī)、車載導(dǎo)航、電子詞典等嵌入式設(shè)備制造廠商對(duì)于語(yǔ)音技術(shù)的應(yīng)用已經(jīng)達(dá)成了廣泛的共識(shí),都在積極尋求語(yǔ)音技術(shù)提供商。語(yǔ)音技術(shù)屬于新興的高科技技術(shù),廠商在尋求合作伙伴時(shí)也會(huì)重點(diǎn)關(guān)注供應(yīng)商的綜合實(shí)力,一方面綜合實(shí)力強(qiáng)的企業(yè)在保證語(yǔ)音效果最優(yōu)的同時(shí),能夠讓語(yǔ)音合成和識(shí)別的差錯(cuò)最低,中文語(yǔ)言博大精深,多音多義字眾多,需要專業(yè)的團(tuán)隊(duì)長(zhǎng)期不斷的積累和研發(fā),才能保證優(yōu)秀的朗讀效果和準(zhǔn)確率。另一方面,從長(zhǎng)遠(yuǎn)考慮,要求技術(shù)供應(yīng)商具有從語(yǔ)音合成到語(yǔ)音識(shí)別的全面技術(shù)領(lǐng)先,才能保證解決方案的更加完善,和后續(xù)產(chǎn)品不斷升級(jí)的需求。
作為中國(guó)最大的智能語(yǔ)音技術(shù)提供商,科大訊飛在智能語(yǔ)音技術(shù)領(lǐng)域有著長(zhǎng)期的研究積累,并在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先的成果?拼笥嶏w中文語(yǔ)音合成技術(shù)在近年來(lái)歷屆國(guó)內(nèi)、國(guó)際權(quán)威機(jī)構(gòu)的評(píng)測(cè)中,主要關(guān)鍵技術(shù)指標(biāo)均名列第一,并被信息產(chǎn)業(yè)部確定為中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組組長(zhǎng)單位,牽頭制定中文語(yǔ)音技術(shù)標(biāo)準(zhǔn)。2006年、2007年、2008年連續(xù)三屆英文語(yǔ)音合成國(guó)際大賽(Blizzard Challenge)榮獲第一名。2008年獲國(guó)際說(shuō)話人識(shí)別評(píng)測(cè)大賽桂冠,標(biāo)志著科大訊飛取得了從語(yǔ)音合成到語(yǔ)音識(shí)別的全面技術(shù)領(lǐng)先。
基于擁有自主知識(shí)產(chǎn)權(quán)的世界領(lǐng)先智能語(yǔ)音技術(shù),科大訊飛已推出從大型電信級(jí)應(yīng)用到小型嵌入式應(yīng)用,從電信、金融等行業(yè)到企業(yè)和家庭用戶,從PC到手機(jī)到MP3/MP4/PMP和玩具,能夠滿足不同應(yīng)用環(huán)境的多種產(chǎn)品?拼笥嶏w占有中文語(yǔ)音技術(shù)市場(chǎng)70%以上市場(chǎng)份額,在電信、金融、電力、社保等主流行業(yè)的份額更達(dá)80%以上,以訊飛為核心的中文語(yǔ)音產(chǎn)業(yè)鏈已初具規(guī)模。
“軟件+硬件”雙重解決方案優(yōu)勢(shì)
科大訊飛嵌入式語(yǔ)音技術(shù)通過(guò)嵌入式語(yǔ)音軟件和硬件兩種方式提供給客戶,不同的應(yīng)用形式更好的滿足了不同客戶的需求。
在軟件方面,科大訊飛輕量級(jí)智能語(yǔ)音交互系統(tǒng)被科技部評(píng)為“2007年度國(guó)家重點(diǎn)新產(chǎn)品”,已達(dá)到大規(guī)模產(chǎn)業(yè)化的要求,其核心產(chǎn)品為:輕量級(jí)語(yǔ)音合成系統(tǒng)Aisound、輕量級(jí)語(yǔ)音識(shí)別系統(tǒng)Aitalk。針對(duì)嵌入式系統(tǒng)資源受限的特點(diǎn),訊飛輕量級(jí)智能語(yǔ)音交互系統(tǒng)通過(guò)深入的優(yōu)化后,不僅保證良好的語(yǔ)音效果,而且在資源占用、可移植性等方面取得了突破性進(jìn)展。
在硬件方面,科大訊飛語(yǔ)音合成芯片XF-S3011和XF-S4041以及語(yǔ)音合成模塊XF-S4240,分別屬于低端、中端、高端的語(yǔ)音應(yīng)用產(chǎn)品,語(yǔ)音芯片、模塊通過(guò)異步串口、I2C、SPI接口接收待合成的文本,直接合成自然、流暢的語(yǔ)音輸出。體積小、使用方便,是一套面向各類電子設(shè)備的高性價(jià)比的語(yǔ)音解決方案。已成功應(yīng)用于車載GPS調(diào)度、車載電話、信息家電、智能儀表、稅控機(jī)、智能玩具等領(lǐng)域。
市場(chǎng)應(yīng)用優(yōu)勢(shì)
自成立以來(lái),科大訊飛就確立了“頂天立地”的發(fā)展戰(zhàn)略,“頂天”是保持核心技術(shù)國(guó)際領(lǐng)先,成為全球著名的語(yǔ)音和語(yǔ)言研究高地;“立地”是將研究成果大規(guī)模產(chǎn)業(yè)化,推動(dòng)語(yǔ)音技術(shù)進(jìn)入億萬(wàn)家庭,造福普通百姓。
近年來(lái),隨著科大訊飛語(yǔ)音技術(shù)的不斷進(jìn)步,嵌入式應(yīng)用得到了快速的發(fā)展,在車載導(dǎo)航、手機(jī)、學(xué)習(xí)機(jī)等主流應(yīng)用領(lǐng)域應(yīng)用不斷深入。在車載導(dǎo)航領(lǐng)域,公司已經(jīng)與豐田、西門子、奇瑞、新科等制造廠商進(jìn)行了合作;在手機(jī)終端領(lǐng)域,典型的開(kāi)發(fā)商有三星、多普達(dá)、聯(lián)想、海爾等。在教育電子領(lǐng)域,諾亞舟、步步高、好記星、文曲星等國(guó)內(nèi)前6名的知名學(xué)習(xí)機(jī)品牌商都與科大訊飛建立良好的合作關(guān)系;在MP3/MP4/PMP領(lǐng)域,愛(ài)國(guó)者、0PPO、臺(tái)電、魅族等知名品牌都是科大訊飛的合作伙伴。不論是車載導(dǎo)航還是手機(jī)、教育電子等主流應(yīng)用市場(chǎng),科大訊飛市場(chǎng)占有率均在80%以上。
通過(guò)與手機(jī)、車載導(dǎo)航、電子詞典等嵌入式設(shè)備制造廠商的大力合作,科大訊飛的語(yǔ)音技術(shù)與應(yīng)用都得到了快速的提升,同時(shí)公司品牌影響力也得到相應(yīng)的提高,嵌入式應(yīng)用爆發(fā)式發(fā)展已經(jīng)具備了良好的基礎(chǔ)條件。
未來(lái)市場(chǎng)發(fā)展前景
隨著在越來(lái)越多的領(lǐng)域,人們對(duì)語(yǔ)音交互價(jià)值的認(rèn)識(shí)不斷深化,并開(kāi)始習(xí)慣使用,語(yǔ)音技術(shù)已經(jīng)從錦上添花的點(diǎn)綴變?yōu)閷?shí)實(shí)在在提供給用戶便利的重要特性,也成為衡量電子設(shè)備智能化的一個(gè)重要指標(biāo)。除了在技術(shù)指標(biāo)方面繼續(xù)改進(jìn)外,功能上,語(yǔ)音技術(shù)在各行業(yè)的全面解決方案將成為未來(lái)嵌入式語(yǔ)音技術(shù)與應(yīng)用的發(fā)展方向。
目前,嵌入式語(yǔ)音技術(shù)應(yīng)用主要集中在以手機(jī)為代表的移動(dòng)通信應(yīng)用、以GPS導(dǎo)航為代表的汽車應(yīng)用和以電子書(shū)和電子詞典為代表的隨身數(shù)碼娛樂(lè)應(yīng)用。未來(lái),在手機(jī)、學(xué)習(xí)機(jī)、車載導(dǎo)航儀等終端設(shè)備中的應(yīng)用開(kāi)始加速推廣的基礎(chǔ)上,語(yǔ)音技術(shù)在各領(lǐng)域?qū)?huì)得到縱深的發(fā)展。在車載領(lǐng)域,語(yǔ)音系統(tǒng)將成為車載內(nèi)信息獲取、互動(dòng)娛樂(lè)、程序操控的重要工具,真正成為車載設(shè)備綜合控制終端。同時(shí),語(yǔ)音技術(shù)將從現(xiàn)在的讀書(shū)機(jī)、學(xué)習(xí)機(jī)、MP3/MP4/MPM、智能玩具等數(shù)碼終端進(jìn)入到更廣闊的領(lǐng)域,如家用電器、智能機(jī)器人等方向。
隨著網(wǎng)絡(luò)的普及以及3G時(shí)代的到來(lái),純粹的單一應(yīng)用將難以滿足用戶的需要,融合語(yǔ)音技術(shù)、網(wǎng)絡(luò)應(yīng)用和其他技術(shù)業(yè)務(wù)于一身的綜合應(yīng)用服務(wù),將會(huì)為各行業(yè)發(fā)展帶來(lái)新的機(jī)遇。
對(duì)于科大訊飛來(lái)說(shuō),中國(guó)語(yǔ)音市場(chǎng)以及嵌入式語(yǔ)音應(yīng)用即將迎來(lái)產(chǎn)業(yè)爆發(fā)期,公司已經(jīng)具備了規(guī)模化、產(chǎn)業(yè)化大發(fā)展的技術(shù)條件。未來(lái),科大訊飛將抓住這一難得的歷史機(jī)遇,真正使智能語(yǔ)音技術(shù)走進(jìn)千家萬(wàn)戶,造福億萬(wàn)百姓生活。
CTI論壇報(bào)道
相關(guān)鏈接: