科大訊飛推出最新語(yǔ)音合成系統(tǒng)InterPhonic C&E v2.1
2003/03/03
近日,從我國(guó)語(yǔ)音技術(shù)領(lǐng)域唯一的國(guó)家863計(jì)劃成果產(chǎn)業(yè)化基地-科大訊飛公司獲悉,代表著當(dāng)今世界中文語(yǔ)音合成技術(shù)最高水平的InterPhonic C&E v2.1系統(tǒng),已由科大訊飛公司自主研發(fā)完畢,并正式推向市場(chǎng)。
這是繼2002年6月科大訊飛在業(yè)界首次推出電信級(jí)中英文語(yǔ)音合成平臺(tái)后,再次推出的業(yè)界又一新品,其主要特點(diǎn)是中英文混讀的合成效果首次達(dá)到了正常人說(shuō)話水準(zhǔn)。該產(chǎn)品通過(guò)采用韻律定制、模塊更新、算法改進(jìn)并引進(jìn)了新的波形平滑算法,較大的提升了系統(tǒng)合成效果的流暢度和自然度。同時(shí),InterPhonic C&E v2.1融入的對(duì)CSSML(中文語(yǔ)音合成標(biāo)記語(yǔ)言)的功能支持,現(xiàn)已正式申報(bào)國(guó)家發(fā)明專利。
在當(dāng)今的技術(shù)發(fā)展中,XML因其優(yōu)秀的可擴(kuò)展性和強(qiáng)大的數(shù)據(jù)表達(dá)能力而被視為未來(lái)Internet上數(shù)據(jù)表達(dá)和傳輸?shù)臉?biāo)準(zhǔn)技術(shù)。基于XML語(yǔ)言標(biāo)準(zhǔn)的VXML語(yǔ)言,是人與電話應(yīng)用交互的流程描述語(yǔ)言,在當(dāng)今的語(yǔ)音門(mén)戶、統(tǒng)一消息平臺(tái)等電話語(yǔ)音應(yīng)用中得到了廣泛應(yīng)用。VXML中使用了W3C制定的SSML(語(yǔ)音合成標(biāo)記語(yǔ)言)作為電話語(yǔ)音流程中語(yǔ)音合成控制的標(biāo)準(zhǔn)。SSML的基本任務(wù)就是在不同的應(yīng)用平臺(tái)上為合成文本提供一個(gè)標(biāo)準(zhǔn)的控制語(yǔ)音輸出的方法,例如發(fā)音、音量、音調(diào)、語(yǔ)速等參數(shù)。CSSML(Chinese Speech Synthesis Markup Language)作為科大訊飛獨(dú)家制定的一種中文語(yǔ)音合成標(biāo)記語(yǔ)言規(guī)范,基于XML和VXML技術(shù),能完全兼容SSML語(yǔ)言規(guī)范。CSSML標(biāo)記語(yǔ)言針對(duì)中文合成領(lǐng)域內(nèi)的特殊要求,對(duì)SSML規(guī)范中的標(biāo)記進(jìn)行擴(kuò)展。支持了CSSML功能的InterPhonic C&E v2.1,將完全可以合成SSML標(biāo)記之后的文本,或者是VXML中的合成文本。這是科大訊飛在此語(yǔ)音應(yīng)用領(lǐng)域中的又一新興獨(dú)創(chuàng)之處。
CSSML項(xiàng)標(biāo)記早在2000年就已由科大訊飛著手制定,其間經(jīng)過(guò)了歷屆中文語(yǔ)音標(biāo)準(zhǔn)研討會(huì)的數(shù)次討論確認(rèn),并最終達(dá)成一致共識(shí),于2002年12月成功發(fā)布。至此,科大訊飛從InterPhonic CE v2.1以后的合成系統(tǒng)都將把CSSML規(guī)范作為中文語(yǔ)音合成系統(tǒng)文本標(biāo)記的支持標(biāo)準(zhǔn),用戶可以通過(guò)CSSML標(biāo)記文本來(lái)指定文本的合成方式,靈活解決一些語(yǔ)音合成系統(tǒng)難以自動(dòng)處理的問(wèn)題。
此外,InterPhonic C&E v2.1還支持DSS Server的功能,能輸出符合DSS規(guī)范的索引流。索引流攜帶的信息能在DSS客戶端被轉(zhuǎn)化成為合成語(yǔ)音數(shù)據(jù)。DSS(分布式合成方法)是業(yè)界一致認(rèn)同的具有良好應(yīng)用前景的技術(shù)。這就是說(shuō),InterPhonic C&E v2.1產(chǎn)品具備了在有限的終端資源上實(shí)現(xiàn)接近桌面系統(tǒng)合成效果的強(qiáng)大功能,為用戶大大減縮了運(yùn)行成本。
科大訊飛自創(chuàng)立以來(lái),一直將自己牢牢定位于核心語(yǔ)音技術(shù)和整體語(yǔ)音解決放案的提供商,在基礎(chǔ)研究領(lǐng)域孜孜以求,碩果累累;在語(yǔ)音技術(shù)產(chǎn)品化和產(chǎn)業(yè)化的道路上不斷開(kāi)拓,奮勇拓荒。作為中文語(yǔ)音產(chǎn)業(yè)界的領(lǐng)導(dǎo)者和開(kāi)拓者,科大訊飛秉持"技術(shù)服務(wù)應(yīng)用"的理念,在3年多的艱苦創(chuàng)業(yè)中,已經(jīng)達(dá)到了在電信、證券、銀行、電力、保險(xiǎn)等主流行業(yè)80%的市場(chǎng)占有率,公司資產(chǎn)規(guī)模不斷擴(kuò)大。在2002年底評(píng)出的"通信業(yè)十大最具增長(zhǎng)潛力的企業(yè)"中,科大訊飛與聯(lián)想、亞信、中興等行業(yè)巨頭同時(shí)入圍,而在這入選的10家企業(yè)中就有5家是科大訊飛的合作伙伴。目前,龐大而穩(wěn)健的合作伙伴群體已經(jīng)達(dá)到了420家之多。
令據(jù)消息,在此InterPhonic CE v2.1產(chǎn)品問(wèn)世之時(shí),科大訊飛的開(kāi)發(fā)團(tuán)隊(duì)還完成了InterPhonic C&E v2.0在Unix下的成功移植。該公司產(chǎn)品研發(fā)部總經(jīng)理嚴(yán)峻先生欣喜地說(shuō)道:"此次InterPhonic C&E v 2.0成功完成的從Windows操作系統(tǒng)到Solaris操作系統(tǒng)的移植,填補(bǔ)了國(guó)內(nèi)的語(yǔ)音合成提供商在Unix/Linux環(huán)境下無(wú)法為用戶提供中文語(yǔ)音合成平臺(tái)的產(chǎn)品空白,同時(shí)也為我們推出后繼的多操作系統(tǒng)版本建立了技術(shù)基礎(chǔ)。"
相信科大訊飛憑著自身的優(yōu)勢(shì),還將完成更多的技術(shù)創(chuàng)新和突破,將語(yǔ)音應(yīng)用引向高潮,與眾多的開(kāi)發(fā)廠商和用戶共贏語(yǔ)音未來(lái)!
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接: