科大訊飛InterPhonic 4.0語音合成系統(tǒng)新特性預(yù)覽
2005/06/20
安徽中科大訊飛公司作為業(yè)界領(lǐng)先的語音技術(shù)提供商,一直致力于為中文語音合成(TTS)行業(yè)提供最專業(yè)、最重要的技術(shù)﹑產(chǎn)品和標(biāo)準(zhǔn)。其中文語音合成技術(shù)在2003、2004連續(xù)兩年國家權(quán)威的技術(shù)評測中均以大比分領(lǐng)先于競爭對手,囊括了所有關(guān)鍵指標(biāo)第一名?拼笥嶏w公司的InterPhonic語音合成產(chǎn)品系列,自面世以來就以其自然流暢的合成效果、豐富靈活的產(chǎn)品功能和穩(wěn)定高效的產(chǎn)品質(zhì)量贏得廣大客戶的一致贊譽(yù),并成為目前中文語音合成市場的主流語音合成系統(tǒng)。2005年5月,科大訊飛公司正式發(fā)布了最新的語音合成系統(tǒng)InterPhonic
4.0,該產(chǎn)品在原產(chǎn)品版本基礎(chǔ)上效果又有了明顯提升,合成語音效果首次超過了一般自然人,相信該產(chǎn)品將會以一貫的品質(zhì)贏得更多客戶的認(rèn)可。其相對于目前市場應(yīng)用最多的科大訊飛去年發(fā)布的Interphonic3.0合成系統(tǒng)來說,除了繼續(xù)保持原有的優(yōu)質(zhì)效果外,還增添了許多更為個性化的新特性:
- 高質(zhì)量的語音合成效果
InterPhonic 4.0語音合成系統(tǒng)集訊飛公司多語種、多音色語音合成技術(shù)的優(yōu)勢于一身,在開放的多語種架構(gòu)下提供了對普通話、粵語、英文等多個語種的支持,同時也為用戶提供了包含沉穩(wěn)正式、活潑輕快、渾厚柔和的多種發(fā)音風(fēng)格,充分滿足了對語音合成技術(shù)日益增長的個性化和多語種需求。系統(tǒng)提供的"小燕"音色活潑親切,在服務(wù)類應(yīng)用中將帶給用戶更加人性化的體驗(yàn);"小美"音色甜美清新,提供高品質(zhì)的廣東話合成服務(wù);"小宇"男聲淳美渾厚,對中文和英文都能駕輕就熟。新提供的多引擎管理接口對不同語種的系統(tǒng)提供一致化的訪問接口,允許用戶在服務(wù)過程中動態(tài)切換使用的音庫,以取得更好的語音服務(wù)效果。
訊飛公司的語音合成系統(tǒng)在滿足客戶對合成語音準(zhǔn)確自然的要求之后,更加關(guān)注于向具有更強(qiáng)表現(xiàn)力的語音合成效果邁進(jìn)。InterPhonic
4.0系統(tǒng)能自動識別出文本中包含的疑問、感嘆句式,并通過語氣和語調(diào)在語音中表現(xiàn)出來,從而使合成語音擺脫了正式呆板的形象,給用戶更加人性化的感受。為有效提升廣東話合成效果,InterPhonic
4.0系統(tǒng)中補(bǔ)充了大量的口語化語料和處理規(guī)則,能將正式文本按照廣東話實(shí)際播報的口語化效果進(jìn)行轉(zhuǎn)化,從而使廣東話的合成更加貼近廣東、香港等地區(qū)實(shí)際應(yīng)用的需要。
- 細(xì)致周到的優(yōu)化方案
科大訊飛公司提供的語音產(chǎn)品一向與實(shí)際應(yīng)用緊密結(jié)合,以提供最優(yōu)質(zhì)的合成效果,最便捷多樣的應(yīng)用為己任,希望能提供給客戶更加完善,最具價值的語音合成解決方案。在InterPhonic
4.0語音合成產(chǎn)品中也體現(xiàn)了訊飛公司對應(yīng)用的一貫關(guān)注。對應(yīng)用中最重要的動態(tài)信息的合成方面,新一代合成技術(shù)在效果上有了質(zhì)的飛躍。在語音合成典型的銀行應(yīng)用環(huán)境下,數(shù)字和數(shù)值是合成的主要內(nèi)容,也是客戶關(guān)注的焦點(diǎn)。InterPhonic
4.0系統(tǒng)中針對數(shù)字?jǐn)?shù)值的合成進(jìn)行了專門的優(yōu)化,發(fā)音更加清晰飽滿、節(jié)奏感更強(qiáng),能使用戶不費(fèi)力的聽清記牢所播報的數(shù)字信息。InterPhonic
4.0也針對短語進(jìn)行了優(yōu)化,從而使系統(tǒng)在合成單獨(dú)的詞組和短句時,停頓更加合理,語氣更加舒緩自然。經(jīng)過優(yōu)化之后的數(shù)字?jǐn)?shù)值、短語人名等合成效果更加自然、流暢,完全可以達(dá)到以假亂真的程度。
- 全面完善的功能特性
在目前統(tǒng)一消息、智能網(wǎng)等平臺,語音郵件等業(yè)務(wù)中,客戶都有將電子郵件內(nèi)容或者Internet上共享信息資源合成為語音的需求。InterPhonic
4.0產(chǎn)品充分考慮了客戶的應(yīng)用要求,能夠解析MIME格式的Email文本,將MIME格式中的無用信息過濾,把Email中的主題、發(fā)件人、收件人、內(nèi)容和文本附件等信息自動提取出來,從而將用戶最關(guān)心的內(nèi)容合成為語音。系統(tǒng)還支持了URI合成的功能,在用戶輸入需要合成的URI鏈接時,能主動從Internet下載文本內(nèi)容,從而更方便了網(wǎng)絡(luò)上信息資源的使用。
在語音應(yīng)用開發(fā)中,為了系統(tǒng)的獨(dú)立性和擴(kuò)展性,Client/Server方式的體系結(jié)構(gòu)一向是客戶的首選。InterPhonic 4.0產(chǎn)品提供了新的網(wǎng)絡(luò)語音服務(wù)平臺ISP,該平臺改進(jìn)了原有網(wǎng)絡(luò)服務(wù)程序的功能,能提供更加豐富靈活的服務(wù)。ISP平臺采用通用的TCP/IP網(wǎng)絡(luò)通訊協(xié)議和集中式的資源管理機(jī)制,形成客戶端-資源管理器-服務(wù)器有機(jī)結(jié)合的三層結(jié)構(gòu),提供動態(tài)負(fù)載均衡功能,系統(tǒng)架構(gòu)靈活可伸縮。ISP平臺加強(qiáng)了網(wǎng)絡(luò)各組件的管理維護(hù)功能,能遠(yuǎn)程查看和控制各組件的運(yùn)行狀態(tài),并且能自動恢復(fù)組件的不正常狀態(tài),其穩(wěn)定性和可用性經(jīng)受了眾多大規(guī)模實(shí)際應(yīng)用的檢驗(yàn),確保提供值得信賴的7×24小時不間斷自動化語音服務(wù)。
InterPhonic 4.0做為語音市場新一代動力引擎,是一款在合成效果和應(yīng)用特性上都有重大提升的新一代語音合成系統(tǒng),它的推出代表中文語音合成產(chǎn)品達(dá)到一個新的高度,合成技術(shù)的飛速進(jìn)步將推動語音應(yīng)用進(jìn)入令人激動的一個新的時代。
InterPhonic 4.0語音合成效果演示
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接: