首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>> 捷通華聲

捷通華聲語(yǔ)音合成(jTTS)技術(shù)介紹及解決方案

2002/09/01

一、 捷通華聲TTS(jTTS)介紹

1. 捷通華聲TTS技術(shù)文語(yǔ)轉(zhuǎn)換的基本原理

捷通TTS技術(shù)文語(yǔ)轉(zhuǎn)換的基本結(jié)構(gòu):

  語(yǔ)言學(xué)處理在文語(yǔ)轉(zhuǎn)換系統(tǒng)中起著重要的作用,他主要是模擬人對(duì)自然語(yǔ)言的理解過(guò)程--文本規(guī)整、詞的切分、語(yǔ)法分析和語(yǔ)義分析,使計(jì)算機(jī)對(duì)輸入的文本能完全理解,并給出后兩部分所需要的各種發(fā)音提示。

  韻律處理的目的是為合成語(yǔ)音規(guī)劃出音段特征,如音高、音長(zhǎng)和音強(qiáng)等,使合成語(yǔ)音能正確表達(dá)語(yǔ)意,聽起來(lái)更加自然悅耳。

  聲學(xué)處理的主要功能是根據(jù)前兩部分處理結(jié)果的要求輸出語(yǔ)音,即合成語(yǔ)音。

2. 捷通華聲TTS的特點(diǎn)

  捷通華聲公司在2001年7月完成了最新版本的捷通華聲TTS核心。新版本基于大規(guī)模真實(shí)錄音的語(yǔ)音庫(kù),音庫(kù)提供的樣本多,選音范圍大,可選擇到更匹配的發(fā)音,另外,在選音和拼接時(shí)將超越了音節(jié)的層次,能夠進(jìn)行詞甚至短句層次的拼接。因此,在自然度、可懂度方面捷通華聲新TTS具有較大的提高。再加上英文單詞的音色與中文保持一致,可支持GBK字庫(kù)中的所有字符的發(fā)音,新的捷通華聲TTS技術(shù)的合成的語(yǔ)音幾乎達(dá)到自然說(shuō)話的效果。

3. 捷通華聲TTS的進(jìn)一步發(fā)展方向

  捷通華聲TTS將在下面幾個(gè)方向發(fā)展:

二、 捷通華聲TTS技術(shù)(jTTS)在CTI領(lǐng)域中的應(yīng)用

  捷通華聲TTS技術(shù)在CTI行業(yè)中的應(yīng)用提供三種解決方案:本地接口調(diào)用方案、語(yǔ)音服務(wù)器方案、離線合成方案。

1. 捷通華聲TTS本地接口調(diào)用方案(jTTS SDK)

方案概論:

  本地接口調(diào)用方案提供捷通華聲TTS開發(fā)工具包(jTTS-SDK)可使用戶在其開發(fā)的系統(tǒng)中加入語(yǔ)音合成的功能。jTTS-SDK是基于Win32(32位Windows環(huán)境,包括Windows95/98/2000/NT)平臺(tái)下的開發(fā)工具包,因此這種方案要求使用方的聲訊服務(wù)系統(tǒng)所運(yùn)行的是32 位Windows環(huán)境的服務(wù)器,并且需要對(duì)使用方系統(tǒng)進(jìn)行部分程序的改造。該方案適用于要求使用方具有二次開發(fā)能力的集成和應(yīng)用商。


本地接口調(diào)用方案架構(gòu)圖

2. 捷通華聲TTS語(yǔ)音服務(wù)器方案 (jTTS Service )

方案概論:

  語(yǔ)音服務(wù)器方案直接提供裝載有捷通華聲TTS語(yǔ)音服務(wù)系統(tǒng)的高性能的服務(wù)器,它與現(xiàn)有的聲訊服務(wù)相平行,接受其指令和文字?jǐn)?shù)據(jù)流,合成產(chǎn)生語(yǔ)音數(shù)據(jù)流返給原系統(tǒng),適用于電信、大型企業(yè)CTI系統(tǒng)及聲訊臺(tái)改造、升級(jí)。


語(yǔ)音服務(wù)器方案架構(gòu)圖

技術(shù)優(yōu)勢(shì):

1. 降低了客戶端機(jī)器的配置需求。
2. 通過(guò)TCP/IP協(xié)議實(shí)現(xiàn)了跨操作系統(tǒng)的語(yǔ)音合成服務(wù)功能,可以滿足非Win32平臺(tái)的需求。
3. 對(duì)于服務(wù)規(guī)模較大的系統(tǒng)可實(shí)現(xiàn)語(yǔ)音服務(wù)器的分布式工作方式,對(duì)客戶端的請(qǐng)求自動(dòng)調(diào)度,平衡負(fù)載,以達(dá)到更高的性能。

應(yīng)用領(lǐng)域:

  采用語(yǔ)音服務(wù)器方案可在不改變現(xiàn)有服務(wù)系統(tǒng)的條件下,平行地建立捷通華聲TTS語(yǔ)音服務(wù)器,安全、高效率地將原來(lái)的文本服務(wù)擴(kuò)大為文本-語(yǔ)音同時(shí)服務(wù),是大型、專業(yè)級(jí)的語(yǔ)音服務(wù)解決方案,并可跨平臺(tái)實(shí)現(xiàn)。捷通華聲TTS語(yǔ)音服務(wù)器方案可服務(wù)于160、168等聲訊臺(tái)、UMS統(tǒng)一信息服務(wù)系統(tǒng)、呼叫中心、語(yǔ)音郵件商、WAP網(wǎng)站、進(jìn)行網(wǎng)上播音的.com公司等。

3. 捷通華聲TTS離線合成方案(jTTS Builder)

方案概論:

  捷通華聲TTS離線合成方案提供離線合成工具,這是基于Microsoft Windows 95/98/NT/2000的獨(dú)立應(yīng)用程序,可提供離線的語(yǔ)音合成服務(wù),批量地將文字轉(zhuǎn)換為語(yǔ)音數(shù)據(jù)文件,適用于海量信息、相對(duì)穩(wěn)定或不要求實(shí)時(shí)轉(zhuǎn)化的聲訊服務(wù)場(chǎng)合,可以直接替代傳統(tǒng)的錄音方法,對(duì)原有系統(tǒng)完全無(wú)需改造,節(jié)省人力,提高效率。


離線合成方案系統(tǒng)架構(gòu)圖

三、 捷通華聲TTS(jTTS)在嵌入式操作系統(tǒng)下的應(yīng)用

  捷通華聲公司的TTS技術(shù)與其他文語(yǔ)轉(zhuǎn)換系統(tǒng)相比具有獨(dú)特的音庫(kù)壓縮特點(diǎn),使捷通華聲TTS技術(shù)向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。據(jù)市場(chǎng)調(diào)研及考證:捷通華聲公司是目前最早掌握該技術(shù),及最先提出在掌上電腦應(yīng)用該技術(shù)的公司。該系統(tǒng)在2001年中關(guān)村電腦節(jié)上榮獲十大"IT創(chuàng)新產(chǎn)品"。

  捷通華聲TTS技術(shù),以大規(guī)模真實(shí)錄音的語(yǔ)音庫(kù)為基礎(chǔ),增加音庫(kù)壓縮算法和音色變換算法形成核心技術(shù)。此核心技術(shù)與國(guó)內(nèi)其他文語(yǔ)轉(zhuǎn)換技術(shù)相比較,具有如下特點(diǎn):

· 系統(tǒng)輸出語(yǔ)音清晰度高。
· 系統(tǒng)輸出可懂度高。
· 輸出自然度基本與人正常說(shuō)話持平。
· 音庫(kù)大小可縮擴(kuò),小音庫(kù)僅為1MB。

  正是因?yàn)榻萃ㄈA聲TTS具有以上的特點(diǎn),使得捷通華聲公司的TTS技術(shù)可以向嵌入式操作系統(tǒng)移植。特別是小音庫(kù)的特點(diǎn),使得在嵌入式操作系統(tǒng)下不會(huì)占用太大的資源。

  詳細(xì)方案請(qǐng)參照捷通TTS在掌上電腦、信息家電等領(lǐng)域的解決方案

四、 捷通華聲TTS(jTTS)在語(yǔ)音網(wǎng)站中的應(yīng)用

  公司將捷通華聲TTS技術(shù)和流媒體(Streaming Media)技術(shù)相結(jié)合,開發(fā)設(shè)計(jì)了專門針對(duì)語(yǔ)音網(wǎng)站的全面技術(shù)解決方案,并在國(guó)內(nèi)率先推出了首家有聲網(wǎng)站,為網(wǎng)站的"有聲化"開創(chuàng)了先河。語(yǔ)音網(wǎng)站技術(shù)的推出,將使網(wǎng)站變得更加有聲有色,吸引更多網(wǎng)絡(luò)愛好者,使網(wǎng)絡(luò)更加貼近廣大用戶的生活。捷通華聲TTS技術(shù)在網(wǎng)站有聲化方面,具有極廣泛的應(yīng)用前景,特別適合用于為網(wǎng)民提供新聞、財(cái)經(jīng)、生活、文藝、 體育等各類有聲的信息服務(wù)。

  詳細(xì)方案請(qǐng)參照捷通華聲語(yǔ)音網(wǎng)站解決方案

五、 捷通華聲TTS(jTTS)在桌面產(chǎn)品中的應(yīng)用

  利用捷通華聲TTS技術(shù)可開發(fā)辦公、教學(xué)、娛樂等智能多媒體應(yīng)用軟件,使這些軟件增加了"說(shuō)"的功能,豐富軟件的內(nèi)涵。目前公司利用TTS開發(fā)應(yīng)用軟件產(chǎn)品有:"錄易漢語(yǔ)智能輸入輸出系統(tǒng)"、"捷通聽霸"。在"錄易漢語(yǔ)智能輸入輸出系統(tǒng)"中利用TTS做為智能輸入后的語(yǔ)音校對(duì),是國(guó)內(nèi)第一家將TTS技術(shù)與智能輸入技術(shù)相結(jié)合的廠商。在"捷通聽霸"軟件中利用語(yǔ)音合成技術(shù)實(shí)現(xiàn)了閱讀電子文檔、鍵盤輸入時(shí)的即時(shí)語(yǔ)音校對(duì)、語(yǔ)音鬧鐘、卡通角色說(shuō)話的功能。

  應(yīng)用案例請(qǐng)參考《捷通聽霸TB 3000》產(chǎn)品介紹

六、 成功案例

  捷通華聲TTS技術(shù)自推出以來(lái),已成功地在電信、證券等行業(yè)中得到了廣泛的應(yīng)用,并已進(jìn)入臺(tái)灣市場(chǎng),其中典型的案例包括:

· 鐵通-中鐵綜合信息服務(wù)網(wǎng)(CRIS-China Railway Information System)
· 賽迪呼叫中心
· 博時(shí)基金客戶服務(wù)中心
· 臺(tái)灣中華電信呼叫中心
· 天津移動(dòng)呼叫中心
· 大連國(guó)泰君安證券平臺(tái)系統(tǒng)
· 大連大開信證券平臺(tái)系統(tǒng)
· 深圳市政府紀(jì)委電話咨詢系統(tǒng)
· 福建省179平臺(tái)
· 美國(guó)奧維平臺(tái)系統(tǒng)