2001/08/10
一、 捷通TTS(jTTS)介紹
1.1. 捷通TTS技術(shù)文語轉(zhuǎn)換的基本原理
捷通TTS技術(shù)文語轉(zhuǎn)換的基本結(jié)構(gòu):
1.1.1. 語言學(xué)處理
----語言學(xué)處理在文語轉(zhuǎn)換系統(tǒng)中起著重要的作用,他主要是模擬人對自然語言的理解過程--文本規(guī)整、詞的切分、語法分析和語義分析,使計(jì)算機(jī)對輸入的文本能完全理解,并給出后兩部分所需要的各種發(fā)音提示。
1.1.2. 韻律處理
----韻律處理的目的是為合成語音規(guī)劃出音段特征,如音高、音長和音強(qiáng)等,使合成語音能正確表達(dá)語意,聽起來更加自然悅耳。
1.1.3. 聲學(xué)處理
----聲學(xué)處理的主要功能是根據(jù)前兩部分處理結(jié)果的要求輸出語音,即合成語音。
1.2. 捷通TTS的特點(diǎn)
捷通公司的TTS技術(shù)(jTTS),是具有自我版權(quán)的TTS技術(shù),以大規(guī)模真實(shí)錄音的語音庫為基礎(chǔ),采用多樣本、不等長言語段波形拼接技術(shù),增加音庫壓縮算法和音色變換算法形成核心技術(shù),發(fā)音清晰流利、自然度高。
捷通TTS在文本到語音的轉(zhuǎn)換過程中不是對文字到語音的簡單映射,還包括了對文字的理解,以及對語音的韻律處理。
捷通通過研究漢語的聲調(diào)、重音、語調(diào)的聲學(xué)特點(diǎn),設(shè)計(jì)了重音和語調(diào)的模擬。
捷通TTS在韻律規(guī)則方面,采用統(tǒng)計(jì)和規(guī)則相結(jié)合的方法,研究了漢語韻律規(guī)則并進(jìn)行了一定的韻律模擬工作,以韻律層級的匹配作為選音段的基本原則。
捷通TTS提供中英文混讀功能,嵌入中文內(nèi)部的常用單詞的音色與中文保持一致,更加自然流暢。
捷通TTS的音庫大小可調(diào)節(jié),能提供從PC、語音卡到掌上電腦TTS技術(shù)的全面解決方案?梢詫⒁魩旌统绦驂嚎s到共1.5M的水平,實(shí)現(xiàn)了在嵌入式系統(tǒng)上的應(yīng)用。
提供捷通TTS開發(fā)工具包(jTTS SDK),可以合成到聲卡,合成到文件,直接獲取語音流,支持多線程操作,支持GBK、BIG5字符集的文本閱讀。
其中音庫大小可調(diào)節(jié)的特點(diǎn)是捷通TTS能夠移植到掌上電腦等嵌入式設(shè)備的關(guān)鍵特點(diǎn),也是捷通TTS獨(dú)具的優(yōu)點(diǎn)。
----捷通公司在2001年7月完成了最新版本的捷通TTS技術(shù)。新版本基于大規(guī)模真實(shí)錄音的語音庫,音庫提供的樣本多,選音范圍大,可選擇到更匹配的發(fā)音,另外,在選音和拼接時(shí)將超越了音節(jié)的層次,能夠進(jìn)行詞甚至短句層次的拼接。因此,在自然度、可懂度方面捷通新TTS具有較大的提高。再加上英文單詞的音色與中文保持一致,可支持GBK字庫中的所有字符的發(fā)音,新的捷通TTS技術(shù)的合成的語音幾乎達(dá)到自然說話的效果。
......
網(wǎng)上全文:http://m.yh9t5.com/factory/tts/www.infoquick.com.cn/infoquick01_0803.htm
|