首頁>>廠商>>語音板卡開發(fā)商>>Aculab

Aculab的TTS(文語轉換)技術

2004/04/28

  Aculab的V3.0版TTS性能明顯提升,包括對W3C標準語音合成標記語言(SSML)的支持、對新增的巴西葡萄牙語和意大利語的支持以及更新的英國英語男聲和西班牙語的女聲、對所有支持語言發(fā)音和韻律的改善處理,以及發(fā)聲字典工具的提供。Aculab的基于主機TTS,采用的是完全可伸縮的、運行快速且準確的波形拼接語音合成算法,具有占用內(nèi)存小、通道容量大和采用客戶機/服務器結構等特點。

  Aculab的TTS和Prosody DSP資源卡一起工作。Prosody板卡除了擔當合成的音頻信號放音功能外,還能同時啟動其他DSP資源的運行。據(jù)此,開發(fā)商可以采用Aculab的統(tǒng)一API,把TTS`、語音識別及其他不同的語音處理算法結合起來,從而提高語音增值業(yè)務的性能。當和Prosody板卡一起使用時,TTS可以在Aculab的網(wǎng)站上免費下載。

語音技術

  隨著近來語音和語言處理技術的快速發(fā)展,采用Aculab TTS和Prosody板卡可以創(chuàng)建更為復雜的、具有創(chuàng)新意義的應用解決方案,來滿足多元化市場的需求。例如,用戶接通統(tǒng)一消息應用后,就可以用電話訪問并聽取具有電子格式的文本消息。這類應用對于那些不在辦公室、卻又需要及時收取電子郵件的人來講意義非凡。在呼叫中心環(huán)境里,采用TTS可以把文字信息念給呼叫用戶聽,企業(yè)或其他機構可以在不增加業(yè)務人員的前提下,改善客服的質(zhì)量。

  這類語音應用都需要把文字信息念出來,在文字信息頻繁更新或預先錄制語音成本過于昂貴的情況下,TTS的價值尤其顯著。

  Acualb TTS技術是因此類應用應運而生的。他的獨特之處是在技術開發(fā)過程中已充分考慮到了電話網(wǎng)絡帶來的局限,如有限的帶寬、嘈雜的電話接聽環(huán)境以及應用對高通道密度的需求。Aculab的TTS即使在處理很長的文本段落時,也能合成出一致性強和智能化的電話語音。

TTS系統(tǒng)結構

  Aculab的TTS和Prosody板卡配合使用,無論是PCI還是cPCI格式的Prosody板卡都能通過E1或T1網(wǎng)絡接口輸出合成的語音信號。這個TTS軟件和任何一種Aculab的、支持64Kbit/s速率放音的語音算法固件都兼容。Aculab的TTS也可以在一個DSP處理器內(nèi),同時運行其他語音處理算法,如錄音、回波抵消,以支持語音識別所需的"barge-in"。

  所有這一切意味著:開發(fā)商可以受益于多種Prosody語音技術的靈活組合,來構建可靠性強的、高性能的和可擴展的應用系統(tǒng)。

SSML支持

  Aculab現(xiàn)在支持W3C的SSML標準,更進一步地提高了應用中的靈活性。

  允許在給定的文本內(nèi)進行語音學標注,可以為易于混淆的詞提供正確的發(fā)音,如:把"Smyth"讀成"Smith"而不是"Smythe"。

  SSML標準提供的標記能改善文本預處理的性能。加上簡單的標記,就可以很容易地判定數(shù)字1956是讀成年份、整型數(shù)還是一個數(shù)字串。

  有了對SSML的支持,Aculab的TTS可以在文本內(nèi)改變聲音或語言特性,并能控制基頻、語音速率、停頓和重音等。當合成的和預錄的語音混合使用,或需要為特定的聽眾定制聲音播放時,這些特性更有用。

通道容量

  TTS應用里,文本需要通過電話線路傳輸然后讀出來,所以應用中要考慮一些特殊的因素:包括中繼線的數(shù)量、DSP的處理能力以及主機負載和處理能力等。采用基本的Intel Pentium III / 700MHz的客戶機,配合具有兩個DSP處理器和PM4模塊的Prosody板卡,就可以利用Aculab的TTS輕松地同時向120個呼叫用戶播放根據(jù)文本轉換來的語音。所以,開發(fā)商可以放心地實施高密度的語音解決方案,來提高競爭能力。

特性總結

·支持的語言
  可以動態(tài)改變。支持的語言包括:英國英語、美國英語、法語、德語、歐洲西班牙語、巴西葡萄牙語、意大利語和拉丁美洲西班牙語等。

·聲音變化
  每種語言都有預配置的聲音類型。Aculab的新版TTS允許開發(fā)商選擇多達十種的語音變種。

·操作系統(tǒng)
  支持Windows NT 4.0,Windows XP/2000,Linux和Sun SPARC Solaris等。

·免費的許可證
  不收取按通道計算的使用許可證費用,可以隨時隨地在Aculab網(wǎng)站上下載。

·文本輸入格式
  Unicode和XML / SSML。

·E-mail預處理
  這是一個可選的模塊,用來處理e-mail里特定的文本,如郵件地址、消息頭和URL等。V3.0 TTS擴充了這部分功能,使得e-mail消息的處理更加自然和準確。

·文本的歸一化
  鑒別和適當擴充某些特殊文本域,包括日期、時間、貨幣、銀行賬號、電話號碼、縮略語以及一些標點符號(如引號、括號、星號等)。

·語調(diào)、重音和間隔
  由于Aculab的TTS采用了更為復雜的語言模型來提高合成聲音的自然度和韻律特征,所以這些指標都有顯著改善。合成的語音能準確地依參數(shù)而改變,確保了合成語音的可懂度。

·詞典管理
  為了滿足開發(fā)商調(diào)整發(fā)音或增加新詞的需要,Aculab開發(fā)了具有圖形用戶界面、和平臺無關(Java)的詞典管理器。新版的此工具能用TTS把輸入字典的詞語讀出來。

·采樣率
  和電話帶寬相應,TTS合成系統(tǒng)采用8KHz的采樣率。

·向兼容
  采用TTS API,可以方便地控制音量、基頻和語音速率等。新增的SSML特性能更有力地控制這些TTS輸出涉及的語音特性。

Aculab公司供稿 CTI論壇編輯



相關鏈接:
Aculab增強對Asterisk商業(yè)版的支持 2006-11-21
信令與媒體網(wǎng)關GroomerII的卓越IP和SS7處理能力 2006-11-17
Aculab產(chǎn)品的七號信令監(jiān)控功能 2006-10-11
Aculab公司的最新產(chǎn)品研發(fā) 2006-09-19
Aculab發(fā)布最新產(chǎn)品——Prosody X PCIe板卡 2006-09-14

分類信息:     技術_語音板卡_新聞   技術_語音板卡_文摘