首頁>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

淺談TTS與CTI技術(shù)

2004/07/12

  CTI技術(shù)使電信和計算機相互融合,克服了傳統(tǒng)電信和計算機服務(wù)相對單一的缺點,將兩者完美結(jié)合了起來。其應(yīng)用領(lǐng)域非常廣泛,任何需要語音、數(shù)據(jù)通信,特別是那些希望把計算機網(wǎng)與通信網(wǎng)結(jié)合起來完成語音數(shù)據(jù)信息交換的系統(tǒng)都會用到CTI技術(shù)。

TTS即語音合成技術(shù)(Text To Speech),它涉及聲學(xué)、語言學(xué)、數(shù)學(xué)信號處理技術(shù)、多媒體技術(shù)等多個學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項前沿技術(shù),實現(xiàn)把計算機中任意出現(xiàn)的文字轉(zhuǎn)換成自然流暢的語音輸出。

  TTS在CTI系統(tǒng)中可以應(yīng)用在IVR(交互式語音應(yīng)答)服務(wù)器上,以提供語音交互式平臺,為用戶電話來訪提供語音提示,引導(dǎo)用戶選擇服務(wù)內(nèi)容和輸入電話事務(wù)所需的數(shù)據(jù),并接受用戶在電話撥號鍵盤上輸入的信息,實現(xiàn)對計算機數(shù)據(jù)庫等信息資料的交互式訪問。

  在IVR中應(yīng)用TTS可以自動將文本信息轉(zhuǎn)換為語音文件,或者實時地將文本信息合成語音并通過電話發(fā)布。實現(xiàn)文本與語音自動雙向轉(zhuǎn)換,以達到人與系統(tǒng)的自動交互,隨時隨地為客戶服務(wù)。維護人員不必再人工錄音,只須將電子文檔引入系統(tǒng)中,系統(tǒng)可以自動將電子文檔轉(zhuǎn)換為語音信息播放給客戶。數(shù)據(jù)庫中存放的大量數(shù)據(jù),無需事先進行錄音,能夠隨時根據(jù)查詢條件查出并合成語音進行播報,從而大大減少了座席人員的工作負擔。

  那么應(yīng)如何將TTS功能附加到CTI應(yīng)用中呢?某些比較先進的交換平臺,已經(jīng)在交換機的內(nèi)部實現(xiàn)了TTS的功能,并作為標準接口的一部分對外提供,業(yè)務(wù)開發(fā)商只需要簡單的調(diào)用他們即可以在業(yè)務(wù)中使用該功能。

  對于未實現(xiàn)TTS功能的PBX,就需要業(yè)務(wù)開發(fā)商自己去選擇合適的平臺,在此基礎(chǔ)上進行二次開發(fā),即調(diào)用所選TTS平臺提供的標準接口,實現(xiàn)語音合成功能。

  目前CTI已經(jīng)成為全球發(fā)展最為迅猛的產(chǎn)業(yè)之一,每年以50%的速度增長,CTI如同計算機產(chǎn)業(yè)一樣是一個金字塔形的產(chǎn)業(yè)鏈,從上到下會以至少20倍的幅度增值。TTS作為一種誘人的新技術(shù),如果能很好的嵌入到增值業(yè)務(wù)的應(yīng)用中去,必將形成一個更好的應(yīng)用前景。

  杭州音通軟件有限公司是由國家教育部和浙江省人民政府聯(lián)辦并依托浙江大學(xué)而成立的高新技術(shù)公司,音通公司主要致力于計算機語音技術(shù)的研發(fā)并逐步開拓語音識別、語音流媒體傳輸?shù)绕渌Z音領(lǐng)域的研究。其核心技術(shù)(Intone_TTS)是具有自主知識產(chǎn)權(quán)的中文語音合成技術(shù),在由浙江省科技廳組織的鑒定中被專家一致鑒定為國內(nèi)領(lǐng)先地位,并已申請多項國家專利。

  Intone_TTS是一套把文本信息轉(zhuǎn)換為語音信息的開發(fā)工具包,為系統(tǒng)集成商、軟件開發(fā)商提供了完備的接口函數(shù)和編程示例,使用戶能夠靈活的進行調(diào)用,并集成到其它應(yīng)用系統(tǒng)中。接口需要語音合成運行庫的支持,適合多種開發(fā)環(huán)境。開發(fā)者可以根據(jù)具體的應(yīng)用場合進行選擇。

  它能夠?qū)λ械臐h字、英文、阿拉伯數(shù)字進行語音合成;
  支持繁體字及多音字的編輯;
  合成效果:自然、平滑;
  規(guī)范的函數(shù)調(diào)用接口,同時支持微軟SAPI的調(diào)用;支持同步調(diào)用和異步調(diào)用方式;
  支持PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多種語音格式;
  支持GB2312碼(簡體中文)、BIG5碼(繁體)、UNICODE碼;
  支持多路通道同時合成;
  支持Dialogic、東進、三匯等主流語音板卡;

杭州音通軟件公司供稿 CTI論壇編輯



相關(guān)鏈接:
2004年度國家科技成果重點推廣計劃捷通華聲榜上有名 2004-06-28
開放式語音架構(gòu)與新一代呼叫中心應(yīng)用 2004-04-23
自然語言理解技術(shù),智能信息服務(wù)的核動力 2004-04-19
有背景音樂,語音服務(wù)更好聽了 2004-04-13
蘋果為盲人推出語音界面 2004-04-09

分類信息:     文摘   技術(shù)_語音合成_文摘