欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁 > 技術 > 技術文摘 > 合成語音走向商用化

合成語音走向商用化

2001-08-02 00:00:00   作者:   來源:   評論:0 點擊:


  7月18日,對于捷通華聲來說,是一個特別的日子。在這天,公司發(fā)布了最新的、語音質量自然的TTS(文本轉語音技術),吸引了CTI和相關應用領域的眾多廠商代表。

  在介紹捷通華聲的TTS技術之前,公司總經理張連毅先生不止一次談到當年北京市長熱線的建設情況。在當時,系統(tǒng)集成商考慮到市長熱線的內容會經常變化,如果采用錄音播放,可能在時間緊急時來不及重新錄音;如果采用TTS技術,只需改變文本內容,就簡單得多了。所以,集成商采用了TTS技術。未曾想,在系統(tǒng)驗收時,由于合成語音的質量差被否定,只好連夜找人重新錄音。張總說出了長期阻礙TTS技術商用的一個原因,就是合成的語音質量太差,不能為人們所接受。也因為此,捷通華聲為自己的新品推出組織了一個大型發(fā)布會,因為他們相信公司的TTS合成的語音質量自然、流利。而事實上,會前采用TTS技術播放的新聞,就被不少人誤認為是錄音播放。


  看到語音技術的前景,眾多IT巨頭和公司加入市場的逐角。僅僅在漢語識別和合成領域,就聚集了微軟、Intel、Motorola、IBM、PHILIPS、松下等公司。而作為一家民營企業(yè),捷通執(zhí)著地認為,漢語語音技術應該掌握在中國人自己手中,特別是在得知國內某家大型通信公司采用由以色列一家公司開發(fā)完成的中文語音合成技術,進行電話查詢及聲訊業(yè)務,而每一條電話線的技術使用費需要1萬元/年之后,他更是這樣認為。

  捷通為了加強在語音技術方面的研發(fā)實力,于去年聯(lián)合著名語音技術專家呂士楠先生,共同投資創(chuàng)辦了專門從事漢語語音技術研究和應用的捷通華聲語音公司。由呂先生親自主持捷通華聲語音研發(fā)中心,并在TTS技術上不斷創(chuàng)新。去年2月,捷通的TTS實現(xiàn)了中英文混讀的功能;去年5月,實現(xiàn)語音合成技術在嵌入式操作系統(tǒng)中的移植;今年7月,推出語音質量自然的語音合成系統(tǒng)。


  作為提供語音產品和平臺的廠商,捷通主要專注在三個領域:CTI領域、獨立軟件產品和嵌入式操作系統(tǒng)。由于公司TTS音庫大小可調節(jié),可應用于不同的系統(tǒng)。對于CTI等大型應用系統(tǒng),其語音庫約為2G 大小,語音質量較高,而且自然;對于PC應用,語音庫壓縮為1.5~2M,但語音質量沒有太大損傷,為PC個人用戶服務;對于嵌入式操作系統(tǒng)以及掌上終端應用,語音庫大小為1M。

  捷通TTS在CTI行業(yè)中的應用提供四種解決方案:電話智能語音中心、語音服務器方案、本地接口調用、離線合成。

  電話智能語音中心

  提供CTI可視化制作系統(tǒng),由維護端和監(jiān)視管理端兩部分組成,使用戶無需編程,就可完成簡單的、計算機電話語音集成功能。該方案適用于簡單的CTI應用,如中小企業(yè)的咨詢服務、統(tǒng)計調查,以及金融、工商、稅務、醫(yī)院等行業(yè)。

  TTS語音服務器方案

  直接提供裝載有捷通TTS語音服務系統(tǒng)的服務器,與現(xiàn)有的聲訊服務相平行,接受其指令和文字數據流,合成產生語音數據流返給原系統(tǒng),適用于電信、大型企業(yè)CTI系統(tǒng)及聲訊臺改造、升級,如160、168等聲訊臺、UMS統(tǒng)一信息服務系統(tǒng)、呼叫中心等。


  與其他文語轉換系統(tǒng)相比,捷通的TTS技術具有音庫壓縮特點,從而使TTS技術向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。同時,捷通TTS技術在大規(guī)模真實錄音語音庫的基礎上,增加了音庫壓縮算法和音色變換算法形成核心技術,音庫大小可縮擴,小音庫為1MB,適合基于嵌入式操作系統(tǒng)的應用。

  針對嵌入式系統(tǒng)的應用,捷通提供了TTS開發(fā)工具包CE版本,提供掌上電腦上的語音合成應用,即語音伴侶CE版本。

  在TTS技術的基礎上,捷通將以語音合成技術為核心,逐步發(fā)展語音識別、自然語言理解、模式識別等人工智能處理技術。

摘自中國計算機報

相關閱讀:

分享到: 收藏

專題