首頁>>廠商>>語音板卡開發(fā)商>>杭州三匯

TTS與語音識別軟件

2001/12/17

  TTS(text to speech),又稱為文語轉(zhuǎn)換或機器朗讀系統(tǒng)。

  ASR(Automatic Speech Recognization)又稱語音識別系統(tǒng)。

  三匯公司最早于1995年開發(fā)成功第一代漢字語音庫,該語音庫采用真人錄音,并附加了漢字文本與相應(yīng)語音之間的檢索表,可以實現(xiàn)簡單的TTS應(yīng)用。1999年三匯與IBM公司合作,成為IBM中文語音識別系統(tǒng)在國內(nèi)最早的推廣應(yīng)用者。

  三匯關(guān)于中文TTS和語音識別的軟件產(chǎn)品有:

漢字語音庫

  真人發(fā)音,支持全部的漢字發(fā)音,并提供二級字符內(nèi)碼與語音庫偏移量的索引表?捎糜诤唵蔚腡TS應(yīng)用,例如播放數(shù)字、人名、地名、股票名稱等。提供C語言編程示例源代碼,適用于任何操作系統(tǒng)和任何語音卡。

中文TTS系統(tǒng)

  完整的中文TTS系統(tǒng),具有海量詞庫,能正確識別多音字,能正確掌握朗讀的語調(diào)和節(jié)奏。采用可選的男聲或女聲真人發(fā)音,可調(diào)的音量、語速和語調(diào),具有較好的真實感,主觀可懂度大于99%。適用于IVR系統(tǒng)的語音提示,有聲EMAIL系統(tǒng),大容量新聞信息發(fā)布等應(yīng)用,可以省去繁瑣的預先錄音工作,支持全部型號的三匯語音卡。

  系統(tǒng)可工作于預先合成和實時動態(tài)合成兩種方式,采用客戶/服務(wù)器結(jié)構(gòu)支持多通道大容量系統(tǒng)。

  支持操作系統(tǒng):

  WINDOWS NT 4.0

  WINDOWS 2000

  使用編程工具:

  VB、VC、BC、VF、PB、DELPHI等,提供豐富的編程序查源代碼。

IBM Viavoice Telephoney中文電話語音識別系統(tǒng)

  三匯語音卡為國內(nèi)最早集成IBM ViaVoice Telephony語音識別系統(tǒng)的公司,應(yīng)用最成熟,是IBM公司在國內(nèi)語音識別領(lǐng)域最重要的合作伙伴和系統(tǒng)經(jīng)銷商。所有三匯語音卡均支持IBM ViaVoice Telephony語音識別系統(tǒng),同時該系統(tǒng)也為使用者提供了一個開放式的語音識別引擎和完善的應(yīng)用開發(fā)環(huán)境,用戶可以方便快捷地在電話系統(tǒng)中集成語音識別功能,為聲訊服務(wù)系統(tǒng)、電子商務(wù)平臺和涉及電話通信的語音應(yīng)用系統(tǒng)提供語音交互界面。

  性能特點:

  ◆語音識別引擎采用實際電話信道的語音樣本,連續(xù)語音識別率高。

  ◆語音識別引擎沒有特定授話人的限制,對于各種不同信噪比的電話信道均具有很好的適應(yīng)性。

  ◆電話語音應(yīng)用系統(tǒng)伸縮性較強,不僅可以運行在單機系統(tǒng)上,而且可以擴展為多引擎、多服務(wù)器的大型企業(yè)級應(yīng)用。

  ◆語音合成自然清晰,易于理解。

  ◆語音識別引擎可以辨識無限量的詞匯表。

  ◆輸入語音即可添加詞匯,也可以在系統(tǒng)運行狀態(tài)下對詞匯集進行動態(tài)添加,添加方法靈活。

  ◆與硬件無關(guān)的C/C++應(yīng)用編程接口,可以方便地掛接語音識別引擎和語音合成引擎。

  ◆可以輸出不同候選結(jié)果及相似度得分。

杭州三匯公司供稿 CTI論壇編輯



相關(guān)鏈接:
ADI Blackfin推出適合三匯的VoIP電話和呼叫中心方案 2009-05-11
杭州三匯榮獲CIPCA 2008中國IP通信大獎 2008-10-08
三匯成功開發(fā)高性能真人接聽檢測算法助推外撥應(yīng)用 2008-08-26
三匯新一代C型傳真卡撼市登場 2008-05-15
三匯ATP-24A新型模擬錄音產(chǎn)品問世 2008-05-05