首頁>>廠商>>交換機(jī)/ACD系統(tǒng)平臺廠商>>東進(jìn)技術(shù)

東進(jìn)技術(shù)IBM VVT(Via Voice For Telephony)

2010/02/23



內(nèi)容簡介:

  針對電話應(yīng)用進(jìn)行特殊優(yōu)化,采用美國IBM公司的ViaVoice Telephony技術(shù),IBM VVT中文語音產(chǎn)品提供語音識別、語音合成功能,支持中文

 。ê嗴w漢字)、英語等語言,使系統(tǒng)開發(fā)人員可以方便地在電話通訊系統(tǒng)及網(wǎng)絡(luò)平臺上集成中文語音功能。中文語音識別(ASR-Automatic Speech Recognization),是CTI中的一項(xiàng)核心技術(shù),能夠?yàn)檎Z音門戶、電子商務(wù)、呼叫中心、電話通訊系統(tǒng)

  提供中文語音交互界面。IBM VVT提供開放式的語音識別引擎和一系列應(yīng)用工具,使語音識別功能可以被方便地集成到CTI系統(tǒng)中.

中文語音識別 ASR的性能特點(diǎn):

  與說話人無關(guān):任何人都可以使用。

  高識別率:內(nèi)部的語音識別引擎是使用真實(shí)的電話信道語音數(shù)據(jù)訓(xùn)練得到的,在正常的電話信道(包括手機(jī)或普通電話)的噪音下有很高的識別率。

  無限詞匯量:由于語音識別內(nèi)核是比基本音節(jié)還要小的單元,所以開發(fā)人員定義的任何詞表,它都可以很好的辨識。

  連續(xù)發(fā)音:使用者不需要在詞匯間有任何停頓,就可以同系統(tǒng)連續(xù)交談。
  多語種支持:在中文普通話和粵語之外,同時支持美國英語、英國英語、法語、德語。
  多候選集的輸出:能夠輸出不同的候選結(jié)果相似度得分。
  支持聲學(xué)加詞:說話人只需要輸入語音信號即可完成加詞。
  支持語音合成:能夠從文字直接生成高自然度、高清晰度、高可懂度的語音。
  信道自適應(yīng):可以自動適應(yīng)不同信噪比的電話信道。
  自然語言理解模塊:提供更加人性化的人-機(jī)對話接口。
  出色的可伸縮性:提供從小型辦公室到企業(yè)級電話語音系統(tǒng)解決方案,小到單機(jī)系統(tǒng),大到可靈活組合的客戶服務(wù)器模式,更提供全自動的動態(tài)負(fù)載平衡,讓您有限的投入能夠獲得更高的效能。

語音識別技術(shù)在CTI系統(tǒng)中的應(yīng)用優(yōu)勢

  拓展了輸入信息的廣泛性,使用語音命令替代DTMF按鍵操作。

  極大減少語音菜單的層次:傳統(tǒng)的電話語音應(yīng)用,使用多層次的菜單,使用起來非常不方便。采用語音識別技術(shù),可以捕捉用戶說話中的關(guān)鍵字,自動導(dǎo)向合適的功能,整個系統(tǒng)的菜單深度就可以大大降低。

  增加了語音流程的靈活性,可以非常靈活的在各個子菜單之間切換。

  方便用戶使用,比如在證券電話應(yīng)用中,用戶可以直接說出股票名字,而不再需要記憶股票代碼。

  取代人工操作,降低服務(wù)成本。

體系結(jié)構(gòu)與部署

  IBM ViaVoice For Telephony是一套工作于客戶/服務(wù)器/集群模式下的軟件系統(tǒng)。

  可以同時為多個電話通道提供服務(wù)。

  支持多路并發(fā)工作同時為多條電話線路提供語音識別服務(wù)。

  支持客戶服務(wù)器模式:可以將執(zhí)行傳統(tǒng)的電話語音流程的應(yīng)用系統(tǒng)作為客戶機(jī),使用專門的服務(wù)器提供語音識別的計算。

  支持基于局域網(wǎng)的自動負(fù)載平衡:允許在網(wǎng)絡(luò)上同時分布多臺語音識別服務(wù)器,系統(tǒng)自動尋找負(fù)載最輕的服務(wù)器,向它提交服務(wù),保證系統(tǒng)工作效率達(dá)到最優(yōu)。

  支持自動故障恢復(fù)冗余:在網(wǎng)絡(luò)上存在多臺服務(wù)器時,如果有一臺服務(wù)器癱瘓,系統(tǒng)能夠自動跳過不可用的服務(wù)器,系統(tǒng)可能會因此變得反應(yīng)速度比較慢,但是不會癱瘓。

  支持單機(jī)模式:對于小型系統(tǒng),可以采用簡單的單機(jī)模式進(jìn)行工作,從編程方面來說,單機(jī)模式與客戶/服務(wù)器或者集群方式?jīng)]有區(qū)別。

系統(tǒng)運(yùn)行硬件環(huán)境

IBM兼容PC,Intel PII 300MHz或更高,128M內(nèi)存或更高
D系列語音卡

支持的操作系統(tǒng)
Windows NT4.0
Windows 2000

開發(fā)接口
Visual Basic
C (Visual C++, Borland C++ ……)
Delphi
Visual FoxPro
Power builder

其它支持COM接口的開發(fā)平臺

軟件工具
豐富的范例程序源代碼

產(chǎn)品應(yīng)用

語音門戶(Voice Portal Platform)
電信與互聯(lián)網(wǎng)服務(wù)提供商
交互式語音應(yīng)答系統(tǒng)(IVR)
呼叫中心(Call Center)
旅游、交通、民航查詢系統(tǒng)
銀行、金融、保險、證券電話委托系統(tǒng)
信息臺/傳呼臺
企業(yè)114(機(jī)器人話務(wù)員)

CTI論壇報道



相關(guān)閱讀:
DJ-TTS東進(jìn)中文TTS(文語轉(zhuǎn)換)系統(tǒng)軟件及開發(fā)平臺 2010-02-23
2線USB錄音盒(D081U-2) 2010-02-23
4線USB錄音卡(D081U-4) 2010-02-23
4線EM中繼語音模塊 2010-02-23
2線EM中繼語音模塊 2010-02-23