東進(jìn)技術(shù)IBM VVT(Via Voice For Telephony)
2010/02/23
內(nèi)容簡介:
針對電話應(yīng)用進(jìn)行特殊優(yōu)化,采用美國IBM公司的ViaVoice Telephony技術(shù),IBM VVT中文語音產(chǎn)品提供語音識別、語音合成功能,支持中文
。ê嗴w漢字)、英語等語言,使系統(tǒng)開發(fā)人員可以方便地在電話通訊系統(tǒng)及網(wǎng)絡(luò)平臺上集成中文語音功能。中文語音識別(ASR-Automatic Speech Recognization),是CTI中的一項(xiàng)核心技術(shù),能夠?yàn)檎Z音門戶、電子商務(wù)、呼叫中心、電話通訊系統(tǒng)
提供中文語音交互界面。IBM VVT提供開放式的語音識別引擎和一系列應(yīng)用工具,使語音識別功能可以被方便地集成到CTI系統(tǒng)中.
中文語音識別 ASR的性能特點(diǎn):
與說話人無關(guān):任何人都可以使用。
高識別率:內(nèi)部的語音識別引擎是使用真實(shí)的電話信道語音數(shù)據(jù)訓(xùn)練得到的,在正常的電話信道(包括手機(jī)或普通電話)的噪音下有很高的識別率。
無限詞匯量:由于語音識別內(nèi)核是比基本音節(jié)還要小的單元,所以開發(fā)人員定義的任何詞表,它都可以很好的辨識。
連續(xù)發(fā)音:使用者不需要在詞匯間有任何停頓,就可以同系統(tǒng)連續(xù)交談。
多語種支持:在中文普通話和粵語之外,同時支持美國英語、英國英語、法語、德語。
多候選集的輸出:能夠輸出不同的候選結(jié)果相似度得分。
支持聲學(xué)加詞:說話人只需要輸入語音信號即可完成加詞。
支持語音合成:能夠從文字直接生成高自然度、高清晰度、高可懂度的語音。
信道自適應(yīng):可以自動適應(yīng)不同信噪比的電話信道。
自然語言理解模塊:提供更加人性化的人-機(jī)對話接口。
出色的可伸縮性:提供從小型辦公室到企業(yè)級電話語音系統(tǒng)解決方案,小到單機(jī)系統(tǒng),大到可靈活組合的客戶服務(wù)器模式,更提供全自動的動態(tài)負(fù)載平衡,讓您有限的投入能夠獲得更高的效能。
語音識別技術(shù)在CTI系統(tǒng)中的應(yīng)用優(yōu)勢
拓展了輸入信息的廣泛性,使用語音命令替代DTMF按鍵操作。
極大減少語音菜單的層次:傳統(tǒng)的電話語音應(yīng)用,使用多層次的菜單,使用起來非常不方便。采用語音識別技術(shù),可以捕捉用戶說話中的關(guān)鍵字,自動導(dǎo)向合適的功能,整個系統(tǒng)的菜單深度就可以大大降低。
增加了語音流程的靈活性,可以非常靈活的在各個子菜單之間切換。
方便用戶使用,比如在證券電話應(yīng)用中,用戶可以直接說出股票名字,而不再需要記憶股票代碼。
取代人工操作,降低服務(wù)成本。
體系結(jié)構(gòu)與部署
IBM ViaVoice For Telephony是一套工作于客戶/服務(wù)器/集群模式下的軟件系統(tǒng)。
可以同時為多個電話通道提供服務(wù)。
支持多路并發(fā)工作同時為多條電話線路提供語音識別服務(wù)。
支持客戶服務(wù)器模式:可以將執(zhí)行傳統(tǒng)的電話語音流程的應(yīng)用系統(tǒng)作為客戶機(jī),使用專門的服務(wù)器提供語音識別的計算。
支持基于局域網(wǎng)的自動負(fù)載平衡:允許在網(wǎng)絡(luò)上同時分布多臺語音識別服務(wù)器,系統(tǒng)自動尋找負(fù)載最輕的服務(wù)器,向它提交服務(wù),保證系統(tǒng)工作效率達(dá)到最優(yōu)。
支持自動故障恢復(fù)冗余:在網(wǎng)絡(luò)上存在多臺服務(wù)器時,如果有一臺服務(wù)器癱瘓,系統(tǒng)能夠自動跳過不可用的服務(wù)器,系統(tǒng)可能會因此變得反應(yīng)速度比較慢,但是不會癱瘓。
支持單機(jī)模式:對于小型系統(tǒng),可以采用簡單的單機(jī)模式進(jìn)行工作,從編程方面來說,單機(jī)模式與客戶/服務(wù)器或者集群方式?jīng)]有區(qū)別。
系統(tǒng)運(yùn)行硬件環(huán)境
IBM兼容PC,Intel PII 300MHz或更高,128M內(nèi)存或更高
D系列語音卡
支持的操作系統(tǒng)
Windows NT4.0
Windows 2000
開發(fā)接口
Visual Basic
C (Visual C++, Borland C++ ……)
Delphi
Visual FoxPro
Power builder
其它支持COM接口的開發(fā)平臺
軟件工具
豐富的范例程序源代碼
產(chǎn)品應(yīng)用
語音門戶(Voice Portal Platform)
電信與互聯(lián)網(wǎng)服務(wù)提供商
交互式語音應(yīng)答系統(tǒng)(IVR)
呼叫中心(Call Center)
旅游、交通、民航查詢系統(tǒng)
銀行、金融、保險、證券電話委托系統(tǒng)
信息臺/傳呼臺
企業(yè)114(機(jī)器人話務(wù)員)
CTI論壇報道
相關(guān)閱讀: