長期以來,關(guān)于語音識別準確率這一硬性技術(shù)指標,業(yè)界給客戶的感覺總是支支吾吾,模棱兩可。很多語音技術(shù)供應商在這項指標上要么標榜達到96%甚至98%的識別準確率,但實際部署的系統(tǒng)遠遠達不到這個指標或者這個指標只是針對碼本非常小的系統(tǒng)(數(shù)百個碼本容量)而言。這種狀況很容易造成用戶對目前語音識別技術(shù)的誤解。特別是,現(xiàn)實情況中,有很多的語音技術(shù)供應商由于本身技術(shù)的不過硬,造成實際部署的系統(tǒng)語音識別準確率較低,難以令用戶滿意,間接對該技術(shù)的推廣造成了負面影響。
正是針對這種情況,也本著對客戶負責的理念,上;⒂嵭畔⒖萍加邢薰揪慕M織實施了對這一指標的實際測試。為了體現(xiàn)測試結(jié)果的可信性、實用性,基立訊對碼本容量、測試數(shù)據(jù)、測試人樣本等等因素進行了綜合考慮。實際測試系統(tǒng)在碼本容量的設置上全部超過6000條記錄;在測試數(shù)據(jù)的選擇上采用從互聯(lián)網(wǎng)隨機下載真實姓名以反映真實的用戶數(shù)據(jù);在測試人樣本上盡量考慮不同地域、不同性別和不同年齡的測試人,測試人樣本覆蓋全國絕大部分省市口音的男、女人員,同時測試人年齡限制在18-55歲的群體以反映語音識別技術(shù)最廣泛的目標用戶群。
值得一提的是,測試數(shù)據(jù)中有非常多的姓名要么極其相近、要么發(fā)音即使真人都很難區(qū)分,是非常具有挑戰(zhàn)性的測試數(shù)據(jù)。但即使這樣,jTalk語音總機和語音撥號系統(tǒng)在采用先進的語音采集和處理方法和獨特的N-Best結(jié)果分析處理算法后,不但有效提高了系統(tǒng)總體使用的語音識別準確率,同時也增加了系統(tǒng)不用多選直接得到識別結(jié)果的概率,也降低了碼本外詞匯的誤識別率,使jTalk語音總機和語音撥號系統(tǒng)用戶使用總體感受非常準確又很方便。
測試結(jié)果
經(jīng)過上百例的實際測試,基立訊jTalk語音總機和語音撥號系統(tǒng)得到的一次語音識別準確率平均在93%左右,二次語音識別準確率平均超過97%。也就是說,對于碼本在1萬個的情況下,用戶在說了一次姓名后,系統(tǒng)返回的結(jié)果中包含正確結(jié)果的概率約為93%,但如果用戶是說了2遍,那么用戶有97%以上的可能性會得到系統(tǒng)正確的識別結(jié)果響應。其實,根據(jù)測試,對很多白領(lǐng)而言,只有1%稍多一點的姓名是用戶在2次呼叫后都無法得到正確返回結(jié)果的,也就是說,對絕大多數(shù)的潛在白領(lǐng)語音識別用戶,2次呼叫之內(nèi)達到98%以上的識別結(jié)果準確率是完全現(xiàn)實的?紤]到測試人樣本中不乏有濃重口音的人,這樣的數(shù)據(jù)非常令人鼓舞。此外,這次測試也對系統(tǒng)一次識別不用N-Best選擇就返回正確結(jié)果的概率等其他參數(shù)進行了統(tǒng)計,得到了非常寶貴的權(quán)威數(shù)據(jù)。需要指出的是,如果運用jTalk語音總機和語音撥號平臺已經(jīng)集成的組合呼叫識別功能(例如,部門名+姓名,部門名+昵稱名等等),那么在2次呼叫內(nèi)系統(tǒng)有接近100%的概率返回用戶所呼叫的信息,這樣的測試結(jié)果完全說明基立訊語音識別產(chǎn)品在技術(shù)和應用上都處于國內(nèi)領(lǐng)先,完全可以達到大規(guī)模商業(yè)應用的要求。
基立訊jTalk語音總機和語音撥號系統(tǒng)除了具有業(yè)界最高的識別準確率外,還無縫集成了電話防火墻、來電轉(zhuǎn)接、留言信箱、號碼綁定、事件提醒、114按鍵樹型自動查號臺、號碼本管理、語音提示上載、節(jié)假日語音流程設置等等眾多實用功能,是企業(yè)電話通信的一站式解決方案。
通過這次權(quán)威的實際測試,基立訊得到了語音識別系統(tǒng)真實的識別率數(shù)據(jù),是目前國內(nèi)業(yè)界見到的公開的最權(quán)威也是最高的實際部署系統(tǒng)的識別準確率。
CTI論壇編輯