中科信利在電信級(jí)語(yǔ)音識(shí)別產(chǎn)業(yè)化方面取得突破性進(jìn)展
2004/12/16
電信級(jí)語(yǔ)音識(shí)別引擎產(chǎn)品由于其技術(shù)起點(diǎn)高,在面向應(yīng)用時(shí)需要解決的技術(shù)難點(diǎn)比較多,國(guó)內(nèi)的語(yǔ)音識(shí)別廠商一直難以實(shí)現(xiàn)真正產(chǎn)業(yè)化的突破,該領(lǐng)域一直被國(guó)外廠商所壟斷。2004年,通過(guò)對(duì)自身技術(shù)的不斷完善,以及與電信級(jí)系統(tǒng)集成商和運(yùn)營(yíng)商的通力合作,中科信利具有自主知識(shí)產(chǎn)權(quán)的分布式電話語(yǔ)音識(shí)別引擎已在國(guó)內(nèi)多個(gè)電信級(jí)項(xiàng)目中取得成功應(yīng)用,從而打破了國(guó)外廠商對(duì)該技術(shù)的壟斷局面, 實(shí)現(xiàn)了國(guó)內(nèi)語(yǔ)音識(shí)別廠商在產(chǎn)業(yè)化方面質(zhì)的突破。中科信利也正在迅速成為中文領(lǐng)域內(nèi)領(lǐng)先的語(yǔ)音識(shí)別軟件供應(yīng)商。
這些成功應(yīng)用的項(xiàng)目包括:北京移動(dòng)的個(gè)人秘書(shū)系統(tǒng),成都移動(dòng)的企業(yè)秘書(shū)系統(tǒng)、個(gè)人秘書(shū)系統(tǒng),重慶聯(lián)通的個(gè)人秘書(shū)系統(tǒng),河北聯(lián)通的個(gè)人秘書(shū)系統(tǒng),江蘇電信的個(gè)人秘書(shū)系統(tǒng),等等。
中科信利分布式語(yǔ)音識(shí)別引擎,其核心技術(shù)來(lái)源于中科院聲學(xué)研究所中科信利語(yǔ)音實(shí)驗(yàn)室,該實(shí)驗(yàn)室具有國(guó)際語(yǔ)音識(shí)別專(zhuān)家顏永紅研究員領(lǐng)銜的國(guó)際一流的研究團(tuán)隊(duì),具備雄厚的研發(fā)實(shí)力,目前在中文語(yǔ)音識(shí)別領(lǐng)域業(yè)界領(lǐng)先,贏得了自2003年以來(lái)政府組織的各次語(yǔ)音識(shí)別技術(shù)比賽。
中科信利公司以實(shí)驗(yàn)室技術(shù)為基礎(chǔ),致力于開(kāi)發(fā)實(shí)用的語(yǔ)音引擎產(chǎn)品。同時(shí)針對(duì)中文特點(diǎn)、應(yīng)用環(huán)境和客戶需求進(jìn)行特別優(yōu)化,可以廣泛適用于有線、無(wú)線和VoIP語(yǔ)音環(huán)境,即使在有噪音、背景聲或語(yǔ)音質(zhì)量較差的情況下也能保持較高的識(shí)別準(zhǔn)確率。中科信利公司能夠提供業(yè)界獨(dú)樹(shù)一幟的方言處理技術(shù)、語(yǔ)音標(biāo)記技術(shù)和個(gè)人口音自適應(yīng)技術(shù)。
中科信利公司自主開(kāi)發(fā)的分布式語(yǔ)音識(shí)別引擎,能夠提供語(yǔ)音識(shí)別服務(wù)器集群功能,提供具有高識(shí)別率、高可靠性、高度靈活的擴(kuò)展性及容錯(cuò)能力。它使電話用戶通過(guò)語(yǔ)音來(lái)訪問(wèn)數(shù)字信息成為可能。電信應(yīng)用增值服務(wù)商和互聯(lián)網(wǎng)應(yīng)用服務(wù)商可以利用中科信利先進(jìn)的語(yǔ)音識(shí)別技術(shù)來(lái)為其客戶提供更為快捷有效的服務(wù)。
具體來(lái)說(shuō),中科信利分布式語(yǔ)音識(shí)別引擎(TSRE3.0)在市場(chǎng)上的成功應(yīng)用得益于其如下特點(diǎn):
- 高可靠性和穩(wěn)定性
通過(guò)精心設(shè)計(jì)的客戶端/服務(wù)器架構(gòu),能夠支持成百上千路的語(yǔ)音識(shí)別應(yīng)用。資源管理服務(wù)器能夠均勻調(diào)度識(shí)別服務(wù)器,達(dá)到負(fù)載均衡,提高系統(tǒng)整體工作效率。當(dāng)識(shí)別服務(wù)器發(fā)生故障時(shí),系統(tǒng)能夠自動(dòng)判別,并將識(shí)別任務(wù)轉(zhuǎn)移到其他服務(wù)器。當(dāng)識(shí)別任務(wù)量增加時(shí),可以動(dòng)態(tài)增加服務(wù)器而無(wú)須停止原有的識(shí)別系統(tǒng)服務(wù)。因而系統(tǒng)具有強(qiáng)大的穩(wěn)定性、容錯(cuò)能力和可伸縮性,能夠滿足電信級(jí)應(yīng)用的需要。
- 具有穩(wěn)健的識(shí)別性能
語(yǔ)音模型是基于大量的不同場(chǎng)合,不同人群和不同口音的電話語(yǔ)音數(shù)據(jù)訓(xùn)練出來(lái)的,具有較好的環(huán)境適應(yīng)性。通過(guò)采用領(lǐng)先的算法模型,TSR3.0識(shí)別引擎具有較強(qiáng)的抗噪性能。同時(shí)系統(tǒng)還具有較好的拒識(shí)功能,能夠拒絕掉大多數(shù)的非語(yǔ)音(如: 敲門(mén)聲,咳嗽聲,機(jī)器噪音等等)。
- 具有優(yōu)秀的系統(tǒng)性能
識(shí)別引擎占用較小的系統(tǒng)資源,識(shí)別速度很快。單臺(tái)雙cpu PC服務(wù)器能夠支持90路并發(fā)語(yǔ)音識(shí)別,從而可以大大節(jié)省用戶在硬件設(shè)備方面的投資。
- 支持方便快捷的人機(jī)交互
TSR3.0具有BargeIn功能,支持說(shuō)話者隨時(shí)打斷系統(tǒng)提示,從而支持方便快捷的人機(jī)交互。通過(guò)對(duì)于語(yǔ)音檢測(cè)等模塊的精心優(yōu)化,TSR3.0保證了BargeIn條件下仍然保持原有的高識(shí)別率。
- 提供說(shuō)話人自適應(yīng)功能
當(dāng)用戶多次使用同一識(shí)別系統(tǒng)時(shí),TSR3.0識(shí)別引擎能夠逐步適應(yīng)其口音,使該使用者的識(shí)別性能逐步提高。同時(shí),如果預(yù)先給定特定說(shuō)話人的數(shù)據(jù),系統(tǒng)可以針對(duì)特定說(shuō)話人進(jìn)行自適應(yīng)訓(xùn)練以獲得更加適合其發(fā)音特征的語(yǔ)音模型,從而使得該說(shuō)話人在使用系統(tǒng)時(shí),性能更好。
同時(shí),這也是國(guó)內(nèi)外分布式語(yǔ)音識(shí)別引擎產(chǎn)品中唯一提供這項(xiàng)功能的。
- 提供語(yǔ)音注冊(cè)功能
TSR3.0允許用戶通過(guò)本人語(yǔ)音來(lái)向動(dòng)態(tài)語(yǔ)法增加命令或詞表。這種方式不但能夠有效利用用戶個(gè)性化的語(yǔ)音,提高系統(tǒng)的識(shí)別準(zhǔn)確率;而且能夠提高用戶輸入詞表的方便性和靈活性。
電話語(yǔ)音識(shí)別技術(shù)可以廣泛應(yīng)用于呼叫中心、無(wú)線增值服務(wù)、目錄服務(wù)、客服系統(tǒng)、信息查詢系統(tǒng)等各種應(yīng)用領(lǐng)域,可以應(yīng)用于政府、電信、銀行、證券、保險(xiǎn)、電力、交通、航空、教育等各個(gè)行業(yè)。通過(guò)采用基于自然語(yǔ)音交互的模式替代傳統(tǒng)的基于按鍵的交互式語(yǔ)音應(yīng)答(IVR)模式,可以顯著提高客戶使用的方便性、靈活性,為客戶提高更好的服務(wù)。語(yǔ)音識(shí)別技術(shù)與門(mén)戶網(wǎng)站相結(jié)合,可以開(kāi)發(fā)出語(yǔ)音門(mén)戶,使通過(guò)語(yǔ)音方式獲取互聯(lián)網(wǎng)信息成為可能,
從而進(jìn)一步提高應(yīng)用系統(tǒng)的增值性能。
中科信利公司愿與廣大客戶精誠(chéng)合作,致力于語(yǔ)音識(shí)別技術(shù)的推廣和普及,共同創(chuàng)造語(yǔ)音應(yīng)用的美好明天。
中科信利公司供稿 CTI論壇編輯
相關(guān)鏈接: