科大訊飛為114業(yè)務(wù)轉(zhuǎn)型打造專業(yè)語音平臺(一)
科大訊飛為號碼百事通打造專業(yè)語音平臺(二)
語音識別助力號碼百事通
2006/09/26
依托114品牌影響力和業(yè)務(wù)基礎(chǔ),中國電信正積極推動各地號碼百事通的業(yè)務(wù)推廣。
為了助力號碼百事通業(yè)務(wù),科大訊飛公司除推出為號碼百事通進行專門優(yōu)化提升的重量級語音合成技術(shù)產(chǎn)品Interphonic 4.0 114專業(yè)版之外,科大訊飛的語音技術(shù)專家們同時也在積極探索如何通過自然語音來獲得用戶所需的信息和服務(wù),并顯著提升語音信息服務(wù)的自動化程度。
通過與全球領(lǐng)先的語音識別技術(shù)提供商Nuance公司長期以來的戰(zhàn)略合作,科大訊飛能夠?qū)I(yè)界最領(lǐng)先、最成熟的電話語音識別技術(shù)成功應(yīng)用于豐富多彩的電信增值業(yè)務(wù),提供人性化的語音交互界面,提升語音信息查詢效率和降低運營成本,打造完善的自動語音服務(wù)應(yīng)用。
針對語音識別技術(shù)應(yīng)用于號碼百事通業(yè)務(wù)面臨的現(xiàn)實挑戰(zhàn),如呼叫量大、口語化、信息內(nèi)容龐雜以及語音信道和用戶使用環(huán)境復(fù)雜等等,科大訊飛與合作伙伴共同打造完善的解決方案。該解決方案能夠不斷增強用戶體驗,提升語音信息服務(wù)的自動化率。
Nuance業(yè)界領(lǐng)先的電話語音識別產(chǎn)品Nuance8.x在全球市場(包括中國)的市場占有率遙遙領(lǐng)先。具備業(yè)界最高的識別能力、支持大詞匯量語法,并提供用戶語音打斷識別、多關(guān)鍵字語法、返回符合條件的結(jié)果集合(N-Best)、隨意說(Say
Anything)等眾多有助于改善應(yīng)用效果的先進特性。科大訊飛與Nuance強強合作,推動本地化應(yīng)用的深化。針對中國地域性語言差異,科大訊飛·Nuance聯(lián)合實驗室積極開展對地方口音主動適應(yīng)性優(yōu)化工作,包含地域性語言模型的適應(yīng)性訓(xùn)練和語法的編寫規(guī)則制訂及優(yōu)化等。
在系統(tǒng)設(shè)計階段,根據(jù)項目目標(biāo),應(yīng)對語音識別應(yīng)用方案進行全面細(xì)致的規(guī)劃。基于深厚的語音應(yīng)用經(jīng)驗積累,通過詳細(xì)分析項目需求,科大訊飛和Nuance能夠提出合理的系統(tǒng)配置方案和系統(tǒng)架構(gòu)設(shè)計建議,并且根據(jù)語音應(yīng)用具體業(yè)務(wù)、應(yīng)用規(guī)模及發(fā)展要求,對語法集進行合理規(guī)劃設(shè)計。在這個階段,科大訊飛還注重加強對合作伙伴的培訓(xùn)指導(dǎo)和溝通交流,確保語音識別的各項關(guān)鍵技術(shù)能夠被正確合理地集成,從系統(tǒng)設(shè)計階段就在影響語音應(yīng)用的關(guān)鍵因素上努力保障應(yīng)用效果。
在系統(tǒng)開發(fā)階段,科大訊飛積極配合合作伙伴進行系統(tǒng)開發(fā)工作,一方面提供語音識別語法設(shè)計、語法編寫和語法校驗方案,另一方面向號碼百事通業(yè)務(wù)開發(fā)人員提供語音用戶界面(VUI)開發(fā)建議,確保后續(xù)在系統(tǒng)使用過程中,在提供豐富便捷的人性化界面的同時,合理引導(dǎo)用戶正確合理的使用語音識別系統(tǒng),使得語音識別系統(tǒng)達(dá)到預(yù)期的應(yīng)用效果。
考慮到后續(xù)的優(yōu)化將需要大量的用戶語音數(shù)據(jù),科大訊飛還搭建起一個語音識別試驗系統(tǒng),提供測試號碼,面向事先設(shè)計好的測試用戶群(符合系統(tǒng)發(fā)布時面向的用戶群分布規(guī)律),提供試驗性語音應(yīng)用服務(wù),搜集足夠的語料。
接下來,在系統(tǒng)測試和優(yōu)化階段,科大訊飛與Nuance一起,借助科大訊飛·Nuance聯(lián)合實驗室的研發(fā)力量,以及大量的專業(yè)數(shù)據(jù)人才和專業(yè)語音優(yōu)化工程師的努力,為號碼百事通提供全面的系統(tǒng)優(yōu)化服務(wù)。
第一,科大訊飛將根據(jù)試驗平臺搜集的語音數(shù)據(jù),對語音識別系統(tǒng)的識別模型進行當(dāng)?shù)氐目谝暨m應(yīng)性訓(xùn)練,使當(dāng)前針對標(biāo)準(zhǔn)普通話的識別模型更加適應(yīng)當(dāng)?shù)乜谝簦岣呦到y(tǒng)的識別率。同時整理用戶的語言組織方式,并且反饋到語法中,使語法盡可能的覆蓋更多的用戶說法,從語法層繼續(xù)提高系統(tǒng)的識別率。
第二,針對現(xiàn)有業(yè)務(wù)中出現(xiàn)的涉及到字母識別的問題,由于具有明顯地方口音特點,在進行專業(yè)分析的基礎(chǔ)上,提供符合當(dāng)?shù)乜谝舻挠⑽淖帜赴l(fā)音詞典,確保字母識別效果。
第三,科大訊飛將利用真實用戶語音數(shù)據(jù)對語法集合進行測試,分析當(dāng)?shù)乜谝籼攸c,保障語音業(yè)務(wù)所面向區(qū)域的一些常見特色發(fā)音能夠被語音識別系統(tǒng)正確處理?拼笥嶏w與Nuance提供了較為完備的模糊音解決方案,能夠針對語音進行分析,提交出當(dāng)?shù)匾族e音對應(yīng)表,提高系統(tǒng)識別的準(zhǔn)確率。
第四,語音識別應(yīng)用中,置信度(認(rèn)定語音被正確識別的門限)的合理設(shè)置是一個非常重要的問題。置信度設(shè)置過高,會將一些正確識別的結(jié)果屏蔽掉,置信度設(shè)置過低,會使一些錯誤結(jié)果被認(rèn)定正確。如何權(quán)衡這兩點對最終的識別效果影響很大?拼笥嶏w通過分析系統(tǒng)數(shù)據(jù),提供合理的置信度設(shè)置方案,并向系統(tǒng)集成商提出置信度業(yè)務(wù)層解決方案的方式,既保證大多數(shù)用戶的操作的簡化,也同時通過增加如按鍵確認(rèn)或者語音確認(rèn)的流程,完善保障流程,確保少數(shù)口音較重或者發(fā)音不標(biāo)準(zhǔn)的用戶的語音被正確識別。
最后,科大訊飛與Nuance還將利用其豐富的語音用戶界面設(shè)計經(jīng)驗和豐富的用戶體驗資源,對號碼百事通業(yè)務(wù)部門提出的設(shè)計方案進行優(yōu)化,使得友好性和有效性能夠得到合理平衡,從而確保完整的用戶體驗和優(yōu)秀的語音識別效果。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接: