科大訊飛為114業(yè)務(wù)轉(zhuǎn)型打造專業(yè)語(yǔ)音平臺(tái)(一)
科大訊飛為號(hào)碼百事通打造專業(yè)語(yǔ)音平臺(tái)(二)
語(yǔ)音識(shí)別助力號(hào)碼百事通
2006/09/26
依托114品牌影響力和業(yè)務(wù)基礎(chǔ),中國(guó)電信正積極推動(dòng)各地號(hào)碼百事通的業(yè)務(wù)推廣。
為了助力號(hào)碼百事通業(yè)務(wù),科大訊飛公司除推出為號(hào)碼百事通進(jìn)行專門(mén)優(yōu)化提升的重量級(jí)語(yǔ)音合成技術(shù)產(chǎn)品Interphonic 4.0 114專業(yè)版之外,科大訊飛的語(yǔ)音技術(shù)專家們同時(shí)也在積極探索如何通過(guò)自然語(yǔ)音來(lái)獲得用戶所需的信息和服務(wù),并顯著提升語(yǔ)音信息服務(wù)的自動(dòng)化程度。
通過(guò)與全球領(lǐng)先的語(yǔ)音識(shí)別技術(shù)提供商N(yùn)uance公司長(zhǎng)期以來(lái)的戰(zhàn)略合作,科大訊飛能夠?qū)I(yè)界最領(lǐng)先、最成熟的電話語(yǔ)音識(shí)別技術(shù)成功應(yīng)用于豐富多彩的電信增值業(yè)務(wù),提供人性化的語(yǔ)音交互界面,提升語(yǔ)音信息查詢效率和降低運(yùn)營(yíng)成本,打造完善的自動(dòng)語(yǔ)音服務(wù)應(yīng)用。
針對(duì)語(yǔ)音識(shí)別技術(shù)應(yīng)用于號(hào)碼百事通業(yè)務(wù)面臨的現(xiàn)實(shí)挑戰(zhàn),如呼叫量大、口語(yǔ)化、信息內(nèi)容龐雜以及語(yǔ)音信道和用戶使用環(huán)境復(fù)雜等等,科大訊飛與合作伙伴共同打造完善的解決方案。該解決方案能夠不斷增強(qiáng)用戶體驗(yàn),提升語(yǔ)音信息服務(wù)的自動(dòng)化率。
Nuance業(yè)界領(lǐng)先的電話語(yǔ)音識(shí)別產(chǎn)品Nuance8.x在全球市場(chǎng)(包括中國(guó))的市場(chǎng)占有率遙遙領(lǐng)先。具備業(yè)界最高的識(shí)別能力、支持大詞匯量語(yǔ)法,并提供用戶語(yǔ)音打斷識(shí)別、多關(guān)鍵字語(yǔ)法、返回符合條件的結(jié)果集合(N-Best)、隨意說(shuō)(Say
Anything)等眾多有助于改善應(yīng)用效果的先進(jìn)特性?拼笥嶏w與Nuance強(qiáng)強(qiáng)合作,推動(dòng)本地化應(yīng)用的深化。針對(duì)中國(guó)地域性語(yǔ)言差異,科大訊飛·Nuance聯(lián)合實(shí)驗(yàn)室積極開(kāi)展對(duì)地方口音主動(dòng)適應(yīng)性優(yōu)化工作,包含地域性語(yǔ)言模型的適應(yīng)性訓(xùn)練和語(yǔ)法的編寫(xiě)規(guī)則制訂及優(yōu)化等。
在系統(tǒng)設(shè)計(jì)階段,根據(jù)項(xiàng)目目標(biāo),應(yīng)對(duì)語(yǔ)音識(shí)別應(yīng)用方案進(jìn)行全面細(xì)致的規(guī)劃;谏詈竦恼Z(yǔ)音應(yīng)用經(jīng)驗(yàn)積累,通過(guò)詳細(xì)分析項(xiàng)目需求,科大訊飛和Nuance能夠提出合理的系統(tǒng)配置方案和系統(tǒng)架構(gòu)設(shè)計(jì)建議,并且根據(jù)語(yǔ)音應(yīng)用具體業(yè)務(wù)、應(yīng)用規(guī)模及發(fā)展要求,對(duì)語(yǔ)法集進(jìn)行合理規(guī)劃設(shè)計(jì)。在這個(gè)階段,科大訊飛還注重加強(qiáng)對(duì)合作伙伴的培訓(xùn)指導(dǎo)和溝通交流,確保語(yǔ)音識(shí)別的各項(xiàng)關(guān)鍵技術(shù)能夠被正確合理地集成,從系統(tǒng)設(shè)計(jì)階段就在影響語(yǔ)音應(yīng)用的關(guān)鍵因素上努力保障應(yīng)用效果。
在系統(tǒng)開(kāi)發(fā)階段,科大訊飛積極配合合作伙伴進(jìn)行系統(tǒng)開(kāi)發(fā)工作,一方面提供語(yǔ)音識(shí)別語(yǔ)法設(shè)計(jì)、語(yǔ)法編寫(xiě)和語(yǔ)法校驗(yàn)方案,另一方面向號(hào)碼百事通業(yè)務(wù)開(kāi)發(fā)人員提供語(yǔ)音用戶界面(VUI)開(kāi)發(fā)建議,確保后續(xù)在系統(tǒng)使用過(guò)程中,在提供豐富便捷的人性化界面的同時(shí),合理引導(dǎo)用戶正確合理的使用語(yǔ)音識(shí)別系統(tǒng),使得語(yǔ)音識(shí)別系統(tǒng)達(dá)到預(yù)期的應(yīng)用效果。
考慮到后續(xù)的優(yōu)化將需要大量的用戶語(yǔ)音數(shù)據(jù),科大訊飛還搭建起一個(gè)語(yǔ)音識(shí)別試驗(yàn)系統(tǒng),提供測(cè)試號(hào)碼,面向事先設(shè)計(jì)好的測(cè)試用戶群(符合系統(tǒng)發(fā)布時(shí)面向的用戶群分布規(guī)律),提供試驗(yàn)性語(yǔ)音應(yīng)用服務(wù),搜集足夠的語(yǔ)料。
接下來(lái),在系統(tǒng)測(cè)試和優(yōu)化階段,科大訊飛與Nuance一起,借助科大訊飛·Nuance聯(lián)合實(shí)驗(yàn)室的研發(fā)力量,以及大量的專業(yè)數(shù)據(jù)人才和專業(yè)語(yǔ)音優(yōu)化工程師的努力,為號(hào)碼百事通提供全面的系統(tǒng)優(yōu)化服務(wù)。
第一,科大訊飛將根據(jù)試驗(yàn)平臺(tái)搜集的語(yǔ)音數(shù)據(jù),對(duì)語(yǔ)音識(shí)別系統(tǒng)的識(shí)別模型進(jìn)行當(dāng)?shù)氐目谝暨m應(yīng)性訓(xùn)練,使當(dāng)前針對(duì)標(biāo)準(zhǔn)普通話的識(shí)別模型更加適應(yīng)當(dāng)?shù)乜谝,提高系統(tǒng)的識(shí)別率。同時(shí)整理用戶的語(yǔ)言組織方式,并且反饋到語(yǔ)法中,使語(yǔ)法盡可能的覆蓋更多的用戶說(shuō)法,從語(yǔ)法層繼續(xù)提高系統(tǒng)的識(shí)別率。
第二,針對(duì)現(xiàn)有業(yè)務(wù)中出現(xiàn)的涉及到字母識(shí)別的問(wèn)題,由于具有明顯地方口音特點(diǎn),在進(jìn)行專業(yè)分析的基礎(chǔ)上,提供符合當(dāng)?shù)乜谝舻挠⑽淖帜赴l(fā)音詞典,確保字母識(shí)別效果。
第三,科大訊飛將利用真實(shí)用戶語(yǔ)音數(shù)據(jù)對(duì)語(yǔ)法集合進(jìn)行測(cè)試,分析當(dāng)?shù)乜谝籼攸c(diǎn),保障語(yǔ)音業(yè)務(wù)所面向區(qū)域的一些常見(jiàn)特色發(fā)音能夠被語(yǔ)音識(shí)別系統(tǒng)正確處理。科大訊飛與Nuance提供了較為完備的模糊音解決方案,能夠針對(duì)語(yǔ)音進(jìn)行分析,提交出當(dāng)?shù)匾族e(cuò)音對(duì)應(yīng)表,提高系統(tǒng)識(shí)別的準(zhǔn)確率。
第四,語(yǔ)音識(shí)別應(yīng)用中,置信度(認(rèn)定語(yǔ)音被正確識(shí)別的門(mén)限)的合理設(shè)置是一個(gè)非常重要的問(wèn)題。置信度設(shè)置過(guò)高,會(huì)將一些正確識(shí)別的結(jié)果屏蔽掉,置信度設(shè)置過(guò)低,會(huì)使一些錯(cuò)誤結(jié)果被認(rèn)定正確。如何權(quán)衡這兩點(diǎn)對(duì)最終的識(shí)別效果影響很大。科大訊飛通過(guò)分析系統(tǒng)數(shù)據(jù),提供合理的置信度設(shè)置方案,并向系統(tǒng)集成商提出置信度業(yè)務(wù)層解決方案的方式,既保證大多數(shù)用戶的操作的簡(jiǎn)化,也同時(shí)通過(guò)增加如按鍵確認(rèn)或者語(yǔ)音確認(rèn)的流程,完善保障流程,確保少數(shù)口音較重或者發(fā)音不標(biāo)準(zhǔn)的用戶的語(yǔ)音被正確識(shí)別。
最后,科大訊飛與Nuance還將利用其豐富的語(yǔ)音用戶界面設(shè)計(jì)經(jīng)驗(yàn)和豐富的用戶體驗(yàn)資源,對(duì)號(hào)碼百事通業(yè)務(wù)部門(mén)提出的設(shè)計(jì)方案進(jìn)行優(yōu)化,使得友好性和有效性能夠得到合理平衡,從而確保完整的用戶體驗(yàn)和優(yōu)秀的語(yǔ)音識(shí)別效果。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接: