基于VoiceXML機(jī)制語音應(yīng)用為企業(yè)攬客
梁燁 2002/03/04
基于VoiceXML技術(shù),可以開發(fā)出多種多樣的語音應(yīng)用,也引起了業(yè)內(nèi)眾多廠商的關(guān)注。自從2000年初IBM、Lucent、AT&T和Motorola四大公司成立了VoiceXML論壇以來,語音應(yīng)用得到很大的發(fā)展。在國外,以Tellme.com和Nuance、SpeechWorks為代表的企業(yè)異軍突起,倡導(dǎo)人性化的語音上網(wǎng)服務(wù);AT&T、AOL、Yahoo、Lycos等電信或互聯(lián)網(wǎng)服務(wù)提供商已開通大型的交互式語音服務(wù)網(wǎng)站。
VoiceXML是核心
基于XML 數(shù)據(jù)機(jī)制之上的VoiceXML語音瀏覽是交互語音應(yīng)用的核心,它可以與數(shù)據(jù)庫、HTML、WML以及其它文檔處理和發(fā)布系統(tǒng)進(jìn)行無縫資料交換,實現(xiàn)互聯(lián)網(wǎng)與電話網(wǎng)的融合;赩oiceXML的語音瀏覽機(jī)制與語音識別、語音合成技術(shù)、智能文字信息處理技術(shù)相結(jié)合,人們可以通過電話或移動電話以自然友好的語音形式訪問互聯(lián)網(wǎng),實現(xiàn)個人和商業(yè)服務(wù)的語音應(yīng)用。
圖1 基于VoiceXML的語音應(yīng)用平臺拓?fù)浣Y(jié)構(gòu)
比如說,用戶想知道某公司的當(dāng)前股價,就打電話到提供該服務(wù)的公司,通過相關(guān)的映射,到達(dá)該網(wǎng)站的VoiceXML服務(wù)器,VoiceXML服務(wù)器馬上調(diào)出相應(yīng)的VoiceXML文件,在由VoiceXML解釋程序處理,通過TTS產(chǎn)生語音輸出,來回復(fù)用戶的請求。當(dāng)然,在處理VoiceXML文件的過程中,有時還需交給后臺的CGI程序處理,處理后的結(jié)果再由Web Server交給VoiceXML Server處理,見圖1。
基于VoiceXML的語音應(yīng)用
通過VoiceXML,可以很容易地建立新的語音應(yīng)用和服務(wù),如語音門戶、語音Call Center、語音信息服務(wù)、語音電子商務(wù)等。而這些應(yīng)用或服務(wù)可以很容易地和原有的數(shù)據(jù)系統(tǒng)結(jié)合起來,甚至輕易地從原有的各類應(yīng)用中延展出來。用戶通過語音門戶平臺,可以把有線電話網(wǎng)、無線通信網(wǎng)、尋呼網(wǎng)、互聯(lián)網(wǎng)作為統(tǒng)一信息平臺,通過電話查詢股票行情、天氣預(yù)報、航班動態(tài)、火車時刻表等信息,還可點播自己定制的個人信息、新聞、證券評論、電影評論等,同時還能進(jìn)行諸如購買飛機(jī)票、股票等電子商務(wù)活動。語音門戶服務(wù)功能模塊將分別滲透到電信市場、郵政市場、政府、金融銀行、證券行業(yè)、保險市場、交通旅游市場、物流運輸行業(yè)、公共生活等,幾乎無孔不入,覆蓋了社會生活的大部分。
圖2 語音互聯(lián)網(wǎng)業(yè)務(wù)系統(tǒng)層次圖
企業(yè)利用語音門戶,可以通過節(jié)省人工座席成本實現(xiàn)低成本地發(fā)布信息,提供客戶服務(wù),而且可以實現(xiàn)其它有價值的業(yè)務(wù),開創(chuàng)新的市場空間和利潤,其業(yè)務(wù)系統(tǒng)層次如圖2所示。
語音門戶
利用VoiceXML 語音瀏覽器系統(tǒng),運營商可以建立自己的語音門戶(Voice Portal),為用戶提供包括電話郵件、股票查詢、天氣查詢、語音游戲、語音電子商務(wù)在內(nèi)的電信服務(wù)和應(yīng)用系統(tǒng),開拓新的電信增值業(yè)務(wù)項目。
核心技術(shù) |
應(yīng)用范圍 |
語音合成技術(shù) |
海量動態(tài)信息查詢 |
在基于VoiceXML的語音郵件應(yīng)用中,用戶可以自由地選擇收聽郵件、只聽標(biāo)題或內(nèi)容、順序瀏覽、隨時刪除。在基于VoiceXML 的股票查詢應(yīng)用中,用戶無須記住股票代碼,只需說出股票名稱即可。用戶可以有選擇地定制自己所關(guān)心的幾種股票,只查詢這幾種股票的信息。通過更為復(fù)雜的模板定制,用戶還可以定制關(guān)心的股票價格、成交量等細(xì)節(jié)內(nèi)容。
UMS平臺
通過建立語音門戶和VoiceXML 語音應(yīng)用平臺,實現(xiàn)互聯(lián)網(wǎng)與電話網(wǎng)的融合,運營商還可以為用戶提供UMS (統(tǒng)一信息系統(tǒng))。用戶可以通過各種各樣的工具來查詢、獲取信息和得到反饋。E-mail、電話、傳真、短消息與BP等通信形式,在 UMS 平臺中都得到了充分的體現(xiàn)和發(fā)揮,而用VoiceXML 標(biāo)記語言,不僅僅可以描述對電話信息方式的處理,而且可以描述其與其它信息方式的溝通和交互,使整個UMS 平臺成為一個有機(jī)的整體。
中小型語音門戶
通過百、十線級的VoiceXML 語音瀏覽系統(tǒng),包括ISP、ICP、聲訊臺等虛擬運營商以及政府、企業(yè)在內(nèi)的行業(yè)用戶,可建立起行業(yè)專用的中小型語音門戶。通過語音門戶,虛擬運營商可以輕松地將用戶延伸到龐大的電話用戶群中。行業(yè)用戶也能通過開發(fā)新的語音應(yīng)用,開展基于語音瀏覽的商務(wù)系統(tǒng)。
跨越互聯(lián)網(wǎng)和數(shù)據(jù)網(wǎng)的VoiceXML呼叫中心
呼叫中心將不僅為電話用戶提供服務(wù),基于Web 的呼叫中心越來越受到商家的關(guān)注。兩個網(wǎng)絡(luò)之間的交互通過VXML 數(shù)據(jù)標(biāo)記技術(shù)而變得輕松簡單。VoiceXML 語音瀏覽系統(tǒng)使大部分的對話都可以由計算機(jī)自己完成,大大降低座席人員的要求和負(fù)擔(dān),而使用戶的使用更為簡單和自然。VXML技術(shù)使單純的按鍵選擇方式變?yōu)榘存I和語音選擇并行,對于大量的復(fù)雜信息查詢(如天氣預(yù)報、郵編地址等),可以簡化查詢層次和靈活處理業(yè)務(wù)流程。
基于語音瀏覽的商務(wù)系統(tǒng)
通過VoiceXML 語音瀏覽系統(tǒng),行業(yè)用戶可以建立用戶群更為廣泛、使用更為方便的VoiceXML商務(wù)平臺。以無限商機(jī)VoiceXML語音瀏覽系統(tǒng)為例,它提供了數(shù)據(jù)處理功能和相關(guān)系統(tǒng)結(jié)構(gòu),并專門針對語音應(yīng)用的特點做出了優(yōu)化設(shè)計和實現(xiàn),使商家對整個系統(tǒng)的管理、交易的控制更為高效。它可以與行業(yè)用戶原有的電子商務(wù)系統(tǒng)輕易結(jié)合,也可以在強大的中間件平臺基礎(chǔ)上建構(gòu)新的語音電子商務(wù)系統(tǒng);谡Z音瀏覽的商務(wù)系統(tǒng)可廣泛應(yīng)用于航空、銀行、證券、保險、零售等行業(yè)中。
到了哪一步
由于VoiceXML技術(shù)和語音技術(shù)的快速發(fā)展,已經(jīng)有150個以上的公司和組織加入VoiceXML論壇,積極支持和推動支持基于VoiceXML的應(yīng)用。目前,IBM、 Motorola、朗訊、Nuance都已推出了各自的VoiceXML網(wǎng)關(guān)及VoiceXML開發(fā)包,但大都不支持中文。
在言豐、科大訊飛、捷通等國內(nèi)廠商的努力下,目前我國在中文語音識別、語音合成等技術(shù)上正逐步走向成熟,而在語音瀏覽這一核心技術(shù)領(lǐng)域,中國也已取得重大突破,由無限商機(jī)與北郵CTI中心聯(lián)合研制的VoiceXML中文語音瀏覽器,通過專家的聯(lián)合權(quán)威技術(shù)鑒定。
目前,基于VoiceXML的語音應(yīng)用在國內(nèi)尚處于起步階段,中國要完全實現(xiàn)交互式語音應(yīng)用還存在著技術(shù)、標(biāo)準(zhǔn)、應(yīng)用及內(nèi)容等方面的一些瓶頸和不足,但語音互聯(lián)網(wǎng)的前景吸引著業(yè)內(nèi)人士,并努力使這些瓶頸得到解決。
在技術(shù)方面,地方口音與噪音的問題通過個性化定制、自適應(yīng)能力和按鍵輔助正在得到解決;在標(biāo)準(zhǔn)的統(tǒng)一與開放方面,中文VoiceXML已與國際標(biāo)準(zhǔn)完全接軌,由21家通信行業(yè)領(lǐng)頭單位共同倡導(dǎo)成立的“中國互聯(lián)網(wǎng)移動應(yīng)用協(xié)議特別組”(CMIS)中文&漢語專家組,已提出了基于VoiceXML的應(yīng)用系統(tǒng)規(guī)范提綱,標(biāo)志著中文VoiceXML語音技術(shù)應(yīng)用標(biāo)準(zhǔn)正在逐步醞釀和推進(jìn)。而在應(yīng)用及內(nèi)容方面,通過服務(wù)商與內(nèi)容商雙贏的合作分成模式,通過規(guī)模化的招標(biāo)采購,以及開放的開發(fā)平臺,從而誕生豐富的內(nèi)容與應(yīng)用。
關(guān)于VoiceXML論壇
為了促進(jìn)CTI技術(shù)和語音技術(shù)的發(fā)展,2000年初,IBM、Lucent、AT&T和Motorola四大公司成立了VoiceXML(Voice Extensible Markup Language,語音擴(kuò)展標(biāo)記語言)論壇。這種新的語音技術(shù),使用戶能通過電話和語音來訪問Internet,幫助企業(yè)、電信公司、互聯(lián)網(wǎng)公司增加網(wǎng)絡(luò)使用率,提高用戶忠誠度,開發(fā)新市場,從而增強企業(yè)的競爭力。
中國計算機(jī)報 2002/03/04
北京無限商機(jī) 2002-03-04 |
我國語音互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展和統(tǒng)一標(biāo)準(zhǔn)規(guī)范VAP探討 2002-03-04 |
Nuance VoiceXML應(yīng)用案例研究 2002-01-16 |
Infoncall語音業(yè)務(wù)增值應(yīng)用平臺面向電信服務(wù)業(yè)的解決方案 2001-12-03 |
穎科語音網(wǎng)絡(luò)訪問平臺技術(shù)白皮書 2001-11-30 |