電話用戶與Web對話的橋梁——VoiceXML語言
2004/05/09
VoiceXML--語音擴(kuò)展描述語言是由AT&T、IBM、Lucent Technologies、以及Motorola通過W3C協(xié)會于2000年聯(lián)合推出的電話語音應(yīng)用系統(tǒng)標(biāo)準(zhǔn),是為語音應(yīng)用制訂的基于XML的語音可擴(kuò)展標(biāo)記語言。有了VoiceXML,互聯(lián)網(wǎng)信息從此能夠以語音的方式流向公用電話網(wǎng),從而使互聯(lián)網(wǎng)服務(wù)得以延伸到電話用戶。VoiceXML徹底改變了傳統(tǒng)的CTI(計算機(jī)電話集成系統(tǒng))
的開發(fā)模式和應(yīng)用范圍,使公用電話網(wǎng)、語音處理技術(shù)、以及互聯(lián)網(wǎng)有機(jī)地結(jié)合為一體,架起了電話用戶與Web對話的橋梁。
VoiceXML使公用電話網(wǎng)與互聯(lián)網(wǎng)的結(jié)合體現(xiàn)在三個方面:語音瀏覽器的使用、互聯(lián)網(wǎng)和公用電話網(wǎng)的信息共享、類似于Web網(wǎng)頁開發(fā)過程的電話語音應(yīng)用系統(tǒng)的開發(fā)。
1. 語音瀏覽器的使用
IE、Netscape等Web瀏覽器的出現(xiàn)有力地帶動了互聯(lián)網(wǎng)的發(fā)展,給人們的日常生活和工作方式帶來新的變革。Web瀏覽器通過計算機(jī)終端進(jìn)行文本信息交流,類似地,VoiceXML語音瀏覽器則是通過電話終端進(jìn)行語音信息交流。
VoiceXML語音瀏覽的實(shí)現(xiàn)主要依賴于語音處理技術(shù)和類似于Web瀏覽技術(shù)的語音瀏覽技術(shù)。在VoiceXML語音瀏覽器的支持下,電話用戶可以用語音輸入和傳統(tǒng)的按鍵輸入方式通過電話與電話語音應(yīng)用系統(tǒng)進(jìn)行對話交流,電話語音應(yīng)用系統(tǒng)則用語音的方式與用戶對話。在此過程中,語音識別(語音到文字的轉(zhuǎn)換)和語音合成(文字到語音的轉(zhuǎn)換)等語音處理技術(shù)起著重要的作用。
語音處理技術(shù)是使電話用戶能夠用自然語言的方式與Web對話的關(guān)鍵技術(shù)之一。其中,語音識別技術(shù)使得應(yīng)用系統(tǒng)能夠識別電話用戶的語音輸入并將之轉(zhuǎn)換成文字以便計算機(jī)處理。目前,最好的語音識別系統(tǒng)能夠在一定范圍內(nèi)達(dá)到自然語言的識別。雖然由于技術(shù)的局限和中國多方言多口音的特征,使得語音識別系統(tǒng)的應(yīng)用受到一定的限制,但是語音識別技術(shù)仍然在不斷地走進(jìn)人們的日常生活,人們也在開始使用語音的方式與電話語音應(yīng)用系統(tǒng)進(jìn)行交流。另一方面,語音合成技術(shù)相對于語音識別技術(shù)來說則在實(shí)際應(yīng)用中顯得更成熟。目前,較好語音合成系統(tǒng)已經(jīng)可以達(dá)到比較好的可懂度和自然度。語音合成技術(shù)是使互聯(lián)網(wǎng)信息流向公用電話網(wǎng)的關(guān)鍵技術(shù),它可以將諸如及時新聞等的文本信息轉(zhuǎn)換成語音格式并通過電話播放給用戶,從而擺脫了電話用戶只能收聽到預(yù)先錄制好的錄音的傳統(tǒng)使用方式。
除了語音處理技術(shù)之外,VoiceXML語音瀏覽技術(shù)也是電話語音應(yīng)用系統(tǒng)的關(guān)鍵技術(shù)。與HTML類似,VoiceXML使得電話語音應(yīng)用系統(tǒng)根據(jù)對話流程所處的狀態(tài)和具體應(yīng)用領(lǐng)域的業(yè)務(wù)需求將當(dāng)前對話流程轉(zhuǎn)向由互聯(lián)網(wǎng)URI鏈接定義的下一個對話流程。在對話流程的定義中,不僅可以訪問互聯(lián)網(wǎng)上的URI文件,而且還可以訪問互聯(lián)網(wǎng)和局域網(wǎng)內(nèi)的數(shù)據(jù)庫。同時,Web瀏覽技術(shù)的引進(jìn)使電話語音應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)有機(jī)地結(jié)合,使電話語音應(yīng)用系統(tǒng)以開放式的方式呈現(xiàn)給電話用戶。
VoiceXML語音瀏覽器利用Web瀏覽技術(shù)將語音處理技術(shù)和語音瀏覽技術(shù)整合為一體,極大地擴(kuò)展了電話語音應(yīng)用系統(tǒng)的應(yīng)用范圍,同時也使互聯(lián)網(wǎng)的信息和服務(wù)走向電話用戶群,從而使得互聯(lián)網(wǎng)可以贏得更多的用戶。
2. 互聯(lián)網(wǎng)和公用電話網(wǎng)的信息共享
互聯(lián)網(wǎng)與公用電話網(wǎng)長期以來出于分離狀態(tài)。隨著互聯(lián)網(wǎng)的飛速發(fā)展和互聯(lián)網(wǎng)信息的迅速增加,讓龐大的電話用戶群(包括固定電話用戶群和移動電話用戶群)訪問互聯(lián)網(wǎng)信息和享用互聯(lián)網(wǎng)提供的服務(wù)顯得越來越重要。VoiceXML的問世,無疑對互聯(lián)網(wǎng)服務(wù)商、運(yùn)營商以及內(nèi)容提供商都提供了一個極好的商機(jī)。
首先,VoiceXML瀏覽技術(shù)是開放式的,VoiceXML瀏覽器可以瀏覽互聯(lián)網(wǎng)上的任何公開的文件和數(shù)據(jù),這使得電話用戶可以借助于語音處理技術(shù)通過電話訪問互聯(lián)網(wǎng)信息。例如,電話用戶可以通過VoiceXML瀏覽器收聽網(wǎng)上新聞、查詢網(wǎng)上數(shù)據(jù)庫、下載和收聽語音文件(如音樂、歌曲、留言、語音郵件等)
。因而,VoiceXML瀏覽技術(shù)的使用,使得互聯(lián)網(wǎng)的信息能夠自然地流向公用電話網(wǎng)。
與此同時,VoiceXML瀏覽技術(shù)還可以將公用電話網(wǎng)的信息傳送給互聯(lián)網(wǎng)。公用電話網(wǎng)信息與互聯(lián)網(wǎng)信息不同之處在于前者是動態(tài)的、以語音形式為主并且隨著電話對話流的結(jié)束而消失。然而,在有些電話語音應(yīng)用系統(tǒng)中,需要將對話流所產(chǎn)生的信息保存起來,以便將來通過Web瀏覽器進(jìn)行訪問。例如,用戶的語音留言和對話過程等都可以利用VoiceXML瀏覽技術(shù)通過電子郵件或文件的形式傳到互聯(lián)網(wǎng)中進(jìn)行保存,此后,互聯(lián)網(wǎng)用戶和電話用戶就可以分別通過Web瀏覽器和VoiceXML瀏覽器訪問這些信息。
VoiceXML瀏覽技術(shù)的引入,使互聯(lián)網(wǎng)和公用電話網(wǎng)得以有機(jī)地結(jié)合,使兩網(wǎng)信息可以互相流動,從而使互聯(lián)網(wǎng)與公用電話網(wǎng)達(dá)到信息共享。
3. 電話語音應(yīng)用系統(tǒng)的開發(fā)
電話語音應(yīng)用系統(tǒng)的傳統(tǒng)開發(fā)模式是利用CTI(計算機(jī)電話集成)技術(shù)將語音卡、交換機(jī)等各系統(tǒng)構(gòu)件組織和集成起來,開發(fā)人員因此需要熟悉相關(guān)的底層編碼并深入了解有關(guān)硬件的編程接口才能建立一個傳統(tǒng)的電話語音應(yīng)用系統(tǒng)。VoiceXML的出現(xiàn)則不僅改變了電話語音應(yīng)用系統(tǒng)的使用方法和使用范圍,而且給電話語音應(yīng)用系統(tǒng)的開發(fā)過程帶來全新的概念和模式,使電話語音應(yīng)用系統(tǒng)的開發(fā)實(shí)際上成為"語音網(wǎng)頁"的開發(fā)。
首先,VoiceXML瀏覽器的使用可以使開發(fā)人員從繁瑣的編程細(xì)節(jié)中解脫出來。開發(fā)"語音網(wǎng)頁"不需要了解各系統(tǒng)構(gòu)件(如語音識別、語音合成、語音卡、交換機(jī)等)的編程接口,而是類似于Web網(wǎng)頁的開發(fā),只需編寫VoiceXML腳本。開發(fā)人員因此能夠把精力放在應(yīng)用系統(tǒng)的業(yè)務(wù)流程上。
其次,"語音網(wǎng)頁"的開發(fā)過程簡單、快捷。開發(fā)人員不需要掌握C/C++或Java等高級計算機(jī)編程語言便可以開發(fā)一個完整的電話語音應(yīng)用系統(tǒng),并且所開發(fā)出來的系統(tǒng)往往比傳統(tǒng)開發(fā)方式開發(fā)出來的系統(tǒng)更開放、功能更強(qiáng)大。
再者,"語音網(wǎng)頁"的開發(fā)對開發(fā)人員的技術(shù)要求較低、開發(fā)周期大幅度縮短,從而使開發(fā)成本大大降低。所開發(fā)出來的應(yīng)用系統(tǒng)同時還具有很高的可維護(hù)性、可移植性、可擴(kuò)展性以及可重用性。
下面是一個VoiceXML的簡單例子。當(dāng)用戶與電話語音系統(tǒng)接通以后,將會聽到語音合成的提示信息"用戶您好!請選擇我們?yōu)槟峁┑姆⻊?wù):"。當(dāng)用戶說"股票市場",語音瀏覽器就會通過語音識別功能識別用戶的選擇,然后把對話流程轉(zhuǎn)向另一個VoiceXML腳本文件stocks.vxml。stocks.vxml腳本文件則是一個專門向用戶提供股票市場相關(guān)服務(wù)的語音網(wǎng)頁。
顯而易見,基于VoiceXML開發(fā)電話語音應(yīng)用系統(tǒng)拋棄了傳統(tǒng)的CTI開發(fā)模式,使其開發(fā)過程類似于Web網(wǎng)頁的開發(fā)過程。
VoiceXML的出現(xiàn),使互聯(lián)網(wǎng)和公用電話網(wǎng)有機(jī)地融為一體,從而使得電話用戶能夠通過電話與網(wǎng)頁交流,使公用電話網(wǎng)與互聯(lián)網(wǎng)實(shí)現(xiàn)信息共享,使語音網(wǎng)頁的新概念取代傳統(tǒng)的文字瀏覽的網(wǎng)站,使公用電話網(wǎng)成為互聯(lián)網(wǎng)的延伸,為互聯(lián)網(wǎng)內(nèi)容商、運(yùn)營商以及服務(wù)商提供了難得的商機(jī)。目前,VoiceXML在發(fā)達(dá)國家剛興起不久,中國在開發(fā)VoiceXML相關(guān)產(chǎn)品方面也是處于剛剛起步的階段。用VoiceXML開發(fā)"語音網(wǎng)頁"如同編寫HTML語言一樣的簡單方便,它將引導(dǎo)普通網(wǎng)站的技術(shù)革新,揭開語音網(wǎng)站的新篇章!
上海聲軟技術(shù)(Voicesoft)
Voicesoft VAS虛擬前臺系統(tǒng) 2005-09-30 |
上海聲軟 VS MsgCOM短消息通信平臺 2005-09-16 |
上海聲軟 VSFax企業(yè)傳真服務(wù)器 2005-09-06 |
基于VoiceXML的商用開放式語音平臺OpenIVR 2005-05-13 |
上海聲軟成功推出Panasonic呼叫中心平臺 2005-03-22 |