VoiceXML1.0面向互聯(lián)網(wǎng)的語(yǔ)音支持功能為進(jìn)一步開掘互聯(lián)網(wǎng)資源的價(jià)值鋪平了道路。VoiceXML2.0的出現(xiàn),又為互聯(lián)網(wǎng)語(yǔ)音應(yīng)用的開發(fā)者提供了更強(qiáng)大的詞匯和語(yǔ)法生成及擴(kuò)充工具。
圍繞VoiceXML標(biāo)記語(yǔ)言,業(yè)界差不多已經(jīng)討論了三年。通過(guò)VoiceXML,互聯(lián)網(wǎng)語(yǔ)音應(yīng)用運(yùn)營(yíng)商能向電話用戶發(fā)布他們感興趣的信息,就像管理Web頁(yè)的網(wǎng)管人員向Web服務(wù)器發(fā)布網(wǎng)頁(yè)內(nèi)容那樣,而且發(fā)布的信息內(nèi)容也與一般的垂直服務(wù)網(wǎng)站所提供的內(nèi)容差不多,如訂貨信息、股票查詢、航班時(shí)刻等等,不一而足。
在VoiceXML應(yīng)用環(huán)境中,VoiceXML “頁(yè)”與HTML頁(yè)一樣,無(wú)論發(fā)出頁(yè)面請(qǐng)求的瀏覽器與提供指定頁(yè)面的服務(wù)器相距多么遙遠(yuǎn),都能通過(guò)HTTP協(xié)議在服務(wù)器間鏈接或返回。與IVR(交互式語(yǔ)音應(yīng)答系統(tǒng))“一個(gè)號(hào)碼一根線”這種簡(jiǎn)單的服務(wù)平臺(tái)相比,VoiceXML瀏覽的是一種真正意義上自由漫游的語(yǔ)音Web頁(yè)。與HTML不同的是,VoiceXML中的瀏覽器不在用戶端,它實(shí)際上是由一組由用戶導(dǎo)航命令、用戶定制命令、語(yǔ)音識(shí)別以及TTS算法(文本轉(zhuǎn)換成語(yǔ)音)等組件構(gòu)成的VoiceXML解釋軟件。由于電話主叫用戶在訪問(wèn)VoiceXML頁(yè)時(shí)只有語(yǔ)音和電話按鍵這兩種交互方式,因此對(duì)用戶來(lái)說(shuō),只相當(dāng)于有了鍵盤、鼠標(biāo)和瀏覽器顯示屏幕,而不具有瀏覽器本身。
隨著VoiceXML的問(wèn)世,眾多服務(wù)器平臺(tái)和瀏覽器產(chǎn)品紛紛涌現(xiàn)。截至目前,VoiceXML已身歷兩代。2000年5月,由AT&T、Lucent、Motorola和IBM幾大公司組成的VoiceXML論壇向W3C提交了VoiceXML1.0。此后,由60多家公司組成的W3C語(yǔ)音瀏覽器工作組醞釀產(chǎn)生了VoiceXML2.0,并于去年10月公開發(fā)布,旨在征求各方意見。最終的“推薦標(biāo)準(zhǔn)”預(yù)計(jì)將于今年年底公布。
不斷成熟的VoiceXML一直在追求更強(qiáng)的功能、更簡(jiǎn)潔的表達(dá)方式,并盡量少地讓開發(fā)者自己去做類似于編寫動(dòng)態(tài)語(yǔ)法代碼這樣的工作。VoiceXML2.0進(jìn)一步對(duì)TTS控制和語(yǔ)音識(shí)別語(yǔ)法格式進(jìn)行了標(biāo)準(zhǔn)化,對(duì)全局會(huì)話描述的結(jié)構(gòu)增加了更嚴(yán)密的定義。
業(yè)內(nèi)專家對(duì)VoiceXML2.0的修改意見主要集中在三個(gè)方面。一、對(duì)應(yīng)用平臺(tái)間和文檔間的互操作特性進(jìn)行規(guī)范。要做的工作主要有:進(jìn)一步明晰VoiceXML1.0中某些表述含混的地方;確定VoiceXML解釋平臺(tái)的最低配置要求;對(duì)語(yǔ)法和用戶提示進(jìn)行標(biāo)準(zhǔn)化;為驗(yàn)證一致性,開發(fā)一個(gè)測(cè)試協(xié)議。二、在VoiceXML不依靠低級(jí)代碼所完成的最基本功能之外,再增添一些增強(qiáng)型組件。三、增強(qiáng)可讀性。
W3C語(yǔ)音瀏覽器的另一個(gè)工作小組目前正在制訂呼叫控制規(guī)范,內(nèi)容包括呼叫初始化和第三方會(huì)議等,當(dāng)前的研究目標(biāo)是使呼叫控制實(shí)現(xiàn)協(xié)議的獨(dú)立。如果要實(shí)現(xiàn)更復(fù)雜的呼叫控制功能,就可能需要一種單獨(dú)的呼叫控制語(yǔ)言對(duì)現(xiàn)行各種電話標(biāo)準(zhǔn)進(jìn)行重組。目前,已經(jīng)有中間件提供商在VoiceXML上增加了自定義的呼叫控制標(biāo)記,還有像Voxeo這樣的廠商甚至還開發(fā)了自己的呼叫控制標(biāo)記語(yǔ)言。
這樣,VoiceXML2.0標(biāo)準(zhǔn)增強(qiáng)了實(shí)用性和易用性,更方便實(shí)現(xiàn)語(yǔ)音在互聯(lián)網(wǎng)之上的交互,使簡(jiǎn)易終端設(shè)備訪問(wèn)互聯(lián)網(wǎng)成為現(xiàn)實(shí),可以與數(shù)據(jù)庫(kù)、HTML、WML以及其它文檔處理和發(fā)布系統(tǒng)進(jìn)行無(wú)縫資料交換。
結(jié)合語(yǔ)音上網(wǎng)的趨勢(shì),國(guó)內(nèi)的語(yǔ)音廠商們,包括無(wú)限商機(jī)、言豐等也積極推進(jìn)VoiceXML瀏覽器、解釋器的研發(fā)。目前,自主產(chǎn)權(quán)的中文VoiceXML解釋器已經(jīng)發(fā)布,CMIS正基于VoiceXML起草中國(guó)語(yǔ)音互聯(lián)的技術(shù)標(biāo)準(zhǔn)及產(chǎn)品規(guī)范,可望成為中國(guó)語(yǔ)音應(yīng)用的規(guī)范性標(biāo)準(zhǔn)(VAP)。
中國(guó)計(jì)算機(jī)報(bào)