簡(jiǎn)化語音應(yīng)用開發(fā)
——VoiceXML2.0新標(biāo)準(zhǔn)即將確定
陳聰 2002/03/18
VoiceXML1.0面向互聯(lián)網(wǎng)的語音支持功能為進(jìn)一步開掘互聯(lián)網(wǎng)資源的價(jià)值鋪平了道路。VoiceXML2.0的出現(xiàn),又為互聯(lián)網(wǎng)語音應(yīng)用的開發(fā)者提供了更強(qiáng)大的詞匯和語法生成及擴(kuò)充工具。
VoiceXML促進(jìn)語音上網(wǎng)
圍繞VoiceXML標(biāo)記語言,業(yè)界差不多已經(jīng)討論了三年。通過VoiceXML,互聯(lián)網(wǎng)語音應(yīng)用運(yùn)營商能向電話用戶發(fā)布他們感興趣的信息,就像管理Web頁的網(wǎng)管人員向Web服務(wù)器發(fā)布網(wǎng)頁內(nèi)容那樣,而且發(fā)布的信息內(nèi)容也與一般的垂直服務(wù)網(wǎng)站所提供的內(nèi)容差不多,如訂貨信息、股票查詢、航班時(shí)刻等等,不一而足。
在VoiceXML應(yīng)用環(huán)境中,VoiceXML “頁”與HTML頁一樣,無論發(fā)出頁面請(qǐng)求的瀏覽器與提供指定頁面的服務(wù)器相距多么遙遠(yuǎn),都能通過HTTP協(xié)議在服務(wù)器間鏈接或返回。與IVR(交互式語音應(yīng)答系統(tǒng))“一個(gè)號(hào)碼一根線”這種簡(jiǎn)單的服務(wù)平臺(tái)相比,VoiceXML瀏覽的是一種真正意義上自由漫游的語音Web頁。與HTML不同的是,VoiceXML中的瀏覽器不在用戶端,它實(shí)際上是由一組由用戶導(dǎo)航命令、用戶定制命令、語音識(shí)別以及TTS算法(文本轉(zhuǎn)換成語音)等組件構(gòu)成的VoiceXML解釋軟件。由于電話主叫用戶在訪問VoiceXML頁時(shí)只有語音和電話按鍵這兩種交互方式,因此對(duì)用戶來說,只相當(dāng)于有了鍵盤、鼠標(biāo)和瀏覽器顯示屏幕,而不具有瀏覽器本身。
新版更易用
隨著VoiceXML的問世,眾多服務(wù)器平臺(tái)和瀏覽器產(chǎn)品紛紛涌現(xiàn)。截至目前,VoiceXML已身歷兩代。2000年5月,由AT&T、Lucent、Motorola和IBM幾大公司組成的VoiceXML論壇向W3C提交了VoiceXML1.0。此后,由60多家公司組成的W3C語音瀏覽器工作組醞釀產(chǎn)生了VoiceXML2.0,并于去年10月公開發(fā)布,旨在征求各方意見。最終的“推薦標(biāo)準(zhǔn)”預(yù)計(jì)將于今年年底公布。
不斷成熟的VoiceXML一直在追求更強(qiáng)的功能、更簡(jiǎn)潔的表達(dá)方式,并盡量少地讓開發(fā)者自己去做類似于編寫動(dòng)態(tài)語法代碼這樣的工作。VoiceXML2.0進(jìn)一步對(duì)TTS控制和語音識(shí)別語法格式進(jìn)行了標(biāo)準(zhǔn)化,對(duì)全局會(huì)話描述的結(jié)構(gòu)增加了更嚴(yán)密的定義。
業(yè)內(nèi)專家對(duì)VoiceXML2.0的修改意見主要集中在三個(gè)方面。一、對(duì)應(yīng)用平臺(tái)間和文檔間的互操作特性進(jìn)行規(guī)范。要做的工作主要有:進(jìn)一步明晰VoiceXML1.0中某些表述含混的地方;確定VoiceXML解釋平臺(tái)的最低配置要求;對(duì)語法和用戶提示進(jìn)行標(biāo)準(zhǔn)化;為驗(yàn)證一致性,開發(fā)一個(gè)測(cè)試協(xié)議。二、在VoiceXML不依靠低級(jí)代碼所完成的最基本功能之外,再增添一些增強(qiáng)型組件。三、增強(qiáng)可讀性。
W3C語音瀏覽器的另一個(gè)工作小組目前正在制訂呼叫控制規(guī)范,內(nèi)容包括呼叫初始化和第三方會(huì)議等,當(dāng)前的研究目標(biāo)是使呼叫控制實(shí)現(xiàn)協(xié)議的獨(dú)立。如果要實(shí)現(xiàn)更復(fù)雜的呼叫控制功能,就可能需要一種單獨(dú)的呼叫控制語言對(duì)現(xiàn)行各種電話標(biāo)準(zhǔn)進(jìn)行重組。目前,已經(jīng)有中間件提供商在VoiceXML上增加了自定義的呼叫控制標(biāo)記,還有像Voxeo這樣的廠商甚至還開發(fā)了自己的呼叫控制標(biāo)記語言。
這樣,VoiceXML2.0標(biāo)準(zhǔn)增強(qiáng)了實(shí)用性和易用性,更方便實(shí)現(xiàn)語音在互聯(lián)網(wǎng)之上的交互,使簡(jiǎn)易終端設(shè)備訪問互聯(lián)網(wǎng)成為現(xiàn)實(shí),可以與數(shù)據(jù)庫、HTML、WML以及其它文檔處理和發(fā)布系統(tǒng)進(jìn)行無縫資料交換。
國內(nèi)語音應(yīng)用標(biāo)準(zhǔn)在形成
結(jié)合語音上網(wǎng)的趨勢(shì),國內(nèi)的語音廠商們,包括無限商機(jī)、言豐等也積極推進(jìn)VoiceXML瀏覽器、解釋器的研發(fā)。目前,自主產(chǎn)權(quán)的中文VoiceXML解釋器已經(jīng)發(fā)布,CMIS正基于VoiceXML起草中國語音互聯(lián)的技術(shù)標(biāo)準(zhǔn)及產(chǎn)品規(guī)范,可望成為中國語音應(yīng)用的規(guī)范性標(biāo)準(zhǔn)(VAP)。
中國計(jì)算機(jī)報(bào)
Voxeo攜Prophecy10高度亮相SpeechTEK2009 2009-09-03 |
Voxeo被評(píng)為世界領(lǐng)先的IVR平臺(tái)供應(yīng)廠商之一 2009-06-11 |
北電推出Meridian Option 11C最新升級(jí)計(jì)劃 2009-06-01 |
康維可視語音郵件使手機(jī)消息“即點(diǎn)即聽” 2009-04-10 |
谷歌推網(wǎng)絡(luò)電話服務(wù) 比Skype便宜三分之一 2009-03-12 |