VoiceXML是由VoiceXML論壇制定的通過電話訪問Internet網(wǎng)絡(luò)的標(biāo)準(zhǔn)。目前,國內(nèi)外共有150多家公司支持這一標(biāo)準(zhǔn),包括華琛科技在內(nèi)的部分公司已開發(fā)出了基于VoiceXML的產(chǎn)品。
VoiceXML是W3C定義的可擴展標(biāo)記語言(XML)的一種擴展,根據(jù)播放的提示信息、口述的命令和可識別的語音或按鍵音輸入,實現(xiàn)人和計算機之間的交互對話。VoiceXML的標(biāo)準(zhǔn)化將簡化Web上具有語音響應(yīng)服務(wù)的個性化界面的創(chuàng)建,使人們能夠通過普通電話訪問網(wǎng)站上的信息和服務(wù), 是電話全面普及后的趨勢所在。
VoiceXML的主要目標(biāo)是希望通過交互式語音界面應(yīng)用Web上已經(jīng)有的大量信息,同時VoiceXML希望能夠?qū)㈤_發(fā)人員從最繁瑣的編程和資源處理工作中解放出來。VoiceXML能夠利用人們已經(jīng)非常熟悉的客戶機/服務(wù)器方式,將語音服務(wù)和數(shù)據(jù)服務(wù)融合起來。
VoiceXML作為一種標(biāo)記語言,主要有以下特點:
1. VoiceXML作為一種通過多重交互作用,使客戶機/服務(wù)器之間的交互工作最小化。
2. 實現(xiàn)應(yīng)用開發(fā)者不必考慮低層的軟件和系統(tǒng)平臺上的軟、硬件細(xì)節(jié)。
3. 將用戶交互作用的代碼(在VoiceXML中)從服務(wù)邏輯(CGI 腳本)中分離出來。
4. 要使提供的服務(wù)能隨處可得,要求這些服務(wù)能夠跨越不同的執(zhí)行平臺。對于內(nèi)容服務(wù)商、工具提供商和平臺提供商來說,VoiceXML是一個公共語言。
5. 使簡單的交互作用非常易于使用,要求所提供的語音界面能支持復(fù)雜的對話。
正因為VoiceXML有以上的特點,以其為基礎(chǔ)的VoPromote語音平臺才具有簡單、對開發(fā)人員技術(shù)要求低、縮短了開發(fā)周期、所生成的產(chǎn)品操作簡單等特點。
與WAP相比,VoiceXML有突出的優(yōu)點。由于手持移動設(shè)備(如WAP手機)只有很小的顯示屏,有限的輸入能力和有限的處理功能,文本界面的數(shù)據(jù)處理設(shè)備很難被使用。VoiceXML不存在這些限制,用戶可以通過聲音和相關(guān)操作與系統(tǒng)對話,通過一系列的對話選擇,找到所需的信息。服務(wù)器上的語音識別軟件把用戶的輸入語音的選擇轉(zhuǎn)換成文本的選擇,這一過程與在傳統(tǒng)的網(wǎng)頁上選擇一個超連接類似。對話選擇的結(jié)果由相應(yīng)的音頻文件播放(可以是事先錄下的或采用TTS技術(shù)動態(tài)產(chǎn)生)。
在手機等手持移動設(shè)備上通過語音而不是煩瑣的輸入來獲取信息和服務(wù)更符合人們的習(xí)慣,隨著語音信號處理技術(shù),特別是ASR和TTS技術(shù)的發(fā)展,語音將成為人機交互的一種主要形式。
沒有規(guī)矩不成方圓,業(yè)內(nèi)的技術(shù)從各自為陣到有標(biāo)準(zhǔn)可依,使開發(fā)員有了共同的語言,也讓客戶不必終身依賴一家開發(fā)商來做系統(tǒng)維護,從而健全了業(yè)內(nèi)制度、引入相互間的合理競爭,更有利于CTI技術(shù)在企業(yè)間的相互促進與發(fā)展。華琛科技VoPromote語音平臺在國內(nèi)率先使用該標(biāo)準(zhǔn),也是VoiceXML在國內(nèi)的重要突破,華琛科技渴望以此為交流語言與全國同行"對話",VoiceXML將在國內(nèi)全面普及。
華琛科技公司供稿 CTI論壇編輯