VoPromote語音平臺詮釋VoiceXML精髓
2004/01/17
VoiceXML是由VoiceXML論壇制定的通過電話訪問Internet網(wǎng)絡(luò)的標(biāo)準(zhǔn)。目前,國內(nèi)外共有150多家公司支持這一標(biāo)準(zhǔn),包括華琛科技在內(nèi)的部分公司已開發(fā)出了基于VoiceXML的產(chǎn)品。
VoiceXML是W3C定義的可擴(kuò)展標(biāo)記語言(XML)的一種擴(kuò)展,根據(jù)播放的提示信息、口述的命令和可識別的語音或按鍵音輸入,實(shí)現(xiàn)人和計(jì)算機(jī)之間的交互對話。VoiceXML的標(biāo)準(zhǔn)化將簡化Web上具有語音響應(yīng)服務(wù)的個(gè)性化界面的創(chuàng)建,使人們能夠通過普通電話訪問網(wǎng)站上的信息和服務(wù),
是電話全面普及后的趨勢所在。
VoiceXML的主要目標(biāo)是希望通過交互式語音界面應(yīng)用Web上已經(jīng)有的大量信息,同時(shí)VoiceXML希望能夠?qū)㈤_發(fā)人員從最繁瑣的編程和資源處理工作中解放出來。VoiceXML能夠利用人們已經(jīng)非常熟悉的客戶機(jī)/服務(wù)器方式,將語音服務(wù)和數(shù)據(jù)服務(wù)融合起來。
VoiceXML作為一種標(biāo)記語言,主要有以下特點(diǎn):
1. VoiceXML作為一種通過多重交互作用,使客戶機(jī)/服務(wù)器之間的交互工作最小化。
2. 實(shí)現(xiàn)應(yīng)用開發(fā)者不必考慮低層的軟件和系統(tǒng)平臺上的軟、硬件細(xì)節(jié)。
3. 將用戶交互作用的代碼(在VoiceXML中)從服務(wù)邏輯(CGI 腳本)中分離出來。
4. 要使提供的服務(wù)能隨處可得,要求這些服務(wù)能夠跨越不同的執(zhí)行平臺。對于內(nèi)容服務(wù)商、工具提供商和平臺提供商來說,VoiceXML是一個(gè)公共語言。
5. 使簡單的交互作用非常易于使用,要求所提供的語音界面能支持復(fù)雜的對話。
正因?yàn)閂oiceXML有以上的特點(diǎn),以其為基礎(chǔ)的VoPromote語音平臺才具有簡單、對開發(fā)人員技術(shù)要求低、縮短了開發(fā)周期、所生成的產(chǎn)品操作簡單等特點(diǎn)。
與WAP相比,VoiceXML有突出的優(yōu)點(diǎn)。由于手持移動設(shè)備(如WAP手機(jī))只有很小的顯示屏,有限的輸入能力和有限的處理功能,文本界面的數(shù)據(jù)處理設(shè)備很難被使用。VoiceXML不存在這些限制,用戶可以通過聲音和相關(guān)操作與系統(tǒng)對話,通過一系列的對話選擇,找到所需的信息。服務(wù)器上的語音識別軟件把用戶的輸入語音的選擇轉(zhuǎn)換成文本的選擇,這一過程與在傳統(tǒng)的網(wǎng)頁上選擇一個(gè)超連接類似。對話選擇的結(jié)果由相應(yīng)的音頻文件播放(可以是事先錄下的或采用TTS技術(shù)動態(tài)產(chǎn)生)。
在手機(jī)等手持移動設(shè)備上通過語音而不是煩瑣的輸入來獲取信息和服務(wù)更符合人們的習(xí)慣,隨著語音信號處理技術(shù),特別是ASR和TTS技術(shù)的發(fā)展,語音將成為人機(jī)交互的一種主要形式。
沒有規(guī)矩不成方圓,業(yè)內(nèi)的技術(shù)從各自為陣到有標(biāo)準(zhǔn)可依,使開發(fā)員有了共同的語言,也讓客戶不必終身依賴一家開發(fā)商來做系統(tǒng)維護(hù),從而健全了業(yè)內(nèi)制度、引入相互間的合理競爭,更有利于CTI技術(shù)在企業(yè)間的相互促進(jìn)與發(fā)展。華琛科技VoPromote語音平臺在國內(nèi)率先使用該標(biāo)準(zhǔn),也是VoiceXML在國內(nèi)的重要突破,華琛科技渴望以此為交流語言與全國同行"對話",VoiceXML將在國內(nèi)全面普及。
華琛科技公司供稿 CTI論壇編輯
相關(guān)鏈接: