讓電話用戶與Web對(duì)話
- VoiceXML帶來(lái)Web訪問(wèn)新概念
2004/04/09
隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)所存儲(chǔ)的信息和提供的服務(wù)與日俱增,改變了人們的生活及工作方式。然而,互聯(lián)網(wǎng)長(zhǎng)期以來(lái)與擁有眾多用戶的公用電話網(wǎng)脫離,使中國(guó)九倍于計(jì)算機(jī)用戶的電話用戶不能利用電話享受到互聯(lián)網(wǎng)提供的豐富多彩的信息和服務(wù)。雖然計(jì)算機(jī)的擁有量在不斷的增加,但是在相當(dāng)長(zhǎng)的時(shí)間內(nèi),計(jì)算機(jī)用戶的數(shù)量不會(huì)接近電話用戶的數(shù)量。如何使如此龐大的電話用戶群也能訪問(wèn)互聯(lián)網(wǎng),是一個(gè)擺在相關(guān)行業(yè)營(yíng)運(yùn)商、內(nèi)容提供商、以及服務(wù)商面前的一個(gè)挑戰(zhàn)和商機(jī)。
VoiceXML語(yǔ)音擴(kuò)展描述語(yǔ)言的問(wèn)世,給互聯(lián)網(wǎng)與公用電話網(wǎng)的融合帶來(lái)希望,使互聯(lián)網(wǎng)信息能夠以語(yǔ)音的方式流向電話網(wǎng),使互聯(lián)網(wǎng)服務(wù)能夠延伸到電話用戶。VoiceXML
1.0 是由AT&T、IBM、Lucent Technologies、以及Motorola通過(guò)W3C協(xié)會(huì)于2000年聯(lián)合推出的電話語(yǔ)音應(yīng)用系統(tǒng)標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)徹底改變了傳統(tǒng)的CTI(計(jì)算機(jī)電話集成系統(tǒng))
的開(kāi)發(fā)模式和應(yīng)用范圍,使公用電話網(wǎng)、語(yǔ)音處理技術(shù)、以及互聯(lián)網(wǎng)有機(jī)地結(jié)合為一體。VoiceXML 1.0一經(jīng)推出便立即得到世界發(fā)達(dá)國(guó)家相關(guān)行業(yè)眾多廠商的支持,基于VoiceXML標(biāo)準(zhǔn)的產(chǎn)品不斷涌向市場(chǎng)。
目前人們對(duì)HTML已經(jīng)很熟悉,類(lèi)似于用于Web網(wǎng)頁(yè)標(biāo)記的HTML,VoiceXML是為語(yǔ)音應(yīng)用制訂的語(yǔ)音可擴(kuò)展標(biāo)記語(yǔ)言。VoiceXML使公用電話網(wǎng)與互聯(lián)網(wǎng)的結(jié)合體現(xiàn)在三個(gè)方面:語(yǔ)音瀏覽器的使用,互聯(lián)網(wǎng)和公用電話網(wǎng)的信息共享,以及類(lèi)似于Web網(wǎng)頁(yè)開(kāi)發(fā)過(guò)程的語(yǔ)音應(yīng)用系統(tǒng)的開(kāi)發(fā)。
1. 語(yǔ)音瀏覽器
Web瀏覽器(IE和 Netscape) 的出現(xiàn)有力地帶動(dòng)了互聯(lián)網(wǎng)的發(fā)展,給人們的日常生活和工作方式帶來(lái)新的變革。Web瀏覽器是通過(guò)計(jì)算機(jī)終端與文本信息進(jìn)行交流。類(lèi)似地,VoiceXML語(yǔ)音瀏覽器是通過(guò)電話終端與語(yǔ)音信息進(jìn)行交流。VoiceXML語(yǔ)音瀏覽的實(shí)現(xiàn)主要是依賴(lài)于語(yǔ)音處理技術(shù)和類(lèi)似于Web瀏覽技術(shù)的語(yǔ)音瀏覽技術(shù)。
有了VoiceXML語(yǔ)音瀏覽器,電話用戶可以用語(yǔ)音輸入和傳統(tǒng)的按鍵輸入方式通過(guò)電話與語(yǔ)音應(yīng)用系統(tǒng)進(jìn)行對(duì)話交流,語(yǔ)音應(yīng)用系統(tǒng)用語(yǔ)音的方式與用戶對(duì)話。在此過(guò)程中,語(yǔ)音識(shí)別(語(yǔ)音到文字的轉(zhuǎn)換)
和語(yǔ)音合成(文字到語(yǔ)音的轉(zhuǎn)換) 等語(yǔ)音處理技術(shù)起著重要的作用。語(yǔ)音處理技術(shù)的興起和發(fā)展已有相當(dāng)長(zhǎng)的一段時(shí)間。然而,語(yǔ)音識(shí)別與語(yǔ)音合成技術(shù)真正開(kāi)始走向?qū)嶋H應(yīng)用還是在最近兩年到三年的時(shí)間。語(yǔ)音技術(shù)是使電話用戶能夠用自然語(yǔ)言的方式與Web對(duì)話的關(guān)鍵技術(shù)之一。
語(yǔ)音識(shí)別功能使得應(yīng)用系統(tǒng)能夠識(shí)別電話用戶的語(yǔ)音輸入、將之轉(zhuǎn)換成文本以便計(jì)算機(jī)處理。近年來(lái),語(yǔ)音識(shí)別技術(shù)有長(zhǎng)足的發(fā)展,最好的語(yǔ)音識(shí)別系統(tǒng)能夠在一定范圍內(nèi)達(dá)到自然語(yǔ)言的識(shí)別。雖然由于技術(shù)的局限和中國(guó)多方言多口音的特征,使得語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用受到一定的限制,但是語(yǔ)音識(shí)別技術(shù)仍然在不斷地走進(jìn)人們的日常生活,人們也在開(kāi)始接受用語(yǔ)音的方式與電話語(yǔ)音系統(tǒng)進(jìn)行交流。
語(yǔ)音合成技術(shù)相對(duì)于語(yǔ)音識(shí)別技術(shù)來(lái)說(shuō)在實(shí)際應(yīng)用中顯得更成熟。目前,較好語(yǔ)音合成系統(tǒng)已經(jīng)可以達(dá)到比較好的可懂度和自然度。語(yǔ)音合成技術(shù)是使互聯(lián)網(wǎng)信息流向公用電話網(wǎng)的關(guān)鍵。例如,在語(yǔ)音門(mén)戶站中所提供的文本信息,如及時(shí)新聞等,可以利用語(yǔ)音合成技術(shù)將其轉(zhuǎn)換成語(yǔ)音格式并通過(guò)電話播放給用戶。擺脫了電話用戶只能收聽(tīng)到預(yù)先錄制好的錄音的傳統(tǒng)使用方式。
除了語(yǔ)音處理技術(shù)之外,VoiceXML語(yǔ)音瀏覽技術(shù)也是電話語(yǔ)音應(yīng)用系統(tǒng)的關(guān)鍵。與HTML類(lèi)似,VoiceXML使得電話語(yǔ)音應(yīng)用系統(tǒng)根據(jù)對(duì)話流所處的狀態(tài)和具體應(yīng)用領(lǐng)域的業(yè)務(wù)需求將對(duì)話流程轉(zhuǎn)向下一個(gè)互聯(lián)網(wǎng)上的URI鏈接定義的對(duì)話流程。在對(duì)話流程的定義中,不僅可以訪問(wèn)互聯(lián)網(wǎng)上的URI文件,而且還可以訪問(wèn)互聯(lián)網(wǎng)和局域網(wǎng)內(nèi)的數(shù)據(jù)庫(kù)。Web瀏覽技術(shù)的引進(jìn)使電話語(yǔ)音應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)有機(jī)地結(jié)合,使電話語(yǔ)音應(yīng)用系統(tǒng)以開(kāi)放式的方式呈現(xiàn)給電話用戶。
VoiceXML語(yǔ)音瀏覽器利用互聯(lián)網(wǎng)瀏覽技術(shù)將語(yǔ)音處理技術(shù)和互聯(lián)網(wǎng)技術(shù)整合為一體,極大地?cái)U(kuò)展了電話語(yǔ)音系統(tǒng)的應(yīng)用范圍,同時(shí)也使互聯(lián)網(wǎng)的信息和服務(wù)走向電話用戶群,從而使互聯(lián)網(wǎng)贏得更多的用戶。
2. 互聯(lián)網(wǎng)與公用電話網(wǎng)信息共享
互聯(lián)網(wǎng)與公用電話網(wǎng)長(zhǎng)期以來(lái)出于分離狀態(tài)。隨著互聯(lián)網(wǎng)的飛速發(fā)展和互聯(lián)網(wǎng)信息的迅速增加,讓龐大的電話用戶群(包括固定電話用戶和移動(dòng)電話用戶)
訪問(wèn)互聯(lián)網(wǎng)信息和享用互聯(lián)網(wǎng)提供的服務(wù)顯得越來(lái)越重要。VoiceXML標(biāo)準(zhǔn)的問(wèn)世,無(wú)疑對(duì)互聯(lián)網(wǎng)服務(wù)商、運(yùn)營(yíng)商、以及內(nèi)容提供商等是一個(gè)極好的商機(jī)。
VoiceXML瀏覽技術(shù)是開(kāi)放式的,VoiceXML瀏覽器可以瀏覽互聯(lián)網(wǎng)上的任何公開(kāi)的文件和數(shù)據(jù),這使得電話用戶可以借助于語(yǔ)音處理技術(shù)通過(guò)電話訪問(wèn)互聯(lián)網(wǎng)信息。例如,電話用戶可以通過(guò)VoiceXML瀏覽器收聽(tīng)網(wǎng)上新聞、查詢(xún)網(wǎng)上數(shù)據(jù)庫(kù)、下載和收聽(tīng)語(yǔ)音文件(如音樂(lè)、歌曲、留言、語(yǔ)音郵件等)
。因而,VoiceXML瀏覽技術(shù)的使用,使得互聯(lián)網(wǎng)的信息能夠自然地流向公用電話網(wǎng)。
VoiceXML瀏覽技術(shù)不僅使電話用戶能夠訪問(wèn)互聯(lián)網(wǎng),也可以將公用電話網(wǎng)信息傳給互聯(lián)網(wǎng)。公用電話網(wǎng)信息與互聯(lián)網(wǎng)信息不同之處在于前者是動(dòng)態(tài)的、以語(yǔ)音形式為主、隨著電話對(duì)話流的結(jié)束而消失。然而,在有些電話語(yǔ)音應(yīng)用系統(tǒng)中,需要將對(duì)話流所產(chǎn)生的信息保存起來(lái),以便將來(lái)通過(guò)Web瀏覽器進(jìn)行訪問(wèn)。例如,用戶的語(yǔ)音留言和對(duì)話過(guò)程等都可以通過(guò)電子郵件或文件傳輸?shù)男问絺鞯交ヂ?lián)網(wǎng)。當(dāng)這些信息被存放在互聯(lián)網(wǎng)中后,互聯(lián)網(wǎng)用戶和電話用戶都可以分別通過(guò)Web瀏覽器和VoiceXML瀏覽器訪問(wèn)這些信息。
VoiceXML瀏覽技術(shù)的引入,使互聯(lián)網(wǎng)和公用電話網(wǎng)得以有機(jī)地結(jié)合,使兩網(wǎng)信息可以互相流動(dòng),從而使互聯(lián)網(wǎng)與公用電話網(wǎng)達(dá)到信息共享。
3. "語(yǔ)音網(wǎng)頁(yè)"的開(kāi)發(fā)
VoiceXML標(biāo)準(zhǔn)的出現(xiàn),不僅改變了語(yǔ)音應(yīng)用系統(tǒng)的使用方法和使用范圍,而且給語(yǔ)音應(yīng)用系統(tǒng)開(kāi)發(fā)過(guò)程帶來(lái)全新的概念和模式,使語(yǔ)音應(yīng)用系統(tǒng)的開(kāi)發(fā)實(shí)際上是"語(yǔ)音網(wǎng)頁(yè)"的開(kāi)發(fā)。傳統(tǒng)的電話語(yǔ)音系統(tǒng)開(kāi)發(fā)是利用CTI(計(jì)算機(jī)電話集成)技術(shù)將各系統(tǒng)構(gòu)件,如語(yǔ)音卡或交換機(jī),組織和集成起來(lái)。開(kāi)發(fā)人員往往需要熟悉有關(guān)的底層編碼以及深入了解有關(guān)硬件的編程接口,才能建立一個(gè)電話語(yǔ)音系統(tǒng)。然而,VoiceXML瀏覽器的使用,可以使電話應(yīng)用系統(tǒng)開(kāi)發(fā)人員從繁瑣的編程細(xì)節(jié)中解脫出來(lái)。
語(yǔ)音網(wǎng)頁(yè)的開(kāi)發(fā)不需要了解各系統(tǒng)組成構(gòu)件,如語(yǔ)音識(shí)別、語(yǔ)音合成、和語(yǔ)音卡/交換機(jī)等的編程接口。類(lèi)似于Web網(wǎng)頁(yè)的開(kāi)發(fā),語(yǔ)音網(wǎng)頁(yè)的開(kāi)發(fā)人員只需要編寫(xiě)VoiceXML腳本,從而使開(kāi)發(fā)人員能夠把精力放在應(yīng)用系統(tǒng)的業(yè)務(wù)流程上。
語(yǔ)音網(wǎng)頁(yè)的開(kāi)發(fā)過(guò)程簡(jiǎn)單、快捷。開(kāi)發(fā)人員不需要掌握C/C++或Java等高級(jí)計(jì)算機(jī)編程語(yǔ)言便可以開(kāi)發(fā)一個(gè)完整的電話語(yǔ)音應(yīng)用系統(tǒng)。并且所開(kāi)發(fā)出來(lái)的系統(tǒng)往往比傳統(tǒng)開(kāi)發(fā)方式開(kāi)發(fā)出來(lái)的系統(tǒng)更開(kāi)放、功能更強(qiáng)大。
語(yǔ)音網(wǎng)頁(yè)的開(kāi)發(fā)對(duì)開(kāi)發(fā)人員的技術(shù)要求較低、開(kāi)發(fā)周期大幅度縮短,從而使開(kāi)發(fā)成本大大降低。所開(kāi)發(fā)出來(lái)的應(yīng)用系統(tǒng)具有很高的可維護(hù)性、可移植性、可擴(kuò)展性、以及可重用性。
下面是一個(gè)VoiceXML簡(jiǎn)單例子。當(dāng)用戶與電話語(yǔ)音系統(tǒng)接通以后,將會(huì)聽(tīng)到語(yǔ)音合成的提示"用戶您好!請(qǐng)選擇我們?yōu)槟峁┑姆⻊?wù):" 。當(dāng)用戶說(shuō)"股票市場(chǎng)"
,語(yǔ)音瀏覽器(通過(guò)語(yǔ)音識(shí)別功能識(shí)別用戶輸入)將把對(duì)話流轉(zhuǎn)向另一個(gè)VoiceXML腳本文件stocks.vxml。stocks.vxml腳本文件是一個(gè)向用戶提供股票市場(chǎng)相關(guān)服務(wù)的語(yǔ)音網(wǎng)頁(yè)。
顯而易見(jiàn),基于VoiceXML電話語(yǔ)音應(yīng)用系統(tǒng)的開(kāi)發(fā),拋棄了傳統(tǒng)的CTI開(kāi)發(fā)模式,使其開(kāi)發(fā)過(guò)程與Web網(wǎng)頁(yè)的開(kāi)發(fā)過(guò)程相似。VoiceXML電話語(yǔ)音應(yīng)用系統(tǒng)的開(kāi)發(fā)過(guò)程是語(yǔ)音網(wǎng)頁(yè)的開(kāi)發(fā)過(guò)程。
VoiceXML的出現(xiàn),使互聯(lián)網(wǎng)和公用電話網(wǎng)有機(jī)地融為一體,從而使得電話用戶能夠通過(guò)電話與網(wǎng)頁(yè)交流,使公用電話網(wǎng)與互聯(lián)網(wǎng)信息共享,使語(yǔ)音網(wǎng)頁(yè)的新概念取代傳統(tǒng)的文字瀏覽的網(wǎng)站,使公用電話網(wǎng)成為互聯(lián)網(wǎng)的延伸,為互聯(lián)網(wǎng)內(nèi)容商、運(yùn)營(yíng)商以及服務(wù)商提供了難得的商機(jī)。目前,VoiceXML在發(fā)達(dá)國(guó)家剛興起不久,并迅速地得到相關(guān)行業(yè)的支持和認(rèn)同。中國(guó)在開(kāi)發(fā)VoiceXML相關(guān)產(chǎn)品方面也是處于剛剛起步的階段,深圳市華琛科技有限公司率先在國(guó)內(nèi)推出了VoiceXML語(yǔ)音網(wǎng)關(guān)VGateWAY可以全面應(yīng)用于各類(lèi)虛擬或自建網(wǎng)站,并同時(shí)支持ASP,PHP,CGI,JAVASCRIP等腳本語(yǔ)言。如同編寫(xiě)HTML語(yǔ)言一樣的簡(jiǎn)單方便,它將引導(dǎo)普通網(wǎng)站技術(shù)革新,揭開(kāi)語(yǔ)音網(wǎng)站新篇章!
華琛科技公司供稿 CTI論壇編輯
VoiceXML刷新CTI的開(kāi)發(fā)模式 2009-02-11 |
華琛科技推出中小企業(yè)融合通信SaaS平臺(tái) 2009-01-20 |
華琛科技SCY語(yǔ)音卡 2007-05-25 |
深圳市華琛科技推出基于國(guó)際標(biāo)準(zhǔn)的語(yǔ)音門(mén)戶網(wǎng)站 2007-01-26 |
華琛科技推出全新語(yǔ)音通訊工具——VVstation 2007-01-11 |