讓電話用戶與Web對話
- VoiceXML帶來Web訪問新概念
2004/04/09
隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)所存儲的信息和提供的服務(wù)與日俱增,改變了人們的生活及工作方式。然而,互聯(lián)網(wǎng)長期以來與擁有眾多用戶的公用電話網(wǎng)脫離,使中國九倍于計算機用戶的電話用戶不能利用電話享受到互聯(lián)網(wǎng)提供的豐富多彩的信息和服務(wù)。雖然計算機的擁有量在不斷的增加,但是在相當長的時間內(nèi),計算機用戶的數(shù)量不會接近電話用戶的數(shù)量。如何使如此龐大的電話用戶群也能訪問互聯(lián)網(wǎng),是一個擺在相關(guān)行業(yè)營運商、內(nèi)容提供商、以及服務(wù)商面前的一個挑戰(zhàn)和商機。
VoiceXML語音擴展描述語言的問世,給互聯(lián)網(wǎng)與公用電話網(wǎng)的融合帶來希望,使互聯(lián)網(wǎng)信息能夠以語音的方式流向電話網(wǎng),使互聯(lián)網(wǎng)服務(wù)能夠延伸到電話用戶。VoiceXML
1.0 是由AT&T、IBM、Lucent Technologies、以及Motorola通過W3C協(xié)會于2000年聯(lián)合推出的電話語音應(yīng)用系統(tǒng)標準。該標準徹底改變了傳統(tǒng)的CTI(計算機電話集成系統(tǒng))
的開發(fā)模式和應(yīng)用范圍,使公用電話網(wǎng)、語音處理技術(shù)、以及互聯(lián)網(wǎng)有機地結(jié)合為一體。VoiceXML 1.0一經(jīng)推出便立即得到世界發(fā)達國家相關(guān)行業(yè)眾多廠商的支持,基于VoiceXML標準的產(chǎn)品不斷涌向市場。
目前人們對HTML已經(jīng)很熟悉,類似于用于Web網(wǎng)頁標記的HTML,VoiceXML是為語音應(yīng)用制訂的語音可擴展標記語言。VoiceXML使公用電話網(wǎng)與互聯(lián)網(wǎng)的結(jié)合體現(xiàn)在三個方面:語音瀏覽器的使用,互聯(lián)網(wǎng)和公用電話網(wǎng)的信息共享,以及類似于Web網(wǎng)頁開發(fā)過程的語音應(yīng)用系統(tǒng)的開發(fā)。
1. 語音瀏覽器
Web瀏覽器(IE和 Netscape) 的出現(xiàn)有力地帶動了互聯(lián)網(wǎng)的發(fā)展,給人們的日常生活和工作方式帶來新的變革。Web瀏覽器是通過計算機終端與文本信息進行交流。類似地,VoiceXML語音瀏覽器是通過電話終端與語音信息進行交流。VoiceXML語音瀏覽的實現(xiàn)主要是依賴于語音處理技術(shù)和類似于Web瀏覽技術(shù)的語音瀏覽技術(shù)。
有了VoiceXML語音瀏覽器,電話用戶可以用語音輸入和傳統(tǒng)的按鍵輸入方式通過電話與語音應(yīng)用系統(tǒng)進行對話交流,語音應(yīng)用系統(tǒng)用語音的方式與用戶對話。在此過程中,語音識別(語音到文字的轉(zhuǎn)換)
和語音合成(文字到語音的轉(zhuǎn)換) 等語音處理技術(shù)起著重要的作用。語音處理技術(shù)的興起和發(fā)展已有相當長的一段時間。然而,語音識別與語音合成技術(shù)真正開始走向?qū)嶋H應(yīng)用還是在最近兩年到三年的時間。語音技術(shù)是使電話用戶能夠用自然語言的方式與Web對話的關(guān)鍵技術(shù)之一。
語音識別功能使得應(yīng)用系統(tǒng)能夠識別電話用戶的語音輸入、將之轉(zhuǎn)換成文本以便計算機處理。近年來,語音識別技術(shù)有長足的發(fā)展,最好的語音識別系統(tǒng)能夠在一定范圍內(nèi)達到自然語言的識別。雖然由于技術(shù)的局限和中國多方言多口音的特征,使得語音識別系統(tǒng)的應(yīng)用受到一定的限制,但是語音識別技術(shù)仍然在不斷地走進人們的日常生活,人們也在開始接受用語音的方式與電話語音系統(tǒng)進行交流。
語音合成技術(shù)相對于語音識別技術(shù)來說在實際應(yīng)用中顯得更成熟。目前,較好語音合成系統(tǒng)已經(jīng)可以達到比較好的可懂度和自然度。語音合成技術(shù)是使互聯(lián)網(wǎng)信息流向公用電話網(wǎng)的關(guān)鍵。例如,在語音門戶站中所提供的文本信息,如及時新聞等,可以利用語音合成技術(shù)將其轉(zhuǎn)換成語音格式并通過電話播放給用戶。擺脫了電話用戶只能收聽到預先錄制好的錄音的傳統(tǒng)使用方式。
除了語音處理技術(shù)之外,VoiceXML語音瀏覽技術(shù)也是電話語音應(yīng)用系統(tǒng)的關(guān)鍵。與HTML類似,VoiceXML使得電話語音應(yīng)用系統(tǒng)根據(jù)對話流所處的狀態(tài)和具體應(yīng)用領(lǐng)域的業(yè)務(wù)需求將對話流程轉(zhuǎn)向下一個互聯(lián)網(wǎng)上的URI鏈接定義的對話流程。在對話流程的定義中,不僅可以訪問互聯(lián)網(wǎng)上的URI文件,而且還可以訪問互聯(lián)網(wǎng)和局域網(wǎng)內(nèi)的數(shù)據(jù)庫。Web瀏覽技術(shù)的引進使電話語音應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)有機地結(jié)合,使電話語音應(yīng)用系統(tǒng)以開放式的方式呈現(xiàn)給電話用戶。
VoiceXML語音瀏覽器利用互聯(lián)網(wǎng)瀏覽技術(shù)將語音處理技術(shù)和互聯(lián)網(wǎng)技術(shù)整合為一體,極大地擴展了電話語音系統(tǒng)的應(yīng)用范圍,同時也使互聯(lián)網(wǎng)的信息和服務(wù)走向電話用戶群,從而使互聯(lián)網(wǎng)贏得更多的用戶。
2. 互聯(lián)網(wǎng)與公用電話網(wǎng)信息共享
互聯(lián)網(wǎng)與公用電話網(wǎng)長期以來出于分離狀態(tài)。隨著互聯(lián)網(wǎng)的飛速發(fā)展和互聯(lián)網(wǎng)信息的迅速增加,讓龐大的電話用戶群(包括固定電話用戶和移動電話用戶)
訪問互聯(lián)網(wǎng)信息和享用互聯(lián)網(wǎng)提供的服務(wù)顯得越來越重要。VoiceXML標準的問世,無疑對互聯(lián)網(wǎng)服務(wù)商、運營商、以及內(nèi)容提供商等是一個極好的商機。
VoiceXML瀏覽技術(shù)是開放式的,VoiceXML瀏覽器可以瀏覽互聯(lián)網(wǎng)上的任何公開的文件和數(shù)據(jù),這使得電話用戶可以借助于語音處理技術(shù)通過電話訪問互聯(lián)網(wǎng)信息。例如,電話用戶可以通過VoiceXML瀏覽器收聽網(wǎng)上新聞、查詢網(wǎng)上數(shù)據(jù)庫、下載和收聽語音文件(如音樂、歌曲、留言、語音郵件等)
。因而,VoiceXML瀏覽技術(shù)的使用,使得互聯(lián)網(wǎng)的信息能夠自然地流向公用電話網(wǎng)。
VoiceXML瀏覽技術(shù)不僅使電話用戶能夠訪問互聯(lián)網(wǎng),也可以將公用電話網(wǎng)信息傳給互聯(lián)網(wǎng)。公用電話網(wǎng)信息與互聯(lián)網(wǎng)信息不同之處在于前者是動態(tài)的、以語音形式為主、隨著電話對話流的結(jié)束而消失。然而,在有些電話語音應(yīng)用系統(tǒng)中,需要將對話流所產(chǎn)生的信息保存起來,以便將來通過Web瀏覽器進行訪問。例如,用戶的語音留言和對話過程等都可以通過電子郵件或文件傳輸?shù)男问絺鞯交ヂ?lián)網(wǎng)。當這些信息被存放在互聯(lián)網(wǎng)中后,互聯(lián)網(wǎng)用戶和電話用戶都可以分別通過Web瀏覽器和VoiceXML瀏覽器訪問這些信息。
VoiceXML瀏覽技術(shù)的引入,使互聯(lián)網(wǎng)和公用電話網(wǎng)得以有機地結(jié)合,使兩網(wǎng)信息可以互相流動,從而使互聯(lián)網(wǎng)與公用電話網(wǎng)達到信息共享。
3. "語音網(wǎng)頁"的開發(fā)
VoiceXML標準的出現(xiàn),不僅改變了語音應(yīng)用系統(tǒng)的使用方法和使用范圍,而且給語音應(yīng)用系統(tǒng)開發(fā)過程帶來全新的概念和模式,使語音應(yīng)用系統(tǒng)的開發(fā)實際上是"語音網(wǎng)頁"的開發(fā)。傳統(tǒng)的電話語音系統(tǒng)開發(fā)是利用CTI(計算機電話集成)技術(shù)將各系統(tǒng)構(gòu)件,如語音卡或交換機,組織和集成起來。開發(fā)人員往往需要熟悉有關(guān)的底層編碼以及深入了解有關(guān)硬件的編程接口,才能建立一個電話語音系統(tǒng)。然而,VoiceXML瀏覽器的使用,可以使電話應(yīng)用系統(tǒng)開發(fā)人員從繁瑣的編程細節(jié)中解脫出來。
語音網(wǎng)頁的開發(fā)不需要了解各系統(tǒng)組成構(gòu)件,如語音識別、語音合成、和語音卡/交換機等的編程接口。類似于Web網(wǎng)頁的開發(fā),語音網(wǎng)頁的開發(fā)人員只需要編寫VoiceXML腳本,從而使開發(fā)人員能夠把精力放在應(yīng)用系統(tǒng)的業(yè)務(wù)流程上。
語音網(wǎng)頁的開發(fā)過程簡單、快捷。開發(fā)人員不需要掌握C/C++或Java等高級計算機編程語言便可以開發(fā)一個完整的電話語音應(yīng)用系統(tǒng)。并且所開發(fā)出來的系統(tǒng)往往比傳統(tǒng)開發(fā)方式開發(fā)出來的系統(tǒng)更開放、功能更強大。
語音網(wǎng)頁的開發(fā)對開發(fā)人員的技術(shù)要求較低、開發(fā)周期大幅度縮短,從而使開發(fā)成本大大降低。所開發(fā)出來的應(yīng)用系統(tǒng)具有很高的可維護性、可移植性、可擴展性、以及可重用性。
下面是一個VoiceXML簡單例子。當用戶與電話語音系統(tǒng)接通以后,將會聽到語音合成的提示"用戶您好!請選擇我們?yōu)槟峁┑姆⻊?wù):" 。當用戶說"股票市場"
,語音瀏覽器(通過語音識別功能識別用戶輸入)將把對話流轉(zhuǎn)向另一個VoiceXML腳本文件stocks.vxml。stocks.vxml腳本文件是一個向用戶提供股票市場相關(guān)服務(wù)的語音網(wǎng)頁。
顯而易見,基于VoiceXML電話語音應(yīng)用系統(tǒng)的開發(fā),拋棄了傳統(tǒng)的CTI開發(fā)模式,使其開發(fā)過程與Web網(wǎng)頁的開發(fā)過程相似。VoiceXML電話語音應(yīng)用系統(tǒng)的開發(fā)過程是語音網(wǎng)頁的開發(fā)過程。
VoiceXML的出現(xiàn),使互聯(lián)網(wǎng)和公用電話網(wǎng)有機地融為一體,從而使得電話用戶能夠通過電話與網(wǎng)頁交流,使公用電話網(wǎng)與互聯(lián)網(wǎng)信息共享,使語音網(wǎng)頁的新概念取代傳統(tǒng)的文字瀏覽的網(wǎng)站,使公用電話網(wǎng)成為互聯(lián)網(wǎng)的延伸,為互聯(lián)網(wǎng)內(nèi)容商、運營商以及服務(wù)商提供了難得的商機。目前,VoiceXML在發(fā)達國家剛興起不久,并迅速地得到相關(guān)行業(yè)的支持和認同。中國在開發(fā)VoiceXML相關(guān)產(chǎn)品方面也是處于剛剛起步的階段,深圳市華琛科技有限公司率先在國內(nèi)推出了VoiceXML語音網(wǎng)關(guān)VGateWAY可以全面應(yīng)用于各類虛擬或自建網(wǎng)站,并同時支持ASP,PHP,CGI,JAVASCRIP等腳本語言。如同編寫HTML語言一樣的簡單方便,它將引導普通網(wǎng)站技術(shù)革新,揭開語音網(wǎng)站新篇章!
華琛科技公司供稿 CTI論壇編輯
VoiceXML刷新CTI的開發(fā)模式 2009-02-11 |
華琛科技推出中小企業(yè)融合通信SaaS平臺 2009-01-20 |
華琛科技SCY語音卡 2007-05-25 |
深圳市華琛科技推出基于國際標準的語音門戶網(wǎng)站 2007-01-26 |
華琛科技推出全新語音通訊工具——VVstation 2007-01-11 |