VoiceXML語(yǔ)音上網(wǎng)
2004/04/12
有許多交互式語(yǔ)音應(yīng)用程序可以讓用戶(hù)通過(guò)按鍵式電話與計(jì)算機(jī)交流。但是,通常呼叫者需要瀏覽的菜單很長(zhǎng),而且很花時(shí)間。同時(shí),讓呼叫者一邊聽(tīng)電話,一邊在蜂窩電話的小型鍵盤(pán)上搜索并且按鈕要按得正確,是很困難的事情。因此用戶(hù)需要IVR用戶(hù)界面來(lái)與計(jì)算機(jī)交流。
VoiceXML 2.0是一種標(biāo)記語(yǔ)言,用來(lái)構(gòu)建語(yǔ)音界面——有語(yǔ)音的 HTML。語(yǔ)音瀏覽器類(lèi)似 Web 瀏覽器,它通過(guò)解釋VoiceXML 2.0腳本來(lái)向用戶(hù)提供語(yǔ)音信息并接受用戶(hù)的語(yǔ)音請(qǐng)求。
萬(wàn)維網(wǎng)聯(lián)盟(W3C,World Wide Web Consortium)全力推薦使用VoiceXML 2.0,它通常被理解為一種Web標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)添加了語(yǔ)音識(shí)別語(yǔ)法格式,用來(lái)識(shí)別用戶(hù)可能就提示回答的字詞,上一版本沒(méi)有這一功能。
為了更好地理解VoiceXML 2.0,可以將VoiceXML和HTML進(jìn)行類(lèi)比。采用HTML的Web應(yīng)用可以分為兩部分:瀏覽器和Web服務(wù)器。相應(yīng)地,VoiceXML涉及的組件也可分為語(yǔ)音瀏覽器和相當(dāng)于Web服務(wù)器功能的應(yīng)用服務(wù)器。
由于電話(包括很多蜂窩電話)沒(méi)有計(jì)算功能,無(wú)法管理語(yǔ)音瀏覽器,所以語(yǔ)音瀏覽器駐留在網(wǎng)絡(luò)上的語(yǔ)音服務(wù)器中。語(yǔ)音服務(wù)器可以位于企業(yè)數(shù)據(jù)中心,或者位于主管供應(yīng)商處。用戶(hù)撥叫一臺(tái)語(yǔ)音服務(wù)器,該服務(wù)器從一臺(tái)應(yīng)用服務(wù)器上下載VoiceXML 2.0腳本、語(yǔ)法格式和聲音文件。語(yǔ)音瀏覽器以一種語(yǔ)音信息的形式將VoiceXML 2.0腳本翻譯給用戶(hù)聽(tīng),語(yǔ)音信息可以是預(yù)先錄制的語(yǔ)音,或經(jīng)由一個(gè)文本語(yǔ)音合成器產(chǎn)生的文本。然后語(yǔ)音瀏覽器調(diào)用一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)軟件,使用語(yǔ)法格式來(lái)識(shí)別出用戶(hù)響應(yīng)的語(yǔ)音詞匯。
下面我們來(lái)看一個(gè)具體的例子:
系統(tǒng):“歡迎致電小李。請(qǐng)問(wèn)您想接通銷(xiāo)售部門(mén)、會(huì)計(jì)部門(mén)還是維護(hù)部門(mén)?”
用戶(hù):“維護(hù)部門(mén)。”
ASR 將識(shí)別用戶(hù)的語(yǔ)音回復(fù)。在上面這個(gè)例子中,語(yǔ)法格式只包括三個(gè)詞:“銷(xiāo)售部門(mén)”、“會(huì)計(jì)部門(mén)”和“維護(hù)部門(mén)”。由于ASR的語(yǔ)法格式僅由有限數(shù)量的單詞組成,這種語(yǔ)法驅(qū)動(dòng)的ASR比起聽(tīng)寫(xiě)式ASR執(zhí)行更為精確。聽(tīng)寫(xiě)式ASR則是試圖識(shí)別用戶(hù)說(shuō)出的大多數(shù)英語(yǔ)或其他語(yǔ)言的單詞。
開(kāi)發(fā)人員使用VoiceXML 2.0來(lái)為多種應(yīng)用程序和信息(包括有時(shí)效性的數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和個(gè)人信息)提供電話用戶(hù)界面。有了這些應(yīng)用程序,用戶(hù)只需要從任意電話撥入,表明身份并請(qǐng)求所需的信息,就可以隨時(shí)隨地訪問(wèn)企業(yè)數(shù)據(jù)?蛻(hù)還可以使用這些系統(tǒng)來(lái)訪問(wèn)訂單狀態(tài);以及目錄、交付和賬戶(hù)信息。
有許多交互式語(yǔ)音應(yīng)用程序可以讓用戶(hù)通過(guò)按鍵式電話與計(jì)算機(jī)交流。但是,通常呼叫者需要瀏覽的菜單很長(zhǎng),而且很花時(shí)間。同時(shí),讓呼叫者一邊聽(tīng)電話,一邊在蜂窩電話的小型鍵盤(pán)上搜索并且按鈕要按得正確,是很困難的事情。因此用戶(hù)需要IVR用戶(hù)界面來(lái)與計(jì)算機(jī)交流。
VoiceXML 2.0是一種標(biāo)記語(yǔ)言,用來(lái)構(gòu)建語(yǔ)音界面——有語(yǔ)音的 HTML。語(yǔ)音瀏覽器類(lèi)似 Web 瀏覽器,它通過(guò)解釋VoiceXML 2.0腳本來(lái)向用戶(hù)提供語(yǔ)音信息并接受用戶(hù)的語(yǔ)音請(qǐng)求。
萬(wàn)維網(wǎng)聯(lián)盟(W3C,World Wide Web Consortium)全力推薦使用VoiceXML 2.0,它通常被理解為一種Web標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)添加了語(yǔ)音識(shí)別語(yǔ)法格式,用來(lái)識(shí)別用戶(hù)可能就提示回答的字詞,上一版本沒(méi)有這一功能。
為了更好地理解VoiceXML 2.0,可以將VoiceXML和HTML進(jìn)行類(lèi)比。采用HTML的Web應(yīng)用可以分為兩部分:瀏覽器和Web服務(wù)器。相應(yīng)地,VoiceXML涉及的組件也可分為語(yǔ)音瀏覽器和相當(dāng)于Web服務(wù)器功能的應(yīng)用服務(wù)器。
由于電話(包括很多蜂窩電話)沒(méi)有計(jì)算功能,無(wú)法管理語(yǔ)音瀏覽器,所以語(yǔ)音瀏覽器駐留在網(wǎng)絡(luò)上的語(yǔ)音服務(wù)器中。語(yǔ)音服務(wù)器可以位于企業(yè)數(shù)據(jù)中心,或者位于主管供應(yīng)商處。用戶(hù)撥叫一臺(tái)語(yǔ)音服務(wù)器,該服務(wù)器從一臺(tái)應(yīng)用服務(wù)器上下載VoiceXML 2.0腳本、語(yǔ)法格式和聲音文件。語(yǔ)音瀏覽器以一種語(yǔ)音信息的形式將VoiceXML 2.0腳本翻譯給用戶(hù)聽(tīng),語(yǔ)音信息可以是預(yù)先錄制的語(yǔ)音,或經(jīng)由一個(gè)文本語(yǔ)音合成器產(chǎn)生的文本。然后語(yǔ)音瀏覽器調(diào)用一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)軟件,使用語(yǔ)法格式來(lái)識(shí)別出用戶(hù)響應(yīng)的語(yǔ)音詞匯。
下面我們來(lái)看一個(gè)具體的例子:
系統(tǒng):“歡迎致電小李。請(qǐng)問(wèn)您想接通銷(xiāo)售部門(mén)、會(huì)計(jì)部門(mén)還是維護(hù)部門(mén)?”
用戶(hù):“維護(hù)部門(mén)!
ASR 將識(shí)別用戶(hù)的語(yǔ)音回復(fù)。在上面這個(gè)例子中,語(yǔ)法格式只包括三個(gè)詞:“銷(xiāo)售部門(mén)”、“會(huì)計(jì)部門(mén)”和“維護(hù)部門(mén)”。由于ASR的語(yǔ)法格式僅由有限數(shù)量的單詞組成,這種語(yǔ)法驅(qū)動(dòng)的ASR比起聽(tīng)寫(xiě)式ASR執(zhí)行更為精確。聽(tīng)寫(xiě)式ASR則是試圖識(shí)別用戶(hù)說(shuō)出的大多數(shù)英語(yǔ)或其他語(yǔ)言的單詞。
開(kāi)發(fā)人員使用VoiceXML 2.0來(lái)為多種應(yīng)用程序和信息(包括有時(shí)效性的數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和個(gè)人信息)提供電話用戶(hù)界面。有了這些應(yīng)用程序,用戶(hù)只需要從任意電話撥入,表明身份并請(qǐng)求所需的信息,就可以隨時(shí)隨地訪問(wèn)企業(yè)數(shù)據(jù)。客戶(hù)還可以使用這些系統(tǒng)來(lái)訪問(wèn)訂單狀態(tài);以及目錄、交付和賬戶(hù)信息。
VoiceXML組件
賽迪網(wǎng)
中國(guó)信息化(industry.ccidnet.com)
相關(guān)鏈接: