首頁(yè)>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

 

不僅是技術(shù)—語音門戶專題系列(一)

郭連頗 2002/01/25

  編者按:基于語音識(shí)別和合成技術(shù)的語音門戶近來被炒得沸沸揚(yáng)揚(yáng)。語音門戶不僅僅是新的技術(shù),而已經(jīng)是成熟的產(chǎn)品,只不過還沒有被真正引入國(guó)內(nèi)。目前,能夠用于語音門戶的語音識(shí)別核心技術(shù)基本上掌握在以下幾家公司手里:PHILIPS、Nuance、IBM、SpeechWorks和InfoTalk。盡管這些公司都有實(shí)際應(yīng)用的案例,但其技術(shù)不一定都能應(yīng)用于語音門戶。

  語音門戶在中國(guó)的推廣,核心問題不是在技術(shù)上,而是在應(yīng)用開發(fā)和服務(wù)上。限于設(shè)計(jì)、建設(shè)和運(yùn)營(yíng)中文語音門戶經(jīng)驗(yàn)的欠缺,許多應(yīng)用開發(fā)商(ASP)和核心技術(shù)開發(fā)商還只是在向用戶推薦技術(shù)和概念。但如果這些方案并不具備商業(yè)操作價(jià)值,不能在語音門戶的運(yùn)營(yíng)上創(chuàng)造價(jià)值,也就沒有任何應(yīng)用價(jià)值。

  本專題將以系列報(bào)道的形式連續(xù)、全面地介紹語音門戶,澄清一些誤解,并探討如何在中國(guó)建設(shè)語音門戶。

語音門戶介紹

  語音門戶(Voice Portal)是溝通電信用戶、電信網(wǎng)絡(luò)及其他信息系統(tǒng)的橋梁,它是一種產(chǎn)品,而不是一種技術(shù)。語音門戶的主要特點(diǎn)包括:

   具體地說,語音門戶應(yīng)該是建立在電信運(yùn)營(yíng)商的電信網(wǎng)絡(luò)上,為客戶提供個(gè)性化和人性化的客戶服務(wù)、信息服務(wù)、轉(zhuǎn)接服務(wù)和個(gè)人定制服務(wù)的平臺(tái)。在這個(gè)平臺(tái)上,用戶通過語音界面,可以更快捷、更方便地獲得比傳統(tǒng)IVR系統(tǒng)更豐富的信息和更完善的服務(wù)。

成功案例

  從20世紀(jì)90年代末以來,隨著語音技術(shù)的成熟和逐步實(shí)用化,由于計(jì)算機(jī)硬件性能的飛速提高,語音門戶開始在世界發(fā)達(dá)國(guó)家出現(xiàn)。特別是在歐洲和美洲,較高的用戶消費(fèi)水平能夠消化吸收較昂貴的新技術(shù),語音技術(shù)開始進(jìn)入客戶服務(wù)和信息服務(wù)領(lǐng)域,并逐漸與互聯(lián)網(wǎng)融合在一起,為客戶提供個(gè)性化和人性化的服務(wù)。目前,國(guó)際上比較成功的案例有:

澄清一些概念

  (1)VoiceXML不是語音門戶標(biāo)準(zhǔn)

  經(jīng)常有人把VoiceXML說成語音門戶的標(biāo)準(zhǔn)。實(shí)際上,在VoiceXML出現(xiàn)之前,語音門戶就存在了。VoiceXML不是語音門戶的標(biāo)準(zhǔn),只是用于解決互聯(lián)網(wǎng)與語音界面的接口問題。VoiceXML目前還存在一些問題,主要表現(xiàn)在:

   目前,計(jì)算機(jī)硬件、操作系統(tǒng)、電信、網(wǎng)絡(luò)和語音識(shí)別的主導(dǎo)廠商正在起草一個(gè)新的語音處理標(biāo)準(zhǔn)—語音應(yīng)用語言標(biāo)識(shí)(SALT,Speech Application Language Tags),它能夠兼容HTML、xHTML和XML。參與制訂這一新標(biāo)準(zhǔn)的廠商有:Cisco、Intel、Microsoft、Phillips和SpeechWorks等。詳細(xì)信息請(qǐng)參考其網(wǎng)站:www.saltforum.org。因此,VoiceXML的前途如何,還有很大的疑問。

  (2)不同領(lǐng)域的語音識(shí)別技術(shù)

  并非所有的語音識(shí)別技術(shù)都能應(yīng)用于語音門戶。語音識(shí)別技術(shù)可以分為3種:

  之所以要區(qū)分這三種技術(shù),是因?yàn)檫@三種技術(shù)應(yīng)用于不同的領(lǐng)域,其技術(shù)結(jié)構(gòu)有非常大的差別。一個(gè)領(lǐng)域的產(chǎn)品,轉(zhuǎn)化為另一領(lǐng)域的產(chǎn)品是十分困難的。用戶在選擇語音識(shí)別技術(shù)的時(shí)候,要看其專長(zhǎng)在哪個(gè)領(lǐng)域。

  (3)語音門戶不是語音網(wǎng)站

  一提到語音門戶,總有人把他說成語音門戶網(wǎng)站。實(shí)際上,語音網(wǎng)站僅僅是語音門戶的一個(gè)很小的部分。如前所述,語音門戶集成了電信網(wǎng)絡(luò)、計(jì)算機(jī)網(wǎng)絡(luò)和互聯(lián)網(wǎng),提供統(tǒng)一消息服務(wù),遠(yuǎn)比語音網(wǎng)站豐富和強(qiáng)大。

計(jì)算機(jī)世界報(bào) 2002/01/25

核心技術(shù)與流程設(shè)計(jì) 語音門戶的兩扇門



相關(guān)鏈接:
談?wù)Z音合成技術(shù)的具體應(yīng)用 2002-01-17
技術(shù)創(chuàng)新推動(dòng)應(yīng)用進(jìn)程 2002-01-07
時(shí)勢(shì)造英雄—語音互聯(lián)網(wǎng)鋒芒漸露 2002-01-04
Voice Web語音網(wǎng) 2001-12-30
IBM ViaVoice更方便更健康 2001-11-14

分類信息:  語音合成TTS_與_語音識(shí)別ASR     技術(shù)_語音合成_文摘   技術(shù)_語音識(shí)別_文摘