欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁 > 技術(shù) > 技術(shù)文摘 > 不僅是技術(shù)—語音門戶專題系列(一)

不僅是技術(shù)—語音門戶專題系列(一)

2002-01-25 00:00:00   作者:   來源:   評論:0 點擊:


 

  編者按:基于語音識別和合成技術(shù)的語音門戶近來被炒得沸沸揚(yáng)揚(yáng)。語音門戶不僅僅是新的技術(shù),而已經(jīng)是成熟的產(chǎn)品,只不過還沒有被真正引入國內(nèi)。目前,能夠用于語音門戶的語音識別核心技術(shù)基本上掌握在以下幾家公司手里:PHILIPS、Nuance、IBM、SpeechWorks和InfoTalk。盡管這些公司都有實際應(yīng)用的案例,但其技術(shù)不一定都能應(yīng)用于語音門戶。

  語音門戶在中國的推廣,核心問題不是在技術(shù)上,而是在應(yīng)用開發(fā)和服務(wù)上。限于設(shè)計、建設(shè)和運(yùn)營中文語音門戶經(jīng)驗的欠缺,許多應(yīng)用開發(fā)商(ASP)和核心技術(shù)開發(fā)商還只是在向用戶推薦技術(shù)和概念。但如果這些方案并不具備商業(yè)操作價值,不能在語音門戶的運(yùn)營上創(chuàng)造價值,也就沒有任何應(yīng)用價值。

  本專題將以系列報道的形式連續(xù)、全面地介紹語音門戶,澄清一些誤解,并探討如何在中國建設(shè)語音門戶。

語音門戶介紹

  語音門戶(Voice Portal)是溝通電信用戶、電信網(wǎng)絡(luò)及其他信息系統(tǒng)的橋梁,它是一種產(chǎn)品,而不是一種技術(shù)。語音門戶的主要特點包括:

  • 為固定和移動通信用戶和運(yùn)營商提供服務(wù);

  • 一個號碼接入: 用戶撥入一個特服號碼,享受全部服務(wù);

  • 以自動語音識別(ASR)提供導(dǎo)航和服務(wù);

  • 提供個性化和人性化綜合服務(wù)和統(tǒng)一消息服務(wù)。

   具體地說,語音門戶應(yīng)該是建立在電信運(yùn)營商的電信網(wǎng)絡(luò)上,為客戶提供個性化和人性化的客戶服務(wù)、信息服務(wù)、轉(zhuǎn)接服務(wù)和個人定制服務(wù)的平臺。在這個平臺上,用戶通過語音界面,可以更快捷、更方便地獲得比傳統(tǒng)IVR系統(tǒng)更豐富的信息和更完善的服務(wù)。

成功案例

  從20世紀(jì)90年代末以來,隨著語音技術(shù)的成熟和逐步實用化,由于計算機(jī)硬件性能的飛速提高,語音門戶開始在世界發(fā)達(dá)國家出現(xiàn)。特別是在歐洲和美洲,較高的用戶消費(fèi)水平能夠消化吸收較昂貴的新技術(shù),語音技術(shù)開始進(jìn)入客戶服務(wù)和信息服務(wù)領(lǐng)域,并逐漸與互聯(lián)網(wǎng)融合在一起,為客戶提供個性化和人性化的服務(wù)。目前,國際上比較成功的案例有:

  • Vodafone:綜合信息系統(tǒng),提供個性化統(tǒng)一消息服務(wù)。

  • Mannesmann Arcor:在德國推出了Talking Web。這項創(chuàng)新技術(shù)使語音入口的內(nèi)容不再必須從指定數(shù)據(jù)庫中檢索,而可以直接從Web服務(wù)器上訪問。

  • Omnitel:1999年5月開通,電信增值服務(wù)平臺。提供財經(jīng)、生活、娛樂等各種信息服務(wù)和轉(zhuǎn)接服務(wù)。

  • 臺灣和信電訊Ms.600:2000年8月開通,移動通信增值服務(wù)平臺。提供信息服務(wù)、轉(zhuǎn)接服務(wù)、統(tǒng)一消息服務(wù)。(詳細(xì)資料請參考http://www.kgt .com.tw/sitemap/qminfo_08.html)

澄清一些概念

  (1)VoiceXML不是語音門戶標(biāo)準(zhǔn)

  經(jīng)常有人把VoiceXML說成語音門戶的標(biāo)準(zhǔn)。實際上,在VoiceXML出現(xiàn)之前,語音門戶就存在了。VoiceXML不是語音門戶的標(biāo)準(zhǔn),只是用于解決互聯(lián)網(wǎng)與語音界面的接口問題。VoiceXML目前還存在一些問題,主要表現(xiàn)在:

  • VoiceXML的標(biāo)準(zhǔn)還在制訂和完善過程中;

  • 目前還沒有解決雙向的問題,只有提問,沒有回答,只能下載Web page;

  • 目前世界上大部分網(wǎng)站用的都是HTML或WML標(biāo)識語言,如果要求所有的網(wǎng)站都支持VXML的標(biāo)識語言,還有相當(dāng)?shù)木嚯x。

   目前,計算機(jī)硬件、操作系統(tǒng)、電信、網(wǎng)絡(luò)和語音識別的主導(dǎo)廠商正在起草一個新的語音處理標(biāo)準(zhǔn)—語音應(yīng)用語言標(biāo)識(SALT,Speech Application Language Tags),它能夠兼容HTML、xHTML和XML。參與制訂這一新標(biāo)準(zhǔn)的廠商有:Cisco、Intel、Microsoft、Phillips和SpeechWorks等。詳細(xì)信息請參考其網(wǎng)站:www.saltforum.org。因此,VoiceXML的前途如何,還有很大的疑問。

  (2)不同領(lǐng)域的語音識別技術(shù)

  并非所有的語音識別技術(shù)都能應(yīng)用于語音門戶。語音識別技術(shù)可以分為3種:

  • 個人終端設(shè)備上的技術(shù)——以固化語音模塊形式嵌入PDA、手機(jī)、玩具、家用電器等產(chǎn)品。其特點是:簡單功能,小詞匯量、針對特定用戶(需要用戶事先訓(xùn)練機(jī)器才能聽懂)。目前也有一些更小詞匯量的,針對非特定用戶的產(chǎn)品。

  • 基于PC的技術(shù)——語音指令控制PC動作、聽寫錄入。支持大詞匯量、針對特定用戶,使用前必須訓(xùn)練,要求安靜的使用環(huán)境。

  • 基于電信網(wǎng)絡(luò)的技術(shù)——應(yīng)用于電信網(wǎng)絡(luò)中,提供大詞匯量識別、與用戶無關(guān)。這個領(lǐng)域中的語音識別系統(tǒng),由于受到語音傳輸頻寬、環(huán)境噪聲、系統(tǒng)回聲、電磁干擾、不允許實現(xiàn)訓(xùn)練等更加苛刻的約束,對技術(shù)的要求就更高。

  之所以要區(qū)分這三種技術(shù),是因為這三種技術(shù)應(yīng)用于不同的領(lǐng)域,其技術(shù)結(jié)構(gòu)有非常大的差別。一個領(lǐng)域的產(chǎn)品,轉(zhuǎn)化為另一領(lǐng)域的產(chǎn)品是十分困難的。用戶在選擇語音識別技術(shù)的時候,要看其專長在哪個領(lǐng)域。

  (3)語音門戶不是語音網(wǎng)站

  一提到語音門戶,總有人把他說成語音門戶網(wǎng)站。實際上,語音網(wǎng)站僅僅是語音門戶的一個很小的部分。如前所述,語音門戶集成了電信網(wǎng)絡(luò)、計算機(jī)網(wǎng)絡(luò)和互聯(lián)網(wǎng),提供統(tǒng)一消息服務(wù),遠(yuǎn)比語音網(wǎng)站豐富和強(qiáng)大。

核心技術(shù)與流程設(shè)計 語音門戶的兩扇門

相關(guān)閱讀:

分享到: 收藏

專題