Speech · Means · Business 語音 · 表示 · 商機
——NUANCE 公司亞太區(qū)總經(jīng)理康麥克先生

2002/07/29

    十年前, " Speech · Means · Business 語音 · 表示 · 商機 ", 可能會有好多人覺得是天方夜談, 但時至今時今日, 再也沒有人會否定這句話, 因為事實已經(jīng)證明了一切。

    今年五月初, 在美國奧蘭多,佛羅里達州 ( Orlando, Florida ) 舉行了一年一度的 V-World 2002,一個具有全球代表性的語音應(yīng)用國際會議。來自超過30個不同的國 家及地區(qū)的與會人仕當中,自然少不了中國、日本、以及韓國等地,其中占有大部份是來自電訊運營商及與其業(yè)務(wù)相關(guān)連的平臺或方案供應(yīng)商的代表。他們參加會議的主要目的已經(jīng)由從前過去的為了解語音應(yīng)用技術(shù),改變?yōu)楝F(xiàn)在的學(xué)習(xí)及尋找如何在他們各自業(yè)務(wù)應(yīng)用上,去應(yīng)用已成熟的語音技術(shù)的實際例子,以及業(yè)務(wù)項目的執(zhí)行經(jīng)驗,從而去強化及豐富其本身業(yè)務(wù),為企業(yè)帶來更大的收益。

    作為在全球電訊級別上,語音識別技術(shù) (Automatic Speech Recognition, ASR),聲 紋鑒別技術(shù) (Voice Authentication),語音合成技術(shù) (Text-To-Speech, TTS),及 VoiceXML技術(shù)的領(lǐng)導(dǎo)者,NUANCE公司承諾繼續(xù)投放大量資源在嶄新語音技術(shù)的研究及開發(fā)上,去推動市場的認可,保證業(yè)務(wù)運營商能提供高質(zhì)量的語音自助服務(wù)方案,并去協(xié)助運營商強化其本身業(yè)務(wù)以達至高成本效益的目標。

    NUANCE公司占有全球性語音識別自助服務(wù)市場的主要份額,客戶超過600個,累積市場份額超過64%。全球性500個最大型企業(yè),當中就有超過20%是NUANCE公司的客戶。而集中在世界性的頂級電訊運營商中,NUANCE公司就占有80%的份額,可見NUANCE公司的技術(shù)是獲得全球電訊業(yè)界的認同及廣泛支持。本年的首兩個季度,在中國,包括香港及臺灣地區(qū),固網(wǎng)及移動業(yè)務(wù)的運營商紛紛推出了各自的語音增值業(yè)務(wù),項目的規(guī)模已再不是幾十線的試用階段,而是上佰線,甚至超過仟線的投產(chǎn)商用業(yè)務(wù)系統(tǒng),系統(tǒng)當然是采用了NUANCE公司最先進的語音識別引擎及VoiceXML技術(shù)。

    現(xiàn)在,讓我與大家一同分享我們NUANCE公司在電訊領(lǐng)域方面的一些語音應(yīng)用心得;旧希陔娪嶎I(lǐng)域運營商方面,語音應(yīng)用是可以非常廣泛。以下讓我們來看看其中一些最熱門的類別:

  • Voice Activated Dialing (VAD) 語音撥號

  • Unified Messaging (UM) 統(tǒng)一信息

  • Personal Assistants 個人助理

  • Voice Portal 語音門戶


  •     最后,還會詳細地與大家分享一個NUANCE公司在VAD語音撥號類別上非常成功的真實個案:" Sprint PCS Voice Command 個人語音電話簿業(yè)務(wù) "。

    Voice Activated Dialing (VAD) 語音撥號

        基于在語音識別技術(shù)準確度上已有突破性的進展,以語音撥號,即用說話方式直接講出對方姓名或電話號碼,去代替按鍵式撥號,已經(jīng)成為其中一種可讓用戶打電話最方便的方法,也成為其中一種用戶最想要的增值服務(wù)。全球正關(guān)心如何使汽車駕駛更安全,以及有關(guān)在汽車內(nèi)駕駛者使用移動電話時必須采用免提方式的立法事宜,這種種都驅(qū)使運營商去發(fā)展語音撥號相關(guān)的業(yè)務(wù)。在Yankee Group的周年移動用 戶調(diào)查中,發(fā)現(xiàn)VAD語音撥號已成為其中一個前頭三位用戶最想獲得進一步增強的服務(wù)。到2003年,估計VAD語音撥號業(yè)務(wù)會為運營商從零售用戶方便帶來約 3億 2仟 7佰萬美元的收益, 同時也會吸引上仟萬的使用者。 早期因為語音識別技術(shù)尚 不夠成熟,以致運營商的VAD語音撥號相關(guān)業(yè)務(wù)不能大力的拓展,令他們感到非常失望。但現(xiàn)在,在NUANCE公司語音技術(shù)迅速的進展情況下,VAD語音撥號相關(guān)業(yè)務(wù)終于能真正的實現(xiàn),而且能獲得眾多運營商的支持,以及廣大最終用戶的接受,F(xiàn)時,為爭奪VAD語音撥號在固網(wǎng)或移動的龐大市場,各運營商都按本身業(yè)務(wù)發(fā)展的策略及時間表,積極地計劃及展開大規(guī)模相關(guān)業(yè)務(wù)及其推廣。

        運營商在評估語音識別引擎技術(shù)時,都會確定語音識別引擎廠商是否能滿足并符合相關(guān)業(yè)務(wù)上的要求,比如說廠商必須有確實的經(jīng)驗,將語音識別技術(shù)用于所有的標準固網(wǎng),及移動網(wǎng)絡(luò),如CDMA,TDMA,GSM等。同時,技術(shù)也必須要支持混合模式的業(yè)務(wù)應(yīng)用,即Speaker-trained講話者受訓(xùn)式及Speaker-independent講話者非 依賴式的混合使用方式。以上種種的語音技術(shù)及廠商經(jīng)驗,都成為運營商是否能真正成功推動一個高準確度及高效率的VAD語音撥號業(yè)務(wù)的關(guān)鍵點,最終能讓使用者接受,感覺方便、好用,從而獲得相關(guān)業(yè)務(wù)的成功,帶來龐大的收益。在這方面,NUANCE公司確實幫助了他們實現(xiàn)這個夢想。

    Unified Messaging (UM) 統(tǒng)一信息

        網(wǎng)絡(luò)技術(shù)的進步,互聯(lián)網(wǎng)使用率的持續(xù)上升,帶動了在商務(wù)以及個人通訊方面的融合,有著巨大的增長。一個完全語音用戶界面Voice User Interface (VUI) 將會最終 能夠在任何地點、時間、環(huán)境之下,讓用戶讀取自己的統(tǒng)一信息 --- 即可以組合及 管理所有來自不同渠道的通訊源,將其轉(zhuǎn)化為單一數(shù)據(jù)源。透過撥打一個電話號碼,用戶即可讀取、收聽、回復(fù)來自不同源頭的電郵以及語音留言,簡化了需要一定透過計算機終端,或需撥打多個不同的語音留言及自動語音應(yīng)答系統(tǒng)的電話號碼。OVUM顧問報告的保守估計,到2003年,全球?qū)s有9仟5佰萬美元價值的統(tǒng)一信息系統(tǒng)。

    Personal Assistants 個人助理

        擁有自己的個人秘書,無疑是有數(shù)之不盡的好處。每個人當然會喜歡有人幫助自己去管理,以及組織自己的一切約會、電話來電或呼出、還有信息上的需要。但是,以今天的經(jīng)濟環(huán)境及氣候,每個企業(yè)都想著如何縮減運作成本,個人秘書就只會有高級管理層人員才有機會可以考慮。一般的雇員,就只得共享一名助理,或需要自己處理一切事宜。如果有一具有語音用戶界面的自動私人助理為你安排一切,這就會非常理想。一個豐富的個人助理服務(wù)能夠為運營商創(chuàng)造出一個非常特出的競爭優(yōu)勢,爭取更多客戶,帶來更大收益。服務(wù)還可以配合運營商本身的品牌去作大規(guī)模的推廣,這也會有助于在市場上推動更大的服務(wù)需求。

    Voice Portal 語音門戶

        不論在固網(wǎng)或移動電話業(yè)界,一個能夠為用戶提供準確和及時信息的服務(wù),已被證實能為運營商帶來業(yè)務(wù)的成功,及額外可觀的收益。用戶會有規(guī)律地重復(fù)使用該服務(wù)去獲取最新的信息,如天氣預(yù)測、道路情況、體育賽果、商業(yè)新聞等。語音門戶提供在眾多信息源頭的整合價值,同時也可為用戶提供一系列具有個性化的應(yīng)用,如日程表安排及個人信息服務(wù)等。其業(yè)務(wù)模式大至上跟Web Portal互聯(lián)網(wǎng)門戶差不 多,如Yahoo。語音門戶采用語音識別技術(shù),讓用戶能夠輕易地以說話方式在眾多不同品種的信息清單上導(dǎo)航。這樣一來,用戶就不必要通過計算機終端上網(wǎng),才可查看如某套電影在那所電影院播放、播影時間在何時等;用戶只需撥打語音門戶服務(wù)號碼,并說 "這套XXX電影在那里及何時播影" 便可。與現(xiàn)時Web Portal互聯(lián)網(wǎng) 門戶的分別,在于要接駁到語音門戶,只要找到最接近你的電話或手提電話即可;還有,你也無需等待上網(wǎng)時信息下載相對緩慢的速度。語音門戶的確能為運營商刺激起網(wǎng)絡(luò)的使用率,預(yù)計語音門戶的數(shù)量將會在未來數(shù)年有著大幅度增加的趨勢,而運營商本身更是其中占最大部份的業(yè)務(wù)營運機關(guān)。

    真實個案—— Sprint PCS Voice Command 個人語音電話簿業(yè)務(wù)

        在 2000年 8月,美國第4大移動電話運營商 Sprint PCS 成功推出了 Sprint PCS Voice Command,一個具有語音撥號功能的個人語音電話簿業(yè)務(wù)。業(yè)務(wù)推出后不到1年,約9到10個月左右,已經(jīng)占有Sprint PCS其本身約1仟4佰萬用戶當中的10%滲透率, 即約有1佰4拾萬用戶使用,每個用戶需要支付月費,帶來可觀的投資回報。該服務(wù)讓使用者以Speaker-independent講話者非依賴方式,即無需預(yù)先訓(xùn)練語音識別引擎 ,講出想接駁對方的姓名,系統(tǒng)便會自動為你接駁。每個用戶的電話簿姓名名單可達至500個,而每個個別姓名可以同時擁有最多5個不同的電話號碼,如手提、辦公室、家里、傳呼機號碼等。使用者還可以直接講出在電話簿上沒有登記的電話號碼,真正能實現(xiàn)全免提式的語音撥號功能。在該項目上,NUANCE公司提供了強勁而可靠的語音識別引擎,作為全個項目技術(shù)上的核心部份。

        Voice Command是一個覆蓋全美國的增值業(yè)務(wù),也是屬于Sprint PCS移動電話服務(wù) 的一部份,當置身于Sprint PCS移動網(wǎng)絡(luò)覆蓋范圍內(nèi),你便可以享用該個人語音電 話簿服務(wù)。Sprint PCS為推廣Voice Command,有時還將該業(yè)務(wù)跟其它業(yè)務(wù)服務(wù)一 同打包推出。否則,你便要支付約5至10美元的月費,才可以享用該方便且好用的個人語音電話簿服務(wù)。

        該服務(wù)是以網(wǎng)絡(luò)為基礎(chǔ)的,它能正常運作并兼容任何一種在Sprint PCS移動網(wǎng)絡(luò)上 支持的電話種類。使用者可以非常簡單地按 " * OK " 或 " * talk " 鍵后,便會聽見 一個特殊音號及一個語音服務(wù)的提示語,這也表示你已經(jīng)接駁到Voice Command個 人語音電話簿服務(wù)。就是那幺簡單!

        Voice Command的成功,在電訊業(yè)界上是一個非常重要的里程碑,它有著指導(dǎo)性的 意義。該服務(wù)是一個非常完整及靈活的系統(tǒng),也應(yīng)該是給予最終使用者的一個公平測試,讓他們可以真正看到靈活的語音撥號為他們帶來的價值。

        有著業(yè)務(wù)能即時覆蓋全國的優(yōu)點,以及合理的服務(wù)價格,Voice Command業(yè)務(wù)贏得 普遍用戶的接受,也帶來其它眾多運營商對采用語音技術(shù)的廣泛認可,當然一定少不了Sprint PCS在移動電話業(yè)務(wù)上的競爭對手呢!

        Voice Command個人語音電話簿業(yè)務(wù)是其中一種運營商的戰(zhàn)術(shù)工具,用作建立用戶對運營商的忠誠度。利用其業(yè)務(wù)本身具有個性化的特性,續(xù)步影響最終使用者的使用習(xí)慣,使得他們也投資在業(yè)務(wù)上 --- 即創(chuàng)制及持續(xù)維護自己的個人電話簿。這樣 ,便能達至運營商想要用戶維持選用其業(yè)務(wù)的最終目標。還有,語音功能能夠為用戶提供在各項業(yè)務(wù)服務(wù)上更方便、更好用的用戶界面,運營商便會有可能再在現(xiàn)有服務(wù)費水平上增收額外的付加費用。

    總結(jié)

        最后,我們NUANCE公司深信,隨著上半年各運營商在中、港、臺三地紛紛推出不同形式的語音業(yè)務(wù)或服務(wù),差不多可以肯定今年到明年,將會是語音業(yè)界豐收的階段。我們還認為在中國的市場,將會比歐美市場更為旺盛。在個人手機用戶數(shù)量上,中國已經(jīng)超越美國,成為最多用戶數(shù)量的國家,再加上中國加入世界貿(mào)易組織(WTO)等多種有利條件,都是給我們帶來在業(yè)界市場上非常正面的信息,令人鼓舞。一個真正達至全面語音技術(shù)應(yīng)用的世界,還需要各方面共同合作及參予,當然包括有各固網(wǎng)及移動網(wǎng)絡(luò)運營商,以及NUANCE公司的合作伙伴,使我們的夢想成為明日真實的世界。謝謝各位!

    NUANCE公司供稿 CTI論壇編輯



    相關(guān)鏈接:
    Nuance發(fā)布Vocalizer 5.0文本語音轉(zhuǎn)換方案 2009-09-04
    化繁為簡,讓手機“一切行動聽指揮” 2009-08-13
    Nuance語音識別技術(shù)助力醫(yī)學(xué)中心節(jié)省開支 2009-08-12
    Nuance攜手IBM提供先進的語音識別解決方案 2009-08-05
    Nuance語音識別技術(shù)將進軍中國 2009-06-17

    分類信息:  電信_與_語音識別ASR  電信_與_統(tǒng)一通信     文摘   行業(yè)_電信_案例   技術(shù)_語音識別_文摘   技術(shù)_統(tǒng)一通信_文摘