首頁>>廠商>>語音識(shí)別與合成>>捷通華聲

捷通華聲語音技術(shù)產(chǎn)品在SP增值業(yè)務(wù)的應(yīng)用

2006/09/19

  在以語音服務(wù)為主的增值業(yè)務(wù)中,需要與用戶交互大量的、豐富多彩的語音信息,單純的錄音不能及時(shí)滿足用戶多樣的需求,多層次的菜單和復(fù)雜的操作流程也使用戶感到厭煩。

  而語音合成和語音識(shí)別技術(shù)的應(yīng)用,避免語音交互過程中的繁瑣,提供一種便捷的交互方式,提高互動(dòng)的動(dòng)態(tài)性、時(shí)效性、簡單性和娛樂性。

  北京捷通華聲語音技術(shù)有限公司一直在語音應(yīng)用方面進(jìn)行著探索,其語音技術(shù)產(chǎn)品廣泛應(yīng)用在移動(dòng)、聯(lián)通、電信等國內(nèi)各大運(yùn)營商語音服務(wù)平臺(tái)中,充分顯示出在語音技術(shù)上的最高專業(yè)水平。

  捷通華聲語音技術(shù)產(chǎn)品

  語音合成產(chǎn)品

  語音合成(Text-to-Speech),簡稱TTS,學(xué)名文語轉(zhuǎn)換系統(tǒng),是指利用計(jì)算機(jī)將任意組合的文本信息轉(zhuǎn)化為聲音數(shù)據(jù),并通過聲卡、電話語音卡等多媒體設(shè)備將聲音輸出。

  捷通華聲自主知識(shí)產(chǎn)權(quán)的中文語音合成技術(shù)jTTS,采用大規(guī)模真實(shí)錄音的語音庫和基于韻律層級(jí)匹配的波形拼接算法,確保合成的高清晰度和高自然度,在國際上處于領(lǐng)先地位,并已申請多項(xiàng)國家專利。新近推出的jTTS4.5,基于深度的開發(fā)和廣泛的實(shí)踐積累,在語料設(shè)計(jì)、韻律層級(jí)分析、語義分析、數(shù)字符號(hào)讀法等多項(xiàng)技術(shù)上均有突破創(chuàng)新,自然度、可懂度、流暢度也明顯提升;同時(shí)增添了更加多樣化的音色選擇,以滿足電信增值服務(wù)平臺(tái)個(gè)性化應(yīng)用的需求。

  語音識(shí)別產(chǎn)品

  語音識(shí)別(Open Speech Recognition),簡稱OSR,它的基本功能是對用戶說話的音波進(jìn)行處理,轉(zhuǎn)換成文本,簡單的說就是讓計(jì)算機(jī)“聽”懂人說話。

  在電信增值業(yè)務(wù)中,信息內(nèi)容的索引作為詞條放入詞表,用戶利用這些索引獲得具體的信息內(nèi)容服務(wù),這也是目前語音識(shí)別技術(shù)基于電話網(wǎng)最常用的方式。

  捷通音效平臺(tái)——變音技術(shù)產(chǎn)品

  變音軟件,是捷通華聲開發(fā)的一套聲音處理的軟件開發(fā)包,通過數(shù)字信號(hào)處理等核心技術(shù),可以將輸入的聲音變換成另一種效果的聲音,將聲音變換出豐富多彩的效果。例如:將溫柔的女子的聲音變成粗獷的男子的聲音;將成年人的聲音變成小孩的聲音;山谷的回聲;和預(yù)先錄制好聲音混合,創(chuàng)造出波濤洶涌的海邊,嘈雜的街道,充滿蚊蟲野外等場景。

  語音技術(shù)在語音增值業(yè)務(wù)中的應(yīng)用過程

  捷通華聲語音技術(shù)在電信增值業(yè)務(wù)中的應(yīng)用

  語音短信

  語音合成(TTS)技術(shù)在短信業(yè)務(wù)中的應(yīng)用方式主要是:通過在平臺(tái)上添加安裝語音合成服務(wù)器等短信平臺(tái)改造或升級(jí),用戶在使用短信時(shí),可以選擇短信發(fā)送及接收方式,如文字短信、聲音短信等,這樣,傳統(tǒng)的“看”短信就變成“聽”短信,人們即使在很不方便用手機(jī)的狀態(tài)下(如開車時(shí)等),也可以從容的使用單一或任意一個(gè)按鍵,或使用耳機(jī)聽取聲音短信或話音。

  語音郵件

  傳統(tǒng)電話接收E-mail方法是由話務(wù)員把郵件的內(nèi)容直接念給用戶聽,而利用TTS技術(shù),由語音合成平臺(tái)把文本格式的郵件內(nèi)容合成為語音,通過IVR播放給用戶。

  用電話發(fā)E-mail業(yè)務(wù)是指用戶通過電話接入系統(tǒng),告知系統(tǒng)目的電子郵件的地址及郵件內(nèi)容,由OSR自動(dòng)識(shí)別系統(tǒng)內(nèi)已定義好的IP地址,通過IVR節(jié)點(diǎn)錄音的語音文件以附件的方式生成Email,通過Internet發(fā)送到對方的Email信箱中。這樣,大大方便了那些上網(wǎng)不方便,但又需要通過E-mail與外界聯(lián)系的朋友。

  語音秘書

  用戶可以播打電話根據(jù)語音提示直接對著電話語音填寫,包括用戶電話號(hào)碼、呼叫時(shí)間及事由等信息。這些信息經(jīng)過語音識(shí)別模塊識(shí)別,并存入數(shù)據(jù)庫中,并由應(yīng)用服務(wù)器定時(shí)查詢記事本,觸發(fā)PBX發(fā)生一次呼出事件,由IVR完成服務(wù)。

  語音電話簿

  語音電話簿旨在通過電話網(wǎng)絡(luò)和互聯(lián)網(wǎng)絡(luò),向用戶提供可以隨時(shí)獲取、永不丟失的通訊錄服務(wù)。系統(tǒng)可以提供電話、互聯(lián)網(wǎng)等多種接入方式,用戶接入系統(tǒng)以后可以使用通訊錄的聯(lián)系人條目進(jìn)行呼叫。如使用電話接入系統(tǒng),用戶可以用說出人名的方式,比如“張三”,實(shí)現(xiàn)與該聯(lián)系人的通話。同時(shí)用戶可以通過電話,直接采用語音的方式對通訊錄進(jìn)行維護(hù),,整個(gè)過程由系統(tǒng)自動(dòng)響應(yīng)完成,從而免除按鍵等繁瑣的操作。語音識(shí)別技術(shù)用以識(shí)別用戶命令,從而實(shí)現(xiàn)自動(dòng)服務(wù)。語音合成技術(shù)把人名、電話號(hào)碼等大量無法用人工錄音的動(dòng)態(tài)信息處理成語音信息播報(bào)給用戶。

  語音資訊

  用戶可通過撥打特定的接入號(hào)碼,按照相應(yīng)的語音提示定制新聞實(shí)事、股票證券、天氣預(yù)報(bào)等語音信息后,由交互式語音業(yè)務(wù)平臺(tái)主動(dòng)向用戶發(fā)起呼叫,按照客戶的定制要求播放語音信息。這些語音信息可以先存儲(chǔ)為文本,再由TTS轉(zhuǎn)成語音向用戶播報(bào)。同時(shí)通過TTS、OSR技術(shù)輕松實(shí)現(xiàn)航班、公交路線、體育賽事、考試分?jǐn)?shù)、旅游景點(diǎn)、違章違規(guī)等信息的查詢。

  彩鈴

  彩鈴業(yè)務(wù)主要是讓主叫用戶發(fā)起呼叫之后接聽一段悅耳的音樂或歌聲或一句問候語。如遇到需將任意文字轉(zhuǎn)成語音方式時(shí),用人工錄音(或被叫用戶自己錄音)實(shí)現(xiàn)有些麻煩,并且有一定的安全性;而被叫用戶如果可以通過手機(jī)、固定電話(帶文字輸入的)、或者是在一個(gè)網(wǎng)頁上將自己準(zhǔn)備的有關(guān)文字信息放到彩鈴系統(tǒng)平臺(tái)中,經(jīng)過文字安全過濾,再選擇定制音樂等,彩鈴系統(tǒng)平臺(tái)中如果又安裝了語音合成(TTS)軟件,以上所提到的應(yīng)用就完全可以實(shí)現(xiàn)。

  另外,捷通華聲公司利用語音技術(shù)對一些語音文件進(jìn)行特效處理,將彩鈴做成一個(gè)帶有背景特效聲音的個(gè)性化語音文件,如:在一個(gè)山谷背景中,一個(gè)個(gè)性化的聲音在告訴你一些信息;有一個(gè)來自宇宙太空中的聲音在與你交流;一片風(fēng)雨聲中,在向您播報(bào)天氣信息;在一段悠揚(yáng)的音樂聲中,做你自己的自我介紹等。

  聲動(dòng)點(diǎn)播

  傳統(tǒng)的點(diǎn)歌系統(tǒng),將歌曲根據(jù)歌手、主題進(jìn)行分類,由于受到電話鍵盤的限制,用戶要經(jīng)過層層的菜單引導(dǎo),聽大量的菜單內(nèi)容后聽到點(diǎn)播的歌曲。而引入OSR以后,用戶只要說出歌曲名稱或者歌手姓名就可以調(diào)出所需的歌曲。同時(shí)還可以利用TTS將歌曲名稱合成語音,以便動(dòng)態(tài)添加、管理曲庫,免去錄音的繁瑣工作。

  其他應(yīng)用

  體育競猜、知識(shí)問答、廣播節(jié)目互動(dòng)、趣味游戲、虛擬博彩、交友聊天、電話廣告、民意調(diào)查、費(fèi)用催繳、愛心熱線、全國農(nóng)業(yè)信息查詢… …

  捷通華聲公司作為一家專業(yè)的語音技術(shù)公司,不僅擁有語音技術(shù)研究與經(jīng)驗(yàn)豐富的開發(fā)團(tuán)隊(duì),還投資建設(shè)了國內(nèi)一流的語音錄音室,從而構(gòu)成了包括由專業(yè)人員 、專業(yè)設(shè)備、專業(yè)處理軟件技術(shù)組成的一整套語音資源建設(shè)體系,能夠根據(jù)不同用戶提出的任何個(gè)性化語音服務(wù)的需求做出迅速反應(yīng),并及時(shí)為其提供“量身定做”的語音產(chǎn)品,包括語音定制服務(wù)、各種專業(yè)錄音、語音音庫制作、語音加工處理等項(xiàng)目。

捷通華聲公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無怯步 2008-04-16
捷通華聲TTS成功登陸中國郵政儲(chǔ)蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31
捷通華聲移動(dòng)導(dǎo)航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28

相關(guān)頻道:  移動(dòng)增值_與_移動(dòng)  移動(dòng)增值_與_語音合成TTS  移動(dòng)_與_語音合成TTS