語音合成技術(shù): 啟動“第三種引擎”
2002/04/02
對于中英文混合的語音合成問題,傳統(tǒng)的解決方案是采用中文和英文兩種合成引擎。合成時先將中英文文本進行分離,然后在不同的引擎下分別進行合成,最后將合成數(shù)據(jù)匯集輸出。這種合成方法存在著中英文不同音、銜接部分跳躍大等弊端。另外,如果在傳統(tǒng)的單一語種(如中文、英文等)語音合成方法的基礎(chǔ)上開發(fā)不同語種的語音合成系統(tǒng),可行性不大。
為了解決這個問題,科大訊飛公司將中英文混雜的文本作為“第三種語言”進行專門研究,并建立了一套綜合考慮中英文混合情況的文本分析體系和韻律規(guī)則模型。根據(jù)這個開發(fā)思路,訊飛InterPhonic C&E Rev 1.0語音平臺系統(tǒng)應(yīng)運而生,成為了語音合成技術(shù)的“第三種引擎”。
系統(tǒng)的五項技術(shù)創(chuàng)新
。1) 多語種文本分析體系
該平臺可同時對純中文、純英文或是中英文混合的文本進行相應(yīng)的處理。該分析體系具有完備的文本分析知識庫,并在人名識別規(guī)則、多音字處理規(guī)則、特殊符號處理規(guī)則的積累等方面具有優(yōu)勢。
。2) 先進的語言學(xué)層次結(jié)構(gòu)體系
該系統(tǒng)將國內(nèi)最新的漢語連續(xù)語流標(biāo)注體系CToBI進行工程化應(yīng)用,可以準(zhǔn)確地對連續(xù)語流中不同層次的語言現(xiàn)象進行描述;同時采用先進的漢語語音韻律描述體系,提高了系統(tǒng)的整體語音效果。
(3) 基于數(shù)據(jù)統(tǒng)計和人工智能的韻律模型構(gòu)架
該系統(tǒng)基于先進的大語種庫語音合成方法,進行了超大規(guī)模的自然語流數(shù)據(jù)庫的制作,并以此作為數(shù)據(jù)統(tǒng)計和機器學(xué)習(xí)的訓(xùn)練數(shù)據(jù),建立了較為完善的基頻、時長、能量、停頓模型。
(4) 具備改進型PSOLA算法的韻律調(diào)整功能
采用最先進的PSOLA語音算法工具,使得系統(tǒng)在語速調(diào)整和運行穩(wěn)定性等方面有更優(yōu)秀的表現(xiàn)。
(5)高自然度、高流暢度的語音合成效果
據(jù)權(quán)威機構(gòu)評測,該系統(tǒng)針對新聞等不同文體的文本合成,均可達到4.3分(5分制)的自然度,能夠適應(yīng)多語種文本的語音合成場合。
系統(tǒng)的多行業(yè)應(yīng)用
(1)電信業(yè)
除了能夠完成電信業(yè)原有的114查號系統(tǒng)、話費查詢、話費催繳、代繳以及電信法規(guī)、業(yè)務(wù)咨詢等基本業(yè)務(wù),還可以使電信運營商能夠搭建各種電話信息應(yīng)用平臺,提供諸如預(yù)訂業(yè)務(wù)、大眾呼叫等多項增值服務(wù)。
。2)證券業(yè)
可以通過清晰自然的語音實現(xiàn)個人信息(包括資金、股份、委托情況、成交情況等)、股市行情(包括股票行情、指數(shù)、指標(biāo)等)以及股評與業(yè)績報告的實時查詢,將證券業(yè)務(wù)拓展到通信網(wǎng)上。
(3)銀行業(yè)
可使銀行業(yè)客服中心實現(xiàn)賬戶資料查詢、歷史記錄查詢、利率匯率實時查詢等多項動態(tài)查詢業(yè)務(wù),同時可以幫助電話銀行擴展自動服務(wù)的業(yè)務(wù)種類。
。4)保險業(yè)
能夠提供公司的公共信息、客戶保單信息、業(yè)務(wù)員認(rèn)證信息的動態(tài)查詢服務(wù),改變了目前保險業(yè)客服中心可操作性差的弱點。
。5)電力行業(yè)
可以向用戶提供業(yè)務(wù)受理進程查詢、電費額明細(xì)查詢、電費催繳、故障通知及其他各類信息咨詢,并可在此基礎(chǔ)上,利用已有的資源開展外包業(yè)務(wù)。
。6)郵政行業(yè)
可以幫助郵政客戶服務(wù)中心以一個統(tǒng)一的服務(wù)平臺面向用戶,融合包括郵政金融、郵政特快、報刊發(fā)行、集郵等在內(nèi)的各項郵政服務(wù),為用戶提供咨詢、查詢、受理以及投訴等多項業(yè)務(wù)。
此外,采用語音合成技術(shù)可以改變原有聲訊平臺服務(wù)種類單一的弱點,開展諸如考試查分、廣播電視節(jié)目的動態(tài)查詢、節(jié)目的實時點播與點評、電話學(xué)位防偽查詢系統(tǒng)、電話產(chǎn)品防偽等業(yè)務(wù)。(科大訊飛公司供稿)
計算機世界報 2002/04/02
構(gòu)建更加人性化的交談式語音應(yīng)用 2002-03-11 |
回歸到“通天塔”之前 2002-03-11 |
語音合成——燦爛的前景 巨大的商機 2002-01-30 |
語音合成技術(shù)及國內(nèi)外發(fā)展現(xiàn)狀 2002-01-30 |
Evoice有聲電子郵件系統(tǒng) 2002-01-30 |