科大訊飛語(yǔ)音技術(shù)產(chǎn)品ViviVoice2.0
2009/12/02
ViviVoice系列簡(jiǎn)介
ViviVoice提供最豐富的音庫(kù),且根據(jù)客戶需求不斷擴(kuò)展,適應(yīng)多樣化的語(yǔ)音應(yīng)用業(yè)務(wù)需要;能夠自動(dòng)準(zhǔn)確的進(jìn)行智能化文本分析和預(yù)處理;合成的語(yǔ)音清晰、流暢、自然,使用戶獲得最佳效果體驗(yàn);強(qiáng)大的參數(shù)設(shè)置和調(diào)整能力,容易對(duì)語(yǔ)音效果進(jìn)行各種靈活的調(diào)節(jié)。ViviVoice作為個(gè)性化語(yǔ)音服務(wù)的全新動(dòng)力引擎,將為豐富多彩的語(yǔ)音應(yīng)用增添獨(dú)特的魅力。
豐富音色主導(dǎo)個(gè)性化語(yǔ)音服務(wù)潮流
ViviVoice主導(dǎo)個(gè)性化語(yǔ)音服務(wù)新潮流,采用業(yè)界領(lǐng)先的可訓(xùn)練語(yǔ)音合成技術(shù),能夠快速提供適應(yīng)語(yǔ)音應(yīng)用需要的豐富語(yǔ)言和多樣化音色選擇,并秉承科大訊飛語(yǔ)音技術(shù)一貫的最高質(zhì)量效果表現(xiàn),為用戶提供個(gè)性化語(yǔ)音服務(wù)體驗(yàn)。
在ViviVoice 產(chǎn)品中,提供了以下音庫(kù):
由于ViviVoice采用最先進(jìn)的中文文本、韻律分析算法和基于訓(xùn)練的參數(shù)合成方法,合成效果可達(dá)真人朗讀的水平,并且構(gòu)建一個(gè)高質(zhì)量音庫(kù)的周期相比以往可大幅度縮短,這就使得科大訊飛能夠更加快速的響應(yīng)個(gè)性化語(yǔ)音應(yīng)用的新需求,不斷提供更多更好的音庫(kù)。如需獲得ViviVoice當(dāng)前支持的最新音庫(kù)列表,請(qǐng)?jiān)L問(wèn)科大訊飛網(wǎng)站。
ViviVoice提供豐富多樣、效果自然的音庫(kù),在實(shí)際應(yīng)用中,可根據(jù)業(yè)務(wù)需要靈活進(jìn)行實(shí)時(shí)音庫(kù)切換。
高表現(xiàn)力的合成引擎
ViviVoice語(yǔ)音合成軟件支持疑問(wèn)和感嘆語(yǔ)氣,支持高興和悲傷情感,充分體現(xiàn)產(chǎn)品的個(gè)性化和娛樂(lè)功能的特點(diǎn),給您帶來(lái)不同的聽(tīng)覺(jué)感受。
高準(zhǔn)確度的智能文本分析與預(yù)處理
ViviVoice語(yǔ)音合成軟件具有高準(zhǔn)確度智能文本分析與預(yù)處理技術(shù),有效保障最終合成語(yǔ)音準(zhǔn)確、清晰、流暢。得益于科大訊飛在語(yǔ)言學(xué)研究和實(shí)踐上的深厚積累,通過(guò)與中國(guó)社會(huì)科學(xué)院語(yǔ)言所等相關(guān)權(quán)威科研機(jī)構(gòu)的緊密合作,以及基于寬廣的應(yīng)用實(shí)踐平臺(tái)所積累的海量專業(yè)知識(shí)庫(kù),經(jīng)過(guò)不斷訓(xùn)練和優(yōu)化,即使在面對(duì)針對(duì)語(yǔ)言分析處理的難點(diǎn),如多音字、特殊符號(hào)、韻律短語(yǔ)、未登錄詞(如地名、人名)等等,也能保障得到高度準(zhǔn)確的自動(dòng)處理結(jié)果。
流暢的效果與強(qiáng)大的音效調(diào)整能力
采用參數(shù)合成的方法,使ViviVoice產(chǎn)品可以非常方便的對(duì)各項(xiàng)影響合成效果的參數(shù)進(jìn)行控制,能夠更好的消除傳統(tǒng)語(yǔ)音拼接方式的頓挫等不連貫現(xiàn)象,合成語(yǔ)音更加流暢、自然。針對(duì)主流應(yīng)用環(huán)境的普遍需求,科大訊飛廣泛收集實(shí)際應(yīng)用的語(yǔ)料,
并用特定的模型對(duì)數(shù)字?jǐn)?shù)值、短語(yǔ)短句等進(jìn)行優(yōu)化,從而使得合成更加清晰、準(zhǔn)確、飽滿、節(jié)奏感更強(qiáng)。在保證高質(zhì)量語(yǔ)音合成效果的前提,能夠?qū)σ袅、音高、語(yǔ)速等眾多參數(shù)進(jìn)行調(diào)節(jié),配合豐富的特色音效,使語(yǔ)音服務(wù)更加生動(dòng)活潑,充滿趣味。
全面完善的功能特性
- 合理的體系架構(gòu),滿足高穩(wěn)定性應(yīng)用要求
ViviVoice采用基于TCP/IP的高效網(wǎng)絡(luò)語(yǔ)音合成服務(wù)和集中式的資源管理機(jī)制,形成客戶端-資源管理器-服務(wù)器有機(jī)結(jié)合的體系架構(gòu),構(gòu)建可靈活伸縮的方案,科大訊飛這一業(yè)界領(lǐng)先的體系架構(gòu),其高可用性歷經(jīng)眾多重點(diǎn)行業(yè)大規(guī)模關(guān)鍵業(yè)務(wù)的應(yīng)用檢驗(yàn),確保提供值得信賴的7×24小時(shí)不間斷自動(dòng)化語(yǔ)音服務(wù)。
- 豐富的參數(shù)設(shè)置與調(diào)節(jié)功能,適應(yīng)各種復(fù)雜應(yīng)用環(huán)境
在ViviVoice產(chǎn)品中提供了豐富完善的參數(shù)設(shè)置與調(diào)節(jié)功能和工具,幫助用戶對(duì)語(yǔ)音合成效果進(jìn)行靈活高效的控制與管理。提供對(duì)全局參數(shù)(如音量、語(yǔ)速、音高等)、用戶詞典、用戶規(guī)則、定制資源包統(tǒng)一進(jìn)行配置和管理的工具;數(shù)字、標(biāo)點(diǎn)符號(hào)、英文發(fā)音方式的設(shè)定;中英文加詞功能,可以指定每個(gè)字詞的拼音或音標(biāo)等等;提供統(tǒng)一的簡(jiǎn)單易用圖形化用戶界面進(jìn)行操作設(shè)定,并可通過(guò)API參數(shù)進(jìn)行動(dòng)態(tài)設(shè)置和調(diào)整,還支持以CSSML(中文語(yǔ)音合成標(biāo)記語(yǔ)言)進(jìn)行標(biāo)記、描述和控制。
- 靈活高效的開(kāi)發(fā)接口,加速集成與應(yīng)用發(fā)布進(jìn)程
ViviVoice DK針對(duì)不同開(kāi)發(fā)工具,不同集成要求和方案,提供多種形式的開(kāi)發(fā)接口,包括:標(biāo)準(zhǔn)開(kāi)發(fā)接口(動(dòng)態(tài)鏈接庫(kù)DLL),Quick TTS接口、COM組件、Microsoft
SAPI開(kāi)發(fā)接口和Java開(kāi)發(fā)接口,新增了預(yù)錄音背景音開(kāi)發(fā)接口,開(kāi)發(fā)者可以根據(jù)實(shí)際需要靈活選擇。提供了豐富的開(kāi)發(fā)例程和文檔,幫助加速語(yǔ)音應(yīng)用開(kāi)發(fā)過(guò)程。
科大訊飛在長(zhǎng)期集成開(kāi)發(fā)和應(yīng)用實(shí)踐的支持過(guò)程中,總結(jié)了客戶使用語(yǔ)音合成的方式和應(yīng)用的特點(diǎn),逐步開(kāi)發(fā)了一系列便于用戶在不同環(huán)境中合理運(yùn)用語(yǔ)音合成功能的工具。ViviVoice的增強(qiáng)工具集套件包括了各種使用便捷的高效組件,如離線語(yǔ)音應(yīng)用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉(zhuǎn)換工具等等。用戶通過(guò)使用這些工具可以簡(jiǎn)化開(kāi)發(fā)工作、優(yōu)化合成效果、方便系統(tǒng)維護(hù)和技術(shù)支持。
- 全面的字符集、語(yǔ)音數(shù)據(jù)格式支持
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字符集,自動(dòng)識(shí)別UNICODE文本;支持直接輸出多種采樣率的語(yǔ)音數(shù)據(jù)格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語(yǔ)音數(shù)據(jù)。
- 桌面應(yīng)用級(jí)的系統(tǒng)尺寸
高質(zhì)量的語(yǔ)音合成效果,加上超小的系統(tǒng)尺寸,降低了資源占用,進(jìn)一步降低特殊需求及桌面應(yīng)用門(mén)檻,更加符合各類語(yǔ)音應(yīng)用業(yè)務(wù)的需要。
科大訊飛的語(yǔ)音合成軟件具有最全面的平臺(tái)支持。幾乎所有主流的交互式語(yǔ)音應(yīng)答(IVR)平臺(tái)都支持科大訊飛的語(yǔ)音合成產(chǎn)品。如需了解進(jìn)一步信息,請(qǐng)與IVR提供商或科大訊飛聯(lián)系。ViViVoice支持主流的操作系統(tǒng)。在各種應(yīng)用環(huán)境下都很容易找到可供客戶借鑒的成功實(shí)施案例。
細(xì)致周到的優(yōu)化方案
- 優(yōu)化定制,高效的應(yīng)用效果方案
提供以定制資源包(加載于合成引擎之上,有效提升既定應(yīng)用領(lǐng)域語(yǔ)音效果的資源集合)和CSSML和虛擬不定長(zhǎng)工具為代表的主流應(yīng)用環(huán)境進(jìn)行效果優(yōu)化的高效解決方案,顯著提升實(shí)際應(yīng)用效果?拼笥嶏w專業(yè)服務(wù)體系提供高效的定制與優(yōu)化方案,提升客戶體驗(yàn),幫助客戶獲得語(yǔ)音自助服務(wù)的持續(xù)成功。
CSSML(Chinese Speech Synthesis Markup Language,中文語(yǔ)音合成標(biāo)記語(yǔ)言)是由科大訊飛提出并牽頭制訂的中文語(yǔ)音數(shù)據(jù)描述規(guī)范。該標(biāo)準(zhǔn)得到了國(guó)家863專家組、國(guó)家信標(biāo)委和國(guó)家技術(shù)監(jiān)督局的大力關(guān)注與支持,2005年正式通過(guò)國(guó)家標(biāo)準(zhǔn)化組織的評(píng)審,成為中文語(yǔ)音合成技術(shù)標(biāo)準(zhǔn)與規(guī)范的重要內(nèi)容。CSSML針對(duì)中文語(yǔ)音應(yīng)用設(shè)計(jì)和擴(kuò)展,可以對(duì)多種特性進(jìn)行靈活標(biāo)注與控制,并與開(kāi)放式的標(biāo)準(zhǔn)SSML兼容。
- 預(yù)錄語(yǔ)音,銜接流暢應(yīng)用簡(jiǎn)便
ViviVoice采用了科大訊飛業(yè)界首創(chuàng)的預(yù)錄音統(tǒng)一管理功能,將預(yù)錄音作為語(yǔ)音合成系統(tǒng)的資源,并通過(guò)提示音智能匹配和合成模板等方式使預(yù)錄音與合成音匹配更加容易、銜接更加流暢,同時(shí)避免頻繁處理提示音播放與語(yǔ)音合成的切換與過(guò)渡問(wèn)題,簡(jiǎn)化應(yīng)用流程的復(fù)雜程度,進(jìn)一步提高服務(wù)效果與質(zhì)量。
ViviVoice采用了科大訊飛業(yè)界首創(chuàng)的背景音功能,通過(guò)系統(tǒng)提供的簡(jiǎn)單易用工具,可以便捷高效的添加背景音樂(lè),調(diào)整背景音樂(lè)和合成語(yǔ)音的音量對(duì)比,并可直接試聽(tīng)實(shí)際效果,使語(yǔ)音服務(wù)更加親切自然。
- 特色音效,創(chuàng)造更多娛樂(lè)色彩
ViviVoice采用了科大訊飛業(yè)界首創(chuàng)的特色音效功能,系統(tǒng)在合成語(yǔ)音的同時(shí)可以加入諸如回升、混響、金屬聲等各具特色的發(fā)音效果,非常適合用來(lái)制作一些科幻、娛樂(lè)、搞笑的聲音效果,可以帶給用戶帶來(lái)全新的體驗(yàn)。
CTI論壇編輯
相關(guān)閱讀: