科大訊飛新一代語音合成系統(tǒng)Interphonic6.0
2010/02/04
InterPhonic系列簡介:
InterPhonic 系列產(chǎn)品是業(yè)界頂尖級的語音合成軟件產(chǎn)品。語音合成(Text To Speech,TTS)技術(shù)能夠自動將任意文字實(shí)時轉(zhuǎn)換為連續(xù)的自然語音,是一種能夠在任何時間、任何地點(diǎn),向任何人提供語音信息服務(wù)的高效便捷手段,非常符合信息時代海量數(shù)據(jù)、動態(tài)更新和個性化查詢的需求?拼笥嶏w語音技術(shù)歷經(jīng)20年不懈創(chuàng)新,自90年代中期以來,在歷次的國內(nèi)國外評測中,各項(xiàng)關(guān)鍵指標(biāo)均名列第一。InterPhonic
產(chǎn)品基于深厚的研究積累,經(jīng)過長期廣泛深入的應(yīng)用實(shí)踐,在多項(xiàng)關(guān)鍵技術(shù)上有重大創(chuàng)新突破,作為科大訊飛引領(lǐng)語音技術(shù)與市場發(fā)展的新一代主流語音合成產(chǎn)品,可為自助語音服務(wù)提供源源不斷的核心動力。
InterPhonic 6.0產(chǎn)品介紹
高質(zhì)量的語音合成效果
- 多語種,適應(yīng)不斷發(fā)展的業(yè)務(wù)需求
提供普通話、廣東話、英語、法語、德語、葡萄牙語、意大利語、荷蘭語、西班牙語、瑞典語、挪威語、丹麥語、俄語、希臘語、朝鮮語、日本語等幾十個語種,包含業(yè)界創(chuàng)新的普通話與英語同音混讀、廣東話與英語同音混讀,適應(yīng)不同語音應(yīng)用業(yè)務(wù)的需求。多引擎管理接口可對不同語種的系統(tǒng)提供一致化的訪問界面,應(yīng)用層可以靈活透明的選擇所需的語音合成語種,并支持實(shí)時語種切換。
- 多音色,滿足不同環(huán)境的個性化應(yīng)用
主導(dǎo)個性化語音服務(wù)新潮流,提供豐富、風(fēng)格多樣化的音色選擇,如渾厚淳正的男聲,成熟穩(wěn)重、輕快活潑、或溫柔甜美的女聲,標(biāo)準(zhǔn)地道的英語女聲,甚至童聲、少男、少女、老年人等等,所有音色庫均繼承科大訊飛語音合成技術(shù)一貫的優(yōu)良品質(zhì)?晒┯脩舾鶕(jù)不同應(yīng)用業(yè)務(wù)需要,選擇最適合應(yīng)用場景的語音風(fēng)格,并支持實(shí)時動態(tài)的音色切換。
- 增強(qiáng)表現(xiàn)力,語音合成效果更自然
InterPhonic產(chǎn)品擁有高智能的自然語言理解能力,自動進(jìn)行文本分析和韻律描述,可以表現(xiàn)出典型的語氣,如疑問和感嘆等,合成效果更富表現(xiàn)力。語音合成效果對于語氣的表現(xiàn)能力,是科大訊飛語音技術(shù)又一項(xiàng)重要的創(chuàng)新性突破,將幫助自動語音服務(wù)以更加人性化的語音用戶界面提升客戶體驗(yàn)。
- 高準(zhǔn)確度的智能文本分析與預(yù)處理
InterPhonic語音合成產(chǎn)品所擁有的高準(zhǔn)確度智能文本分析與預(yù)處理技術(shù),有效保障語音合成準(zhǔn)確、流暢、自然。得益于科大訊飛在語言學(xué)上的深厚積累、與相關(guān)權(quán)威科研機(jī)構(gòu)的緊密合作,以及通過寬廣的應(yīng)用實(shí)踐平臺所積累的海量專業(yè)知識庫,通過不斷訓(xùn)練和優(yōu)化,InterPhonic即使在面對針對語言分析處理的難點(diǎn),如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準(zhǔn)確的自動處理結(jié)果。
針對主流應(yīng)用環(huán)境的普遍需求,科大訊飛廣泛收集實(shí)際應(yīng)用的語料,并進(jìn)行細(xì)致分析和專業(yè)的優(yōu)化,InterPhonic產(chǎn)品在數(shù)字?jǐn)?shù)值、短語短句等最常見應(yīng)用下效果提升顯著,合成效果更加清晰準(zhǔn)確、節(jié)奏感更強(qiáng)。
全面完善的功能特性
采用基于TCP/IP的高效網(wǎng)絡(luò)語音合成服務(wù)和集中式的資源管理機(jī)制,形成客戶端-資源管理器-服務(wù)器有機(jī)結(jié)合的體系架構(gòu),構(gòu)建可靈活伸縮的方案,其高可用性歷經(jīng)眾多重點(diǎn)行業(yè)大規(guī)模關(guān)鍵業(yè)務(wù)的應(yīng)用檢驗(yàn),確保提供值得信賴的7×24小時不間斷自動化語音服務(wù)。
InterPhonic SDK針對不同開發(fā)工具,不同集成要求和方案,提供多種形式的開發(fā)接口,包括:標(biāo)準(zhǔn)開發(fā)接口(DLL)、簡單開發(fā)接口、COM組件、SAPI開發(fā)接口及Java開發(fā)接口,開發(fā)者可以根據(jù)實(shí)際需要靈活選擇。提供豐富的開發(fā)例程和文檔,幫助加速語音應(yīng)用開發(fā)過程。
- 豐富的參數(shù)設(shè)置與調(diào)節(jié)功能
豐富完善的參數(shù)設(shè)置與調(diào)節(jié)功能和工具,幫助用戶對語音合成效果進(jìn)行靈活高效的控制與管理。提供對全局參數(shù)(如音量、語速、音高等)、用戶詞典、用戶規(guī)則、定制資源包統(tǒng)一進(jìn)行配置和管理的工具;數(shù)字、標(biāo)點(diǎn)符號、英文發(fā)音方式的設(shè)定;中英文加詞功能,可以指定每個字詞的拼音或音標(biāo)等等;提供統(tǒng)一的簡單易用圖形化用戶界面進(jìn)行操作設(shè)定,并可通過API參數(shù)進(jìn)行動態(tài)設(shè)置和調(diào)整,還支持以CSSML(中文語音合成標(biāo)記語言)進(jìn)行標(biāo)記、描述和控制。
InterPhonic的增強(qiáng)工具集套件包括了使用便捷的高效組件,如離線語音應(yīng)用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉(zhuǎn)換工具等。
能夠解析普通文本格式、MIME格式和html格式的Email,合成郵件主題、發(fā)件人、收件人、信件內(nèi)容和文本附件,根據(jù)語境自動判斷讀法。
增加了URI合成功能。自動獲取用戶指定的網(wǎng)絡(luò)URI文本,方便使用網(wǎng)絡(luò)上的信息資源。
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字符集,自動識別UNICODE文本;支持直接輸出多種采樣率的語音數(shù)據(jù)格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語音數(shù)據(jù)。
服務(wù)器端支持Windows等主流操作系統(tǒng),客戶端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE
Linux、HP TRUE64 UNIX、IBM AIX UNIX、VxWork等操作系統(tǒng)。
與業(yè)內(nèi)知名的相關(guān)平臺和設(shè)備商均有過成功的集成案例。通過與眾多平臺和設(shè)備提供商、系統(tǒng)集成商及軟件開發(fā)商的緊密合作,能夠保證向用戶提供圍繞語音應(yīng)用全程的專業(yè)服務(wù)。
細(xì)致周到的優(yōu)化方案
- 優(yōu)化定制,高效的應(yīng)用效果方案
提供以定制資源包(加載于合成引擎之上,有效提升既定應(yīng)用領(lǐng)域語音效果的資源集合)、CSSML、虛擬不定長和語音合成模板等工具為代表的主流應(yīng)用環(huán)境進(jìn)行效果優(yōu)化的高效解決方案,顯著提升實(shí)際應(yīng)用效果?拼笥嶏w專業(yè)服務(wù)體系提供高效的定制與優(yōu)化方案,提升客戶體驗(yàn),幫助客戶獲得語音自助服務(wù)的持續(xù)成功。
CSSML(Chinese Speech Synthesis Markup Language)是由科大訊飛提出并牽頭制訂的中文語音數(shù)據(jù)描述規(guī)范。該標(biāo)準(zhǔn)得到了國家863專家組、國家信標(biāo)委和國家技術(shù)監(jiān)督局的大力關(guān)注與支持,2005年正式通過國家標(biāo)準(zhǔn)化組織的評審,成為中文語音合成技術(shù)標(biāo)準(zhǔn)與規(guī)范的重要內(nèi)容。CSSML針對中文語音應(yīng)用設(shè)計(jì)和擴(kuò)展,可以對多種特性進(jìn)行靈活標(biāo)注與控制,并與SSML兼容。
InterPhonic提供業(yè)界創(chuàng)新的預(yù)錄音統(tǒng)一管理功能,將預(yù)錄音作為語音合成系統(tǒng)的資源,并通過提示音智能匹配和合成模板等方式使預(yù)錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應(yīng)用流程的復(fù)雜程度,進(jìn)一步提高服務(wù)效果與質(zhì)量。
InterPhonic提供業(yè)界首創(chuàng)的背景音功能,通過系統(tǒng)提供的簡單易用工具,可以便捷高效的添加背景音樂,調(diào)整背景音樂和合成語音的音量對比,并可直接試聽實(shí)際效果,使語音服務(wù)更加親切自然。
作為語音市場的強(qiáng)大動力引擎,InterPhonic產(chǎn)品會為您帶來如下收益:
降低成本:高質(zhì)量的效果、靈活的應(yīng)用、經(jīng)過應(yīng)用驗(yàn)證的穩(wěn)定性,可使您放心自如地應(yīng)用自助語音服務(wù)來取代傳統(tǒng)的人工服務(wù)。更高的自動化程度,意味著您將以更低的成本提供更高質(zhì)量的服務(wù)。
提高效率:有利于改變原有的語音信息制作方式,在規(guī)模語音應(yīng)用系統(tǒng)中,多路并發(fā)的實(shí)時語音合成服務(wù),將顯著提高信息更新的時效性,并且提供的語音信息內(nèi)容與范圍將得以大大拓展。
靈活擴(kuò)展:標(biāo)準(zhǔn)Client/Server架構(gòu)以及完善的系統(tǒng)設(shè)計(jì),充分考慮了大規(guī)模語音應(yīng)用的需求,具備良好的伸縮性。擴(kuò)容時只需增加新的語音合成服務(wù)節(jié)點(diǎn),無需對原有系統(tǒng)進(jìn)行其它改動。
實(shí)力保障:科大訊飛堅(jiān)實(shí)的綜合實(shí)力、高效的專業(yè)研發(fā)和技術(shù)支持服務(wù)團(tuán)隊(duì)、業(yè)界公認(rèn)的領(lǐng)導(dǎo)者地位以及所獲得的廣泛贊譽(yù),都是您得到穩(wěn)定支持服務(wù)的有力保障。
InterPhonic
6.0在線演示
CTI論壇編輯
相關(guān)閱讀: