科大訊飛VIVIVOICE開啟語音娛樂新時(shí)代
2006/08/14
正在上映的熱門大片《諜中諜3》中有這樣一個(gè)場(chǎng)景:在酒店的洗手間里,湯姆.克魯斯扮演的特工伊森.亨特正在上演一幕“易容術(shù)”,利用面具喬裝成1號(hào)反派黑幫頭頭,可是最關(guān)鍵的問題是如何模擬成他的聲音,時(shí)間緊迫,伊森逼迫黑幫頭頭對(duì)著自己手里的微型錄音機(jī)念了一段話,同時(shí)該錄音文件迅速的被傳到了搭檔電腦專家路瑟的電腦上,在很短的時(shí)間內(nèi)對(duì)收到的錄音文件進(jìn)行分析并提取特征,迅速的訓(xùn)練了一個(gè)具有黑幫頭頭聲音特征的音庫,在最關(guān)鍵的時(shí)刻,喬裝的伊森對(duì)黑幫手下發(fā)出了“在外面等我”的命令,由于聲音和黑幫頭頭一致,而沒有引起懷疑,最終成功的綁架了黑幫頭頭。
影片中幫助湯姆.克魯斯在關(guān)鍵時(shí)刻模擬聲音成功的技術(shù)就是voice conversion,也就是具備音色轉(zhuǎn)換功能的全新個(gè)性化語音合成技術(shù)。而目前科大訊飛在業(yè)界率先推出了一款基于這種超酷語音技術(shù)的合成系統(tǒng)——Vivivoice,自此,在很短時(shí)間內(nèi)制作出您需要的音庫將不再是夢(mèng)想?拼笥嶏w的這款Vivivoice是專門針對(duì)增殖、娛樂等個(gè)性化應(yīng)用場(chǎng)合,專門為企業(yè)客戶和桌面用戶打造的一款合成效果流暢自然的、可以實(shí)現(xiàn)發(fā)音人快速定制的、資源占用相對(duì)較少,且具備目前主流語音合成產(chǎn)品InterPhonic系列各項(xiàng)優(yōu)化定制和管理功能的全新語音合成產(chǎn)品。簡單說來,該產(chǎn)品就是可以像《諜中諜3》中演示的那樣,僅僅憑借目標(biāo)模擬對(duì)象的一段錄音,就可以在比較短的時(shí)間內(nèi)訓(xùn)練出符合發(fā)音人聲音特色的音庫,從而根據(jù)文本進(jìn)行任意句子的合成。該款Vivivoice合成系統(tǒng)只需錄制很短時(shí)間的語音,就可以制作一個(gè)音庫,其訓(xùn)練過程自動(dòng)化,音庫制作周期短等獨(dú)一無二的特性,能夠快速定制不同年齡、不同性別、不同風(fēng)格的音庫。目前科大訊飛的vivivoice產(chǎn)品已經(jīng)可以提供包括童聲,老人,東北話,四川話等眾多方言與特色音庫,另外,可以根據(jù)用戶的需求快速制作出所需要的其他個(gè)性化特色音庫。除此以外,為了增強(qiáng)產(chǎn)品的娛樂性,Vivivoice還可以通過調(diào)整參數(shù)來制造很多的娛樂效果。
做為語音業(yè)界的領(lǐng)導(dǎo)者,科大訊飛此次在業(yè)界首推的第一款真正意義上的個(gè)性化語音合成產(chǎn)品Vivivoice將改變以往語音合成系統(tǒng)嚴(yán)肅的形象,讓人們真正體驗(yàn)到語音合成技術(shù)的魅力,原來語音合成也可以很活潑,很個(gè)性。相信隨著Vivivvoice產(chǎn)品的推出必將引發(fā)語音技術(shù)在增值、娛樂領(lǐng)域的應(yīng)用熱潮。
科大訊飛公司供稿供稿 CTI論壇編輯
相關(guān)鏈接: