日本電報(bào)電話公司(NTT)9月7日正式宣布,它成功開發(fā)出了比人類聲音毫不遜色的自然歌聲合成技術(shù)。該技術(shù)可以生動(dòng)再現(xiàn)人類歌聲中豐富的名為“倍音”的高音調(diào)。只要使用者輸入歌詞和歌譜,安裝該軟件的PC就會輕松地讀譜歌唱。該技術(shù)有望在游戲及卡通方面有優(yōu)秀表現(xiàn)。目前NTT東西地方公司和NTT通信公司等正在研究該技術(shù)的實(shí)用化問題。
該技術(shù)在采集合成歌聲素材創(chuàng)建人類聲音數(shù)據(jù)庫時(shí),對人類聲音按波形整齊與否進(jìn)行分類,波形整齊的成分與波形不整齊的成分按類存放。在合成過程中,該技術(shù)首先利用正弦波自動(dòng)合成“倍音”,然后進(jìn)行其他迭加。僅靠這種手段合成的聲音還有樂器的味道,不夠自然。這時(shí)候就需要加入一些特地保存的相應(yīng)的噪音成分,這樣一來,比較自然的、接近人類聲音的歌聲就實(shí)現(xiàn)了。