本技術可廣泛應用至電話自動答錄裝置或車載設備等場合,幫助收聽語音者在聽取語音時更容易理解內容;技術特點如下:
1. 使用從聲音資料庫中抽取出的原始聲音語調節(jié)奏資訊──從大量的聲音資料庫中,以前后單字及文章長度為基準,抽取出可將單字以精確的語調及節(jié)奏發(fā)音的語音資訊。在合成語音時,配合既有以人工方式完成的樣本規(guī)則,便能產生自然而富有情感的合成語音。
2. 使用可表現(xiàn)多樣化語調節(jié)奏的豐富聲音元素──將聲音資料庫中抽取出的聲音元素,以及聲音資料庫中沒有的聲音元素,依據(jù)唇部與聲帶振動等人類發(fā)音所需的構造變化為基準,產生其語音內容。將這些聲音元素做最適當?shù)倪x擇并加以整合,便能產生高品質語調節(jié)奏的合成語音。
NEC未來將持續(xù)積極進行文字語音合成技術相關應用的研究與開發(fā),并且致力創(chuàng)造更便利、更人性化的理想資訊社會。
電子工程專輯臺灣