圖1 語音識(shí)別系統(tǒng)的基本流程
語音信號(hào)輸入后首先經(jīng)過濾波器,去除干擾及可能造成混淆的成分,然后由前端處理模塊提取語音識(shí)別所需的特征參數(shù)。當(dāng)前語音識(shí)別所用的特征參數(shù)主要有兩種類型:線性預(yù)測倒譜系數(shù)(Linear Prediction Cepstrum Coefficient, LPCC)和MEL頻標(biāo)倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)。
新玩具產(chǎn)品要得到公司主管的欣賞并不容易,抱怨通常會(huì)很多,例如會(huì)笑的玩具聽起來像"惡魔的聲音"(實(shí)際上就存在這樣的訴訟案例);詼諧的玩具又"太低級(jí)趣味";有的玩具很容易引起驚慌,這是因?yàn)橥婢咄话l(fā)大聲或猛然動(dòng)作的緣故;馬達(dá)或齒輪噪聲太大等。要解決這些問題,工程師還要進(jìn)行一系列的調(diào)整。
深圳捷通公司供稿 CTI論壇編輯