聲紋識(shí)別的模式識(shí)別方法
2011/01/05
對(duì)于模式識(shí)別,有以下幾大類方法:
聲紋識(shí)別需要解決的關(guān)鍵問(wèn)題還有很多,諸如:短話音問(wèn)題,能否用很短的語(yǔ)音進(jìn)行模型訓(xùn)練,而且用很短的時(shí)間進(jìn)行識(shí)別,這主要是聲音不易獲取的應(yīng)用所需求的;聲音模仿(或放錄音)問(wèn)題,要有效地區(qū)分開(kāi)模仿聲音(錄音)和真正的聲音;多說(shuō)話人情況下目標(biāo)說(shuō)話人的有效檢出;消除或減弱聲音變化(不同語(yǔ)言、內(nèi)容、方式、身體狀況、時(shí)間、年齡等)帶來(lái)的影響;消除信道差異和背景噪音帶來(lái)的影響;……此時(shí)需要用到其他一些技術(shù)來(lái)輔助完成,如去噪、自適應(yīng)等技術(shù)。
對(duì)說(shuō)話人確認(rèn),還面臨一個(gè)兩難選擇問(wèn)題。通常,表征說(shuō)話人確認(rèn)系統(tǒng)性能的兩個(gè)重要參數(shù)是錯(cuò)誤拒絕率和錯(cuò)誤接受率,前者是拒絕真正說(shuō)話人而造成的錯(cuò)誤,后者是接受集外說(shuō)話人而造成的錯(cuò)誤,二者與閾值的設(shè)定相關(guān)。在現(xiàn)有的技術(shù)水平下,兩者無(wú)法同時(shí)達(dá)到最小,需要調(diào)整閾值來(lái)滿足不同應(yīng)用的需求,比如在需要“易用性”的情況下,可以讓錯(cuò)誤拒絕率低一些,此時(shí)錯(cuò)誤接受率會(huì)增加,從而安全性降低;在對(duì)“安全性”要求高的情況下,可以讓錯(cuò)誤接受率低一些,此時(shí)錯(cuò)誤拒絕率會(huì)增加,從而易用性降低。前者可以概括為“寧錯(cuò)勿漏”,而后者可以“寧漏勿錯(cuò)”。我們把真正閾值的調(diào)整稱為“操作點(diǎn)”調(diào)整。好的系統(tǒng)應(yīng)該允許對(duì)操作點(diǎn)的自由調(diào)整。
CTI論壇報(bào)道
聲紋識(shí)別技術(shù):利用人體生物特征進(jìn)行身份認(rèn)證 2011-01-05 |
聲紋識(shí)別的原理及其應(yīng)用 2011-01-05 |
聲紋識(shí)別的分類 2011-01-05 |
聲紋識(shí)別的關(guān)鍵問(wèn)題 2011-01-05 |
Nuance:車載信息平臺(tái)邁入語(yǔ)音時(shí)代 2010-12-27 |