語(yǔ)音技術(shù)——性別辨識(shí)和語(yǔ)者驗(yàn)證
2010/11/24
性別辨識(shí)和語(yǔ)者驗(yàn)證簡(jiǎn)介
性別辨識(shí)(Gender Recognition)技術(shù)是以語(yǔ)音訊號(hào)處理的方法,擷取說(shuō)話者的聲音特征,藉此判斷說(shuō)話者的性別是男性或女性,如下流程圖所示的技術(shù)。
而語(yǔ)者驗(yàn)證(Speaker Verification)技術(shù),如下圖所示,我們亦可稱之為語(yǔ)者認(rèn)證(Speaker Authentication)或是語(yǔ)者偵測(cè)(Speaker Detection),主要是用來(lái)鑒定一已知身份的說(shuō)話者其宣稱之身份的真實(shí)性,利用擷取說(shuō)話者的聲紋特征,我們可以從事先儲(chǔ)存的語(yǔ)者聲紋資料庫(kù)中,取出該宣稱身份的語(yǔ)者聲紋模型,并且和說(shuō)話者輸入的聲音做比對(duì),由于系統(tǒng)會(huì)先獲知該使用者表明的身份(如小美),所以這會(huì)造成兩種可能的判斷錯(cuò)誤,其中一種是錯(cuò)誤接受(False Accept),即說(shuō)話者為一冒充者(Imposter)但被系統(tǒng)誤認(rèn)為其所宣稱的身份,另外一種是錯(cuò)誤拒絕(False Reject),即系統(tǒng)將真實(shí)身份的說(shuō)話者誤判為冒充者。
性別辨識(shí)和語(yǔ)者驗(yàn)證特色
本項(xiàng)性別辨識(shí)技術(shù)的主要特點(diǎn)在于用戶不須事先建立個(gè)人聲紋資料庫(kù),祗要提供輸入的聲紋即可進(jìn)行辨識(shí),且辨識(shí)率在實(shí)際的電話語(yǔ)音中可達(dá)93%。
語(yǔ)者驗(yàn)證辨識(shí)技術(shù)的特色分為兩種,一種是和本文相關(guān)(Text-Dependent)的驗(yàn)證,即用戶在建立個(gè)人聲紋資料庫(kù)和驗(yàn)證個(gè)人聲紋所輸入聲音必須是相同的,另一種是和本文無(wú)關(guān)(Text-Independent)的驗(yàn)證,即用戶在建立個(gè)人聲紋資料庫(kù)和驗(yàn)證個(gè)人聲紋時(shí)所輸入的聲音允許是不同的,而本公司提供的技術(shù)同時(shí)可應(yīng)用于上述的兩種使用情境,讓使用者的應(yīng)用更廣泛。
性別辨識(shí)和語(yǔ)者驗(yàn)證應(yīng)用
性別辨識(shí)可應(yīng)用于需驗(yàn)證男女生性別的場(chǎng)合,例如從身份證號(hào)碼的第一個(gè)數(shù)字得知被驗(yàn)證者的性別,驗(yàn)證說(shuō)話者的性別是否與該身份證號(hào)碼所載的性別一致,此外也可應(yīng)用在語(yǔ)音辨識(shí)的前端,當(dāng)辨識(shí)出說(shuō)話者的性別后,以性別相關(guān)的語(yǔ)音模型(Gender-Dependent
Model)進(jìn)行辨認(rèn)以提升語(yǔ)音辨識(shí)率。
語(yǔ)者驗(yàn)證技術(shù)的應(yīng)用則更廣泛,在個(gè)人方面可應(yīng)用于個(gè)人設(shè)備的管控,例如:個(gè)人電腦的使用權(quán)限設(shè)定,在企業(yè)方面則有銀行信用卡刷卡時(shí)的身份核對(duì),或從大量的客服人員對(duì)話資料中擷取出是否有含某特定身份者在說(shuō)話,以減輕客服人員的工作量,并提升客服品質(zhì)(Quality
Management)。
CTI論壇編輯
臺(tái)達(dá)客服中心錄音質(zhì)檢系統(tǒng)解決方案 2010-11-19 |
報(bào)告稱語(yǔ)音識(shí)別每?jī)赡甑膹?fù)合成長(zhǎng)率為97.7% 2010-11-03 |
人機(jī)接口的發(fā)展演變路線圖 2010-11-02 |
臺(tái)達(dá)語(yǔ)音識(shí)別系統(tǒng)Delta Recognizer V5.0 2010-11-01 |
臺(tái)達(dá)電子鄭漢彬:語(yǔ)音識(shí)別于呼叫中心的創(chuàng)新應(yīng)用 2010-05-24 |