Prosody板卡的說話人辨認(rèn)和證實功能
2004/03/25
Aculab公司的Prosody板卡現(xiàn)支持說話人辨認(rèn)和證實(SVI)功能。SVI技術(shù)是通過電話媒體安全訪問個人信息的最經(jīng)濟和方便的處理方法。據(jù)此,可以開發(fā)許多實用系統(tǒng),來訪問敏感信息或提升現(xiàn)有應(yīng)用系統(tǒng)的安全性能。SVI進一步擴大了Aculab公司的語音處理技術(shù)功能集。
這種統(tǒng)計技術(shù)能根據(jù)獲得的人類聲音信號的物理特性,利用電話里的一句言辭來證實說話人自己所聲明的身份是否屬實。換言之,根據(jù)個人聲紋的唯一性,來驗證說話人的身份。
這個基于主機的SVI算法模塊,為采用Prosody數(shù)字信號處理資源卡的應(yīng)用系統(tǒng)開發(fā)商提供了更多的功能選擇。而且,SVI是免費的,證明了Aculab對電話語音市場的一貫承諾-提供性能無與倫比的語音處理產(chǎn)品,并凸現(xiàn)她的價值。
應(yīng)用
Aculab的SVI技術(shù)能提升許多業(yè)務(wù)的性能,如:為公司提供安全存取Intranet/Extranet網(wǎng)絡(luò)的方法,節(jié)省了設(shè)置PIN密碼相關(guān)的費用。
采用SVI 技術(shù)的聯(lián)絡(luò)中心,因為省去了需人工參與的身份和密碼認(rèn)證步驟,有效減少了座席操作人員的工作負(fù)荷。有了SVI,座席人員可以集中精力致力于其他更有意義的任務(wù)。
通過保護個人信息獲得的競爭優(yōu)勢,SVI技術(shù)也可以廣泛應(yīng)用于電信領(lǐng)域,如電話卡、蜂窩漫游、統(tǒng)一消息和自動總機等。
在旅游領(lǐng)域,SVI系統(tǒng)可以為"常旅客"交互業(yè)務(wù)帶來更大的便利和個性化支持。
與Aculab語音識別一起使用
同時采用語音識別和說話人認(rèn)證技術(shù),允許應(yīng)用系統(tǒng)根據(jù)電話用戶的聲音特征和說話內(nèi)容來進一步提高說話人認(rèn)證的可靠性;赟VI的應(yīng)用能自動檢測到說話人按聲紋進行身份證實的難易性,進而對說話人提問,以獲得附加信息。
SVI算法功能是Aculab ASR軟件的一部分,且已無縫集成在Aculab的統(tǒng)一API內(nèi)。SVI和ASR在同一個服務(wù)器內(nèi)實現(xiàn),可以有效減小處理延時。請參閱Acualb技術(shù)文檔"Prosody的自動語音識別(ASR)功能"(APB0024)。
可伸縮的結(jié)構(gòu)
由于Prosody板卡的每個DSP能支持多個通道的處理,所以說話人證實處理的通道容量僅取決于SVI/ASR宿主服務(wù)器的處理能力。顯然,采用額外的SVI/ASR服務(wù)器能進一步提高通道容量。這種結(jié)構(gòu)特點有助于提高系統(tǒng)的靈活性,即根據(jù)需要采用一個或多個分布式SVI/ASR服務(wù)器,從分發(fā)揮Prosody DSP的處理能力。
支持的語言
SVI本身單獨使用是與語言無關(guān)的。和ASR技術(shù)一起使用時,支持的語言包括:英國英語、美國英語、西班牙語、法語、意大利語、德語等。雖然在一次語音識別處理中可能不會同時涉及多種語言,這些語言的軟件包還是單獨提供的。目前支持的主機操作系統(tǒng)有:Windows XP/2000,Sun SPARC Solaris和Linux等。
硬件選擇
Aculab的Prosody DSP資源卡為這個基于主機的SVI算法饋入語音信號,所以這個SVI/ASR算法模塊可以和許多其他DSP資源并行使用,包括錄/放音、DTMF檢測和回波抵消等,確保在單一硬件平臺上同時實現(xiàn)多樣化的語音處理功能。
準(zhǔn)確率指標(biāo)
說話人證實技術(shù)的性能可由兩個參數(shù)來度量:正確說話人被錯誤拒絕的概率和冒名頂替者被錯誤接受的概率?梢栽O(shè)置一個參數(shù)門限,確保錯誤拒絕和錯誤接受的概率相等,即所謂的"等錯誤概率(ERR)"。Aculab的ERR指標(biāo)是4%。這個指標(biāo)是用單句言辭測試得到的。如果采用約定的短語,這個ERR會更低。在通道容量方面,若采用1.9GHz主頻的P4 CPU、總線速度為400MHz、具有1GB的RAM的機器,SVI可同時認(rèn)證120個并發(fā)呼叫的用戶。
技術(shù)特性
·說話人加入和刪除
新的用戶可以通過訓(xùn)練并指定用戶名加入認(rèn)證系統(tǒng)。附加的用于增強安全性的信息,如PIN、密碼或額外的訓(xùn)練,可根據(jù)需要來取舍。
·說話人證實
允許說話人用聲音來聲明自己的身份,系統(tǒng)返回的結(jié)果是"接受"或"拒絕"。
·說話人辨別
把給定的話音信號與目標(biāo)人群的語音特征逐個匹配,判斷和哪個人的聲紋特征最接近。
·說話人自適應(yīng)
每次使用認(rèn)證系統(tǒng)后,說話人的語音特征模板信息會自動更新。
·高辨別準(zhǔn)確率
只用幾秒鐘的測試語音即能達(dá)到很高的準(zhǔn)確率。
·連續(xù)監(jiān)控
若與語音識別技術(shù)同時使用,可以不間斷地監(jiān)控說話人,進一步提高證實的準(zhǔn)確率。
·可伸縮的結(jié)構(gòu)
系統(tǒng)的分布式處理結(jié)構(gòu)很方便系統(tǒng)容量的擴展。
·Aculab的統(tǒng)一API
加快系統(tǒng)開發(fā)速度,縮短系統(tǒng)產(chǎn)品進入市場所需的時間。
·免費使用
Aculab并不收取按通道計算的軟件許可證費用,用戶可以隨時隨地在Aculab的網(wǎng)站下載SVI。
·靜音檢測
用來確定說話人講話的起始點和結(jié)束點,以減輕系統(tǒng)的處理負(fù)擔(dān)。相關(guān)參數(shù)可以在API調(diào)用時設(shè)定。
·回波抵消
可以在Prosody板卡上同時啟動運行,來減小由于待證實說話人的言辭由于疊加了回波所造成的錯誤拒絕的概率。
技術(shù)優(yōu)勢
·調(diào)整原有的系統(tǒng)安全策略
SVI利用電話信號來證實說話人的身份,使攝像頭等監(jiān)控設(shè)備不再成為必需品。
·減少人員干預(yù)
不再需要人工的密碼設(shè)定,減輕工作人員的負(fù)荷,從而降低成本。
·減少出錯概率
由于SVI能提供準(zhǔn)確地進行聲紋安全認(rèn)證,所以蜂窩電話存取和信用卡應(yīng)用可廣泛采用此項技術(shù)。
·符合用戶的習(xí)慣
SVI可以和語音識別或其他識別器一起使用,說話人可以被識別并認(rèn)證,而不再要求用戶記住并鍵入他們的用戶號等信息。
·增強安全性
SVI和密鑰機制同時使用,可以進一步增強安全性。在證實特定說話人說出特定密碼的過程中,SVI系統(tǒng)多了一層安全防護。
Aculab公司供稿 CTI論壇編輯
相關(guān)鏈接: