國際領先的“得意”聲紋識別引擎
2005/07/20
得意公司的聲紋識別引擎(d-Ear VPR)包括聲紋辨認版本和聲紋確認版本,可以是文本無關的,也可以是文本相關的,而且均支持開集的識別方式。其中文本無關的版本同時具有文本和語言的無關性,對語音長度的要求也非常低,通常訓練只需要幾十秒有效語音,而識別階段只需幾秒鐘的有效語音即可。有很高的識別精度,也可以靈活地調(diào)整操作點參數(shù)從而適應于不同應用的需求。
"得意"聲紋識別技術與其他聲紋識別技術的比較
得意聲紋識別技術
|
其他聲紋識別技術
|
|
1 | 具文本無關性,確保了身份確認的安全性和用戶的方便性 對聲紋的識別與所說的文本和語言無關,用戶訓練系統(tǒng)和系統(tǒng)對用戶的聲音進行鑒別和確認,可以是完全不同的文本,完全不同的語言。比如,在用戶在系統(tǒng)注冊聲音時,可以使用中文說一段文學章節(jié),而識別時用戶可以用英文談論計算機的發(fā)展方向。 |
與文本相關,安全性和使用方便性都顯不足 對聲紋的識別與所說的文本和語言相關,用戶訓練系統(tǒng)和系統(tǒng)對用戶的聲音進行鑒別和確認,必須是完全一致的文本,使用相同的語言,容易導致口令的外泄。 |
2 | 對語音長度沒有特殊要求,方便實際的應用 使用時的測試語音2-4 秒,并可不斷累積調(diào)整聲紋模型精度;用戶訓練系統(tǒng),讓其記住其聲紋,只需要幾秒種的聲音;而在識別時,系統(tǒng)只要獲得被測試人幾秒的聲音,就可以進行聲紋識別。 |
要求進行特定的語音訓練,用戶需跟著朗讀和學習,方便性和實用性不強 |
3 | 很高的精度 得意的技術辨認和確認準確度都很高,說話人辨認的正確率不小于99%;說話人確認的誤識率和誤拒率均低于1% |
精度一般 識別精度約為90%,誤識率和誤拒率相對較高 |
4 | 操作點調(diào)整方便 可根據(jù)實際情況和環(huán)境,按不同的應用需求調(diào)整操作點閾值,使最終準確率達到最高或使錯誤率降到最低。 |
沒有操作點調(diào)整功能 不同用戶和不同的環(huán)境使用只能使用同一模型,不能確保高的安全性和準確率 |
5 | 聲紋模型存儲空間小 每個人的聲紋模型存儲空間小于5KB,能可靠地存儲于加密鑰匙內(nèi),與硬件緊密結合能最高程度地保證系統(tǒng)的安全性,防止非法的攻擊和竊取 |
聲紋模型存儲空間小 不能存儲于加密鑰匙內(nèi),沒有硬件的保護,不能有效防止非法的攻擊和竊取 |
得意音通公司供稿 CTI論壇編輯
得意珠三角綜合智能信息增值平臺項目中標 2009-08-20 |
北京軟件產(chǎn)品質(zhì)量檢測檢驗中心對《海量語音文件的目標說話人篩選系統(tǒng)》進行測試 2009-06-25 |
廣東政府和清華大學舉行了全面開展產(chǎn)學研合作協(xié)議簽約儀式 2009-06-25 |
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23 |
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27 |