得意公司的聲紋識(shí)別引擎(d-Ear VPR)包括聲紋辨認(rèn)版本和聲紋確認(rèn)版本,可以是文本無關(guān)的,也可以是文本相關(guān)的,而且均支持開集的識(shí)別方式。其中文本無關(guān)的版本同時(shí)具有文本和語言的無關(guān)性,對(duì)語音長(zhǎng)度的要求也非常低,通常訓(xùn)練只需要幾十秒有效語音,而識(shí)別階段只需幾秒鐘的有效語音即可。有很高的識(shí)別精度,也可以靈活地調(diào)整操作點(diǎn)參數(shù)從而適應(yīng)于不同應(yīng)用的需求。
"得意"聲紋識(shí)別技術(shù)與其他聲紋識(shí)別技術(shù)的比較
得意聲紋識(shí)別技術(shù) | 其他聲紋識(shí)別技術(shù) | |||
1 | 具文本無關(guān)性,確保了身份確認(rèn)的安全性和用戶的方便性 對(duì)聲紋的識(shí)別與所說的文本和語言相關(guān),用戶訓(xùn)練系統(tǒng)和系統(tǒng)對(duì)用戶的聲音進(jìn)行鑒別和確認(rèn),必須是完全一致的文本,使用相同的語言,容易導(dǎo)致口令的外泄。 | |||
2 | 對(duì)語音長(zhǎng)度沒有特殊要求,方便實(shí)際的應(yīng)用 得意的技術(shù)辨認(rèn)和確認(rèn)準(zhǔn)確度都很高,說話人辨認(rèn)的正確率不小于99%;說話人確認(rèn)的誤識(shí)率和誤拒率均低于1% | 精度一般 可根據(jù)實(shí)際情況和環(huán)境,按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,使最終準(zhǔn)確率達(dá)到最高或使錯(cuò)誤率降到最低。 | 沒有操作點(diǎn)調(diào)整功能 每個(gè)人的聲紋模型存儲(chǔ)空間小于5KB,能可靠地存儲(chǔ)于加密鑰匙內(nèi),與硬件緊密結(jié)合能最高程度地保證系統(tǒng)的安全性,防止非法的攻擊和竊取 | 聲紋模型存儲(chǔ)空間小 不能存儲(chǔ)于加密鑰匙內(nèi),沒有硬件的保護(hù),不能有效防止非法的攻擊和竊取 |
得意音通公司供稿 CTI論壇編輯