“聞聲識人”正在移動支付領域拉開應用大幕。近日,中國人民銀行正式發(fā)布了金融行業(yè)第一個生物識別技術標準《移動金融基于聲紋識別的安全應用技術規(guī)范(標準編號:JR/T0164-2018)》(下稱標準)。該標準由中國建設銀行、清華大學、北京得意音通技術有限責任公司(下稱得意音通)等34家主要起草單位,歷時3年完成。
清華大學信息技術研究院教授、得意音通創(chuàng)始人鄭方認為,該標準的頒布,標志著以聲紋識別為代表的生物特征識別技術首次得到金融監(jiān)管部門的認可,形簡意豐的語音信號可以為金融安全保駕護航,開啟無監(jiān)督情形下一種全新的“聲紋+”身份認證方式。
技術具有多重優(yōu)勢
什么是聲紋識別?簡單地說,就是通過聲音進行說話人身份識別的過程。鄭方解釋,語音信號之所以被形容為“形簡意豐”,是因為聲音包含有內(nèi)容、身份、情感、年齡及健康狀況等豐富的信息。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復雜的生理物理過程,理論上說,每個人說話時的短時頻譜特征、聲源特征、時序動態(tài)特征、韻律特征、語言學特征等都有差異,因此聲紋就像指紋一樣具有唯一性和獨特性。
2002年成立的得意音通是國內(nèi)最早從事聲紋識別技術研發(fā)的企業(yè)之一,當時這一領域的研究機構(gòu)不到5家。近年來,隨著移動金融市場的快速發(fā)展,其對安全認證技術的需求隨之加大,加之聲紋識別技術的不斷發(fā)展,市場上涌現(xiàn)了不少投資聲紋識別技術的企業(yè)。從目前應用來看,聲紋識別主要分為聲紋辨認和聲紋確認兩類,前者用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題,已應用于公安技偵和國防監(jiān)聽等領域;而后者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題,主要用于移動金融、社保生存認證、聲紋鎖控等領域。
隨著投資界和產(chǎn)業(yè)界對聲紋識別技術的投入加大,近年來該領域的專利申請也呈現(xiàn)快速增長態(tài)勢。2013年,得意音通提交了“基于動態(tài)密碼語音的身份確認系統(tǒng)及方法”的專利申請(專利號:ZL201310123555.0),并基于該專利開發(fā)了“聲密保”聲紋識別系統(tǒng)。需要認證時,該系統(tǒng)會隨機產(chǎn)生一組動態(tài)碼(如6位或8位數(shù)字)要求用戶朗讀,系統(tǒng)對用戶讀出的聲音進行語音識別并將識別的內(nèi)容與發(fā)出的動態(tài)碼數(shù)字進行比對,同時系統(tǒng)對用戶的發(fā)音進行聲紋比對,兩種認證手段都通過時才判斷通過。據(jù)介紹,通過核心專利和外圍專利布局,得意音通圍繞“聲密保”建立了內(nèi)外兩層專利墻。
中國建設銀行在手機銀行和ATM上采用的聲紋識別技術,就是得意音通的“聲密保”方案。相比其他生物特征識別,業(yè)內(nèi)人士認為,聲紋識別具有多重優(yōu)勢:金融領域的很多應用場景都是高頻使用,對用戶體驗方面的需求較高,如果驗證方式較為繁瑣,往往用戶難以接受,聲音信息一般不涉及用戶隱私問題,聲音采集通過一個麥克風或者電話、手機就可完成,用戶的接受度比較高;更重要的是,聲紋不易纂改,再加之聲音信號中含有語言信息、副語言信息和非語言信息,綜合利用聲音中蘊含的豐富信息可以具備較高的安全特性。
標準助力應用推廣
相比聲紋識別,起步更早的人臉識別、指紋識別等的應用更為廣泛,為什么移動金融領域會首先推出聲紋識別標準呢?
鄭方認為,這還是基于聲紋識別技術在保障金融安全方面具有的技術優(yōu)勢。在一次標準專家評審會上,來自中央網(wǎng)信辦、公安部、國家信息中心、國家信息安全研究中心、中國銀聯(lián)、中國金融認證中心、中國科學院、中國社會科學院、清華大學等單位的院士專家一致認為,“聲紋識別技術在個人隱私保護、身份認證強度等方面有一定的優(yōu)勢”。
據(jù)了解,標準全面規(guī)定了移動金融服務場景中基于聲紋識別的安全應用技術要求,適用于手機銀行等移動金融服務中基于聲紋識別的開發(fā)、檢測與應用。隨著國際上對移動支付安全性和個人隱私保護等問題的日益重視,標準也將安全性和個人隱私保護擺到了突出位置。標準明確了聲紋注冊、驗證、變更、注銷等環(huán)節(jié)的基本需求,提出了采樣、抗噪音、防攻擊、抗時變等技術要求,對聲紋信息采集、傳輸、存儲、處理、刪除等全生命周期進行了規(guī)范。
值得注意的是,聲紋識別應用也存在一些缺點,比如同一個人的聲音易受身體狀況、年齡、情緒等影響,具有時變性,同時也會存在有人通過錄音或者人工合成的聲音來假冒的情況,因此,抗時變和防攻擊成為提高聲紋識別技術的準確率和安全性的關鍵所在。在此次標準制定過程中,抗時變要求和防攻擊要求都被寫入了標準之中。鄭方表示,這些都是企業(yè)研發(fā)的重點和難點。得意音通很早就開展了抗時變研究,并通過錄音檢測等技術,推出了防假體攻擊的方案,但是隨著人工智能合成技術和語音轉(zhuǎn)換技術的發(fā)展,相關防攻擊技術的研發(fā)還需不斷跟進。
可喜的是,標準的制定為技術的推廣帶來了福音。鄭方介紹,以前在向金融機構(gòu)介紹聲紋識別技術時,對于這一新技術,很多人不了解,也不知道應達到什么標準。有了這個標準之后,用戶將有章可循。目前,除了建設銀行外,浦發(fā)銀行、民生銀行信用卡中心、貴陽銀行、蘭州銀行、西安銀行等均已在手機銀行中正式應用了聲紋識別技術,中國銀聯(lián)也已經(jīng)啟動在其數(shù)據(jù)平臺的身份認證模塊中集成聲紋識別功能。在互聯(lián)網(wǎng)金融行業(yè),中國互聯(lián)網(wǎng)金融協(xié)會在其統(tǒng)一身份核驗平臺集成了聲紋識別功能,螞蟻金服在支付寶產(chǎn)品、騰訊在微信平臺中也都開始應用聲紋識別作為身份認證的安全手段。