據(jù)了解,該獎(jiǎng)項(xiàng)是全球語音領(lǐng)域頂級會(huì)議interspeech2021的特別競賽,由牛津大學(xué)、麻省理工學(xué)院林肯實(shí)驗(yàn)室、斯坦福語音技術(shù)研究實(shí)驗(yàn)室、韓國Naver等全球頂尖高校和學(xué)術(shù)機(jī)構(gòu)聯(lián)合舉辦。此次競賽高手云集,包括美國約翰霍普金斯大學(xué)、微軟研究院、思必馳、字節(jié)跳動(dòng)、國音智能、搜狗、美團(tuán)等國內(nèi)外一流高校、研究機(jī)構(gòu)及企業(yè)。
聲紋識別是指通過人工智能技術(shù)識別兩段語音是否為同一人。目前聲紋識別廣泛應(yīng)用在金融質(zhì)檢、安防、刑偵等領(lǐng)域,關(guān)系到用戶隱私和安全問題。在應(yīng)用的過程中,聲紋識別跨域問題、復(fù)雜音頻環(huán)境問題為各行各業(yè)提出了嚴(yán)峻的挑戰(zhàn)。如何在應(yīng)用中,有效降低跨域?qū)β暭y識別的干擾、提升聲紋識別在復(fù)雜音頻環(huán)境下的識別準(zhǔn)確性能,成為了整個(gè)行業(yè)共同關(guān)心的課題。
本次競賽中,中關(guān)村科金使用基于深度學(xué)習(xí)的聲紋識別技術(shù),參加Trick1和Trick2兩個(gè)賽道的比賽。兩賽道均為文本無關(guān)聲紋識別任務(wù)。其中,Trick1采用指定的Voxceleb2dev作為訓(xùn)練集,Track2則可使用測試集之外任何開放數(shù)據(jù)作為訓(xùn)練集。比賽最大挑戰(zhàn)是需要進(jìn)行跨語言及復(fù)雜環(huán)境下的聲紋識別。中關(guān)村科金通過探索新的數(shù)據(jù)增廣方案,改進(jìn)聲紋識別算法,優(yōu)化訓(xùn)練損失函數(shù),并融合多個(gè)SOTA(行業(yè)領(lǐng)先)模型,顯著提升了聲紋識別在跨語言和復(fù)雜環(huán)境的魯棒性以及識別準(zhǔn)確率,從而獲得兩個(gè)賽道的亞軍。
作為國內(nèi)領(lǐng)先的人工智能科技公司,中關(guān)村科金長期在聲紋識別技術(shù)領(lǐng)域進(jìn)行研發(fā)投入,基于海量預(yù)訓(xùn)練模型以及AI算法助力,在聲紋識別公開數(shù)據(jù)評測中,識別準(zhǔn)確率超過99.7%,廣泛應(yīng)用于客服、催收、投訴等場景,為保護(hù)用戶隱私和數(shù)據(jù)安全、保障數(shù)字經(jīng)濟(jì)健康發(fā)展提供先進(jìn)的科技力量支撐。
依托強(qiáng)大的AI算法能力和聲紋識別技術(shù),中關(guān)村科金助力銀行、保險(xiǎn)、證券、信托、教育、醫(yī)療、智能制造等行業(yè)客戶實(shí)現(xiàn)安全、高效的數(shù)字化升級。目前,已為數(shù)百家知名行業(yè)機(jī)構(gòu)、企業(yè)合作提供智能化轉(zhuǎn)型解決方案,在服務(wù)企業(yè)數(shù)字化轉(zhuǎn)型、實(shí)現(xiàn)低碳綠色發(fā)展方面處于行業(yè)領(lǐng)先地位。