極限元是國內(nèi)領(lǐng)先的人工智能技術(shù)公司,以“智能交互”為核心,擁有自主產(chǎn)權(quán)的智能語音、人機對話、機器視覺、大數(shù)據(jù)分析等AI技術(shù),推出了云端、桌面、嵌入式等跨平臺AI技術(shù)解決方案,產(chǎn)品和服務(wù)廣泛應(yīng)用于教育、安全、交通、智能硬件等多個領(lǐng)域。
公司致力于發(fā)展智能交互技術(shù),與中國科學院自動化研究所掛牌成立了“智能交互聯(lián)合實驗室”服務(wù)于騰訊、奇虎360、搜狗等公司以及網(wǎng)信辦、公安部門等國家相關(guān)安全機構(gòu)。
核心技術(shù)優(yōu)勢:
(1)前端信號處理
通過前端處理模塊可以有效抑制噪聲、混響、回聲的干擾,增強語音的可懂度,提高真實環(huán)境下語音識別的魯棒性;在智能家居、智能車載等領(lǐng)域有廣泛應(yīng)用。
。2)聲紋識別
聲音就是密碼,自動識別說話人身份,實現(xiàn)快速精準的身份認證。
(3)情感識別
能夠精確探測用戶的面部表情、語音語調(diào)、語言情緒等特征,識別喜、怒、哀、驚、懼情緒,并在此基礎(chǔ)上,制定擬人化的情感交互模型和對話策略。(如使用于呼叫中心質(zhì)檢等場景)
。4)語音識別
將語音識別成文字,讓機器具有人類一樣的聽力。識別準確率達97%以上,支持方言口音識別、智能降噪,識別實時率<0.15.
。5)語音合成
將文字合成為語音,讓機器說話,媲美真人發(fā)聲,專業(yè)MOS分可達4.4,多方言、多語種、多音色的音庫選擇,支持個性化語音定制。
。6)人機對話
實現(xiàn)多類型人機對話管理,結(jié)合上下文的多輪對話,面向口語的語義理解,基于語音的魯棒性問答。
解決方案
。1)語音質(zhì)檢
針對現(xiàn)行業(yè)內(nèi)運用的質(zhì)檢方式的諸多弊端,“極限元”采用了基于語音識別、語音關(guān)鍵詞檢索技術(shù)、音頻對比技術(shù)、情感識別技術(shù)的錄音質(zhì)檢方案。本方法有效的減少語音識別準確率不高帶來的錄音質(zhì)檢誤差,有效提升了錄音質(zhì)檢效率,全面覆蓋人工客服與用戶的每一次對話,基于度神經(jīng)網(wǎng)絡(luò)算法,智能分析人工客服對話內(nèi)容,節(jié)約大量的人工成本,同時根據(jù)各客服系統(tǒng)的工作重點和特點,進行個性化設(shè)定與定制。
。2)智能客服
基于語音識別、語音合成、語義理解等技術(shù),可以實現(xiàn)呼叫中心撥號音檢測、智能外呼、智能問答、語音導(dǎo)航、智能營銷等一系列的功能。應(yīng)用場景:客戶回訪、產(chǎn)品推薦、債務(wù)提醒、信息資訊、業(yè)務(wù)辦理、電話訂購等,可應(yīng)用領(lǐng)域包括:金融、保險、電商、教育、企業(yè)服務(wù)、生活服務(wù)。
。3)語音轉(zhuǎn)寫
錄音轉(zhuǎn)寫文稿、快速定位回聽、視頻字幕制作,可實現(xiàn)長句子連續(xù)語音識別,音頻文本對齊時間軸,普通話識別準確率高達96%,幫助各行各業(yè)的用戶實現(xiàn)高效記錄和信息輸入。應(yīng)用場景包括演講或授課、記者訪談、會議辦公、影視娛樂視頻字幕等。
(4)智能交互
多通道語音前端信號處理方案,嵌入式遠講語音喚醒,離線模式下語音/指令詞識別,云-端一體化語音交互方案,可應(yīng)用領(lǐng)域:車載導(dǎo)航、智能音箱、智能家居、機器人等。
企業(yè)網(wǎng)址:www.jixianyuan.com