每到歲末年初,總是職場人最忙碌的時(shí)候。各種名目繁多的年終總結(jié)會(huì)接踵而來,小組分享會(huì)、部門總結(jié)會(huì)、公司全員會(huì)......參會(huì)不可怕,可怕的是,這次輪到誰做會(huì)議紀(jì)要!要知道這些會(huì)議不僅持續(xù)時(shí)間長,參與人數(shù)多,會(huì)議錄音里很多話根本聽不清!
但機(jī)智如小貝,提前從產(chǎn)品運(yùn)營小姐姐那里弄來了自家語音識別SVIP權(quán)限,無論是線下會(huì)議、視頻會(huì)議,還是微信電話等,再長的錄音語音文件,一鍵轉(zhuǎn)換,大份大份的會(huì)議紀(jì)要新鮮出爐,簡直是強(qiáng)迫癥的福音有木有!
其實(shí)在人工智能飛速發(fā)展的今天,隨著數(shù)據(jù)量增加、計(jì)算能力增強(qiáng)以及深度學(xué)習(xí)理論技術(shù)的發(fā)展,語音識別準(zhǔn)確率不斷提升,應(yīng)用領(lǐng)域不斷拓寬。不止是會(huì)議錄音文件轉(zhuǎn)寫,語音識別早就成為很多設(shè)備的標(biāo)配。例如,我們可以對著手機(jī)說“siri,打個(gè)電話給老媽”,又或是“小度小度,放首歌”等等。
雖然目前語音識別對于通用場景的語音識別效果較好。但是在一些特定和垂直的應(yīng)用領(lǐng)域,對于一些專有名字、專業(yè)術(shù)語、特定的命名實(shí)體等識別的準(zhǔn)確率卻不盡人意。例如游戲中有很多專屬的說法,“冷靜,不要莽”,“不服來Sala(Solo)啊,父子局”、“咱們家沒有打野嗎”,這些特定的詞匯僅使用通用語音識別功能很難將其準(zhǔn)確識別。
面對這些語音識別難題,標(biāo)貝科技強(qiáng)大的算法團(tuán)隊(duì)自主研發(fā)ASR自學(xué)習(xí)引擎,推出“自學(xué)習(xí)個(gè)性化模型”和“熱詞”的功能,以提高專屬場景下語音識別準(zhǔn)確率。
01. 標(biāo)貝科技語音識別自學(xué)習(xí)工具是什么?
目前市場上供應(yīng)商大多都是提供通用領(lǐng)域的語音識別服務(wù),對應(yīng)的語言模型為基礎(chǔ)語言模型。如果用戶需要識別的語音內(nèi)容不在現(xiàn)有的模型范圍內(nèi),就會(huì)出現(xiàn)部分詞匯默認(rèn)識別效果不好。
通過標(biāo)貝科技“自學(xué)習(xí)工具”,在語音識別控制臺上傳專有領(lǐng)域或行業(yè)積累的文本數(shù)據(jù),通過對這些訓(xùn)練語料做模型訓(xùn)練,來生成自己的自學(xué)習(xí)個(gè)性化模型和熱詞模型,可以有效提高專有領(lǐng)域場景下的語音識別準(zhǔn)確率,尤其是對專有名詞和文本中的高頻詞匯,有較好的優(yōu)化效果。
熱詞:通過標(biāo)貝開放平臺-【熱詞】功能,將特有的人名、地名、公司名、領(lǐng)域?qū)S性~匯(醫(yī)療、建筑、金融、保險(xiǎn)等領(lǐng)域)上傳并保存發(fā)布,秒級生效。
個(gè)性化模型:通過標(biāo)貝開放平臺-【個(gè)性化模型】功能,將專有領(lǐng)域或行業(yè)積累的具有特點(diǎn)的文本數(shù)據(jù)上傳并保存發(fā)布,約5~20分鐘后生效。
個(gè)性化模型:通過標(biāo)貝開放平臺-【個(gè)性化模型】功能,將專有領(lǐng)域或行業(yè)積累的具有特點(diǎn)的文本數(shù)據(jù)上傳并保存發(fā)布,約5~20分鐘后生效。
02. 標(biāo)貝科技語音識別自學(xué)習(xí)工具有什么優(yōu)勢?
便捷接入
標(biāo)貝科技自學(xué)習(xí)工具控制臺可實(shí)現(xiàn)一鍵配置文本,通過識別接口上傳文本參數(shù)即可快速生成識別效果,無需更多投入。
快速生效
通過標(biāo)貝科技自學(xué)習(xí)工具,只需要上傳專有領(lǐng)域的文本信息,熱詞保存秒級生效,開箱即用,個(gè)性化模型最快5分鐘即可訓(xùn)練完成,快速響應(yīng)用戶業(yè)務(wù)。
全領(lǐng)域覆蓋
標(biāo)貝科技自學(xué)習(xí)工具面向全領(lǐng)域的自學(xué)習(xí)訓(xùn)練優(yōu)化,滲透各垂直行業(yè)的業(yè)務(wù)信息即添加即影響,真正打造行業(yè)內(nèi)可快速落地的語音識別技術(shù)。
03. 怎么使用標(biāo)貝科技語音識別自學(xué)習(xí)工具?
。1)前往標(biāo)貝開放平臺創(chuàng)建應(yīng)用,并進(jìn)入語音識別服務(wù)-自學(xué)習(xí)工具;
(2)進(jìn)入自學(xué)習(xí)工具-熱詞頁面,將專有領(lǐng)域和行業(yè)積累的文本數(shù)據(jù)整理保存為UTF-8編碼的 txt 文件,點(diǎn)擊“新增熱詞組”,進(jìn)行熱詞添加;
。3)獲取熱詞組id,識別調(diào)用,測試效果。 隨著語音技術(shù)與智能手機(jī)、平板電腦等電子產(chǎn)品芯片集成的深入發(fā)展,中國智能語音市場規(guī)模將繼續(xù)保持穩(wěn)步擴(kuò)張態(tài)勢。
語音識別作為人機(jī)交互的入口,應(yīng)用場景會(huì)更加廣泛。標(biāo)貝科技將持續(xù)加碼研發(fā)投入,推動(dòng)語音識別服務(wù)繼續(xù)優(yōu)化升級,創(chuàng)造更加智能的語音交互體驗(yàn)。
目前標(biāo)貝科技語音識別【自學(xué)習(xí)工具】已經(jīng)在官網(wǎng)和標(biāo)貝開放平臺上線,免費(fèi)對客戶開放。歡迎登錄標(biāo)貝開放平臺體驗(yàn)。
(1)標(biāo)貝科技官網(wǎng):https://www.data-baker.com
。2)標(biāo)貝開放平臺:https://ai.data-baker.com/#/index?source=gzh001