近年來,人工智能行業(yè)快速發(fā)展,智能語音市場(chǎng)也異;馃。無論是BAT、網(wǎng)易等互聯(lián)網(wǎng)大廠,還是以訊飛為首的人工智能大企業(yè),亦或者近些年在AI賽道上異軍突起的中小企業(yè),都在用開放平臺(tái)的戰(zhàn)略方式,試圖籠絡(luò)各開發(fā)者,建立屬于自己的AI產(chǎn)業(yè)生態(tài)圈。
據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),國內(nèi)智能語音相關(guān)開放平臺(tái)已有50多家,其中不乏垂直領(lǐng)域的技術(shù)型小公司。標(biāo)貝科技作為一家深耕智能語音領(lǐng)域中小企業(yè),在2021年4月6日,也正式宣布加入智能語音開放平臺(tái)“大軍”,進(jìn)一步推動(dòng)人工智能語音場(chǎng)景落地,全效助力開發(fā)者構(gòu)建自身AI語音生態(tài)。
據(jù)了解,標(biāo)貝開放平臺(tái)匯集了標(biāo)貝科技五年以來在智能語音領(lǐng)域取得的相關(guān)技術(shù)成果,以豐富的商業(yè)化AI語音能力、個(gè)性化效果,為開發(fā)者提供業(yè)界領(lǐng)先的人機(jī)對(duì)話技術(shù)調(diào)用,能快速解決開發(fā)者在語音交互相關(guān)技術(shù)開發(fā)難點(diǎn)、痛點(diǎn)問題,提高開發(fā)者智能化產(chǎn)品落地速度,大大節(jié)省其開放成本和時(shí)間。
兩大服務(wù),提升交互體驗(yàn)
目前,標(biāo)貝開放平臺(tái)提供的智能語音服務(wù)主要包括語音合成(TTS)與語音識(shí)別(ASR),開發(fā)者可以在平臺(tái)操作界面創(chuàng)建多個(gè)智能語音應(yīng)用,系統(tǒng)自動(dòng)分配了語音識(shí)別和語音合成的全部服務(wù)到該應(yīng)用。語音識(shí)別包括一句話識(shí)別、長(zhǎng)語音識(shí)別、錄音文件識(shí)別,語音合成可選擇在線合成、離線合成、長(zhǎng)文本合成三種,并可根據(jù)客戶自身需求進(jìn)行用量、音色、并發(fā)等接入試用。特別值得一提的是,離線引擎的開放,使標(biāo)貝對(duì)智能電視等嵌入式設(shè)備廠商的服務(wù)更為全面。
在語音合成方面,標(biāo)貝采用基于transfomer機(jī)制的高音質(zhì)合成,綜合利用聲學(xué)和語言學(xué)參數(shù),多音字的合成準(zhǔn)確率更高,韻律停頓更加自然,整體的語音聽感體驗(yàn)更接近場(chǎng)景化的真人表達(dá)。合成的接口全面支持多音字標(biāo)注,手動(dòng)校對(duì)發(fā)音,語速停頓調(diào)節(jié)等通用功能。語音識(shí)別方面,基于先進(jìn)的端到端的深度學(xué)習(xí)算法,聚焦中文普通話近場(chǎng)識(shí)別,在安靜環(huán)境下近字準(zhǔn)確率超過97%。除了支持16k的設(shè)備端交互,還支持8k的客服場(chǎng)景電話語音識(shí)別。并支持通過熱詞更新方式,進(jìn)行領(lǐng)域內(nèi)特定詞識(shí)別效果的快速優(yōu)化。
全音庫開放,支持多應(yīng)用場(chǎng)景
標(biāo)貝開放平臺(tái)發(fā)布后將開放近60個(gè)音色,涵蓋老人、兒童、青年男女音。每一種音色均使用海量音頻數(shù)據(jù)訓(xùn)練而成,聲音真實(shí)飽滿、富有表現(xiàn)力,MOS評(píng)分達(dá)到業(yè)內(nèi)領(lǐng)先水準(zhǔn)。同時(shí),平臺(tái)支持中文、英文、中英混合、方言和多語種發(fā)音,可滿足教育、新聞、有聲閱讀、泛娛樂等領(lǐng)域語音定制需求,并支持多語言、多情感同時(shí)使用。
簡(jiǎn)單兼容,賦能開發(fā)者
與目前主流智能語音開放平臺(tái)相同,標(biāo)貝開放平臺(tái)提供WEBAPI調(diào)用,Android、iOS等平臺(tái)SDK接入方式,平臺(tái)基于B/S架構(gòu)的管理平臺(tái),使開發(fā)者可根據(jù)需求同時(shí)創(chuàng)建多個(gè)應(yīng)用,支持千萬級(jí)并發(fā),每個(gè)應(yīng)用有獨(dú)立的可視化數(shù)據(jù)統(tǒng)計(jì),幫助開發(fā)者實(shí)時(shí)、精確地監(jiān)測(cè)應(yīng)用服務(wù)調(diào)用情況。
與此同時(shí),標(biāo)貝開放平臺(tái)設(shè)有應(yīng)用預(yù)警功能,通過預(yù)警管理,開發(fā)者可對(duì)調(diào)用頻次、剩余用量、并發(fā)量和有效期限等使用狀態(tài)進(jìn)行設(shè)置,實(shí)現(xiàn)精細(xì)化管理。來自標(biāo)貝科技的數(shù)據(jù)顯示,該平臺(tái)語音合成和語音識(shí)別的速度均達(dá)到行業(yè)領(lǐng)先水平,服務(wù)可靠性高達(dá)99.9%。
除此之外,標(biāo)貝開放平臺(tái)非常注重交互感,無論是UI界面還是功能體驗(yàn),都比較人性化,是目前最簡(jiǎn)單且最兼容的智能語音交互平臺(tái)之一,致力于讓各位開發(fā)者,使用方便、效率翻倍。
對(duì)于智能語音服務(wù)平臺(tái)的上線,標(biāo)貝開放平臺(tái)相關(guān)負(fù)責(zé)人表示,“憑借在基礎(chǔ)業(yè)務(wù)AI數(shù)據(jù)服務(wù)的長(zhǎng)期積累,以及不斷創(chuàng)新的技術(shù)研發(fā)投入,標(biāo)貝科技智能語音交互技術(shù)已達(dá)到業(yè)內(nèi)領(lǐng)先水平,希望通過標(biāo)貝語音服務(wù)開放平臺(tái)賦能各行業(yè),共同開創(chuàng)更多語音交互場(chǎng)景,實(shí)現(xiàn)開放共贏。”據(jù)悉,標(biāo)貝開放平臺(tái)新注冊(cè)的會(huì)員,可獲得一定量的無限期免費(fèi)服務(wù)及優(yōu)惠。