為提升自身產(chǎn)品服務(wù)能力,降低語音技術(shù)使用門檻,幫助更多開發(fā)者快速搭建語音產(chǎn)品,今年4月,標(biāo)貝科技面向企業(yè)和個人開發(fā)者推出智能語音平臺--標(biāo)貝開放平臺,提供語音合成及語音識別服務(wù)。近日,標(biāo)貝開放平臺再次完成功能升級,在提升整體視覺、交互體驗(yàn)的基礎(chǔ)上,新增聲音復(fù)刻、聲音轉(zhuǎn)換兩大能力,以更豐富的商業(yè)化交互能力和個性化功能,推動智能語音交互場景落地。
兩大語音能力上線構(gòu)建一站式平臺解決方案
據(jù)了解,標(biāo)貝開放平臺是為開發(fā)者提供一站式語音技術(shù)方案支持,使用者不需要深入理解語音交互原理,通過簡單易用的SDK和API的接入,在管理平臺創(chuàng)建應(yīng)用服務(wù),即可靈活調(diào)用各項(xiàng)技術(shù)服務(wù),進(jìn)行個性化語音交互功能開發(fā)。最終實(shí)現(xiàn)降低產(chǎn)品開發(fā)成本,縮短開發(fā)周期,快速落地市場的目的。
技術(shù)賦能方面,標(biāo)貝開放平臺的語音合成服務(wù)搭載了標(biāo)貝科技現(xiàn)有的全域發(fā)音人模型,提供超過100個精品特色發(fā)音人選擇,充分滿足智能客服、媒體新聞、有聲閱讀、車載互聯(lián)、泛娛樂等領(lǐng)域語音需求。語音識別能力可以支持一句話識別、長語音識別、錄音文件識別,支持中文和英文兩種語言,在安靜環(huán)境下通用領(lǐng)域中文普通話識別率達(dá)97%以上,英文識別率超過95%。
為進(jìn)一步豐富平臺技術(shù)能力,滿足更多合作伙伴的多樣化語音定制需求,標(biāo)貝此次新上了聲音復(fù)刻、聲音轉(zhuǎn)換產(chǎn)品服務(wù)。聲音復(fù)刻是基于標(biāo)貝語音合成拓展出的個性化應(yīng)用,用戶只需要花費(fèi)5分鐘錄制10個小片段,即可將自己的聲音復(fù)刻下來,最終的合成效果在聲音相似度、自然度等指標(biāo)上均達(dá)到行業(yè)領(lǐng)先水平;聲音轉(zhuǎn)換則是在保留原說話人的語氣、語調(diào)、停頓的基礎(chǔ)上,將原說話人的聲音完美轉(zhuǎn)換成另一個人的聲音進(jìn)行輸出。兩大語音能力均適用于故事創(chuàng)作、有聲小說、導(dǎo)航播報、創(chuàng)意配音等個性化定制場景。
值得注意的是,除了兩大語音能力上線,此次語音合成服務(wù)也進(jìn)一步優(yōu)化,面向用戶開放站內(nèi)試聽音色權(quán)限,用戶可以直接在線試聽多個發(fā)音人音色,然后根據(jù)需要選擇最終發(fā)音人。
深耕垂直領(lǐng)域賦能合作伙伴商業(yè)化提速
AI技術(shù)商業(yè)化應(yīng)用推動了智能語音市場的迅猛發(fā)展,搭載語音助手的智能終端數(shù)量得到進(jìn)一步增長。據(jù)統(tǒng)計,2020年我國智能語音助手市場規(guī)模達(dá)到241.1億元,同比上年增長50.0%。市場上的智能語音產(chǎn)品層出不窮,應(yīng)用場景也越來越多樣化。
得益于多年深耕語音交互領(lǐng)域的技術(shù)優(yōu)勢,標(biāo)貝科技智能語音交互方案已經(jīng)成功在金融、教育、電商、媒體娛樂等多個行業(yè)落地。面對如此豐富的產(chǎn)品需求,標(biāo)貝科技以一站式SaaS服務(wù)平臺的方式對外開放AI語音技術(shù)應(yīng)用,推動語音交互技術(shù)以更便捷、更普惠的形式賦能企業(yè)和個人開發(fā)者,加速語音產(chǎn)品的落地。
上線不到半年,標(biāo)貝開放平臺進(jìn)行了多個版本迭代優(yōu)化,用戶體驗(yàn)不斷提升。同時,通過前期的千元大禮包、萬元優(yōu)惠、精品音色贈送等多個扶持計劃,標(biāo)貝開放平臺已經(jīng)吸引了近萬名開發(fā)者注冊使用,在智能客服、有聲讀物、視頻軟件、線上金融等多個場景得到應(yīng)用。
未來,標(biāo)貝開放平臺將在領(lǐng)先的技術(shù)實(shí)力與豐富的產(chǎn)品化經(jīng)驗(yàn)雙輪驅(qū)動下,持續(xù)優(yōu)化服務(wù)能力,助力開發(fā)者以更低的成本,創(chuàng)造更大的商業(yè)化價值。