STT賦能的語音控制應(yīng)用程序于2017年啟動(dòng),為視頻生成字幕,并在其他功能中處理每個(gè)月超過十億分鐘的語音。
Google Cloud現(xiàn)在發(fā)布了一個(gè)新的神經(jīng)序列到序列模型,用于語音識(shí)別,該模型在不同的用例,噪聲環(huán)境,聲學(xué)條件和詞匯量方面進(jìn)行了測試。
新模型基礎(chǔ)架構(gòu)基于尖端的機(jī)器學(xué)習(xí)技術(shù),該技術(shù)使用戶可以更有效地利用語音培訓(xùn)數(shù)據(jù)。
Google Cloud Speech Team杰出科學(xué)家Fran?oiseBeaufays在博客文章中說:
“使用STTAPI時(shí),企業(yè)和開發(fā)人員都會(huì)立即看到盒子外質(zhì)量的改進(jìn),盡管您始終可以調(diào)整模型以提高性能,但可以在無需任何初始調(diào)整下即可感受到這種新體系結(jié)構(gòu)的好處。”
“隨著模型對(duì)各種聲音,噪聲環(huán)境和聲學(xué)條件的擴(kuò)展支持,您可以在更多的上下文中產(chǎn)生更準(zhǔn)確的輸出,從而使您更快,輕松,有效地將語音技術(shù)嵌入在應(yīng)用程序中。”
隨著模型的擴(kuò)展支持,用戶現(xiàn)在可以更自然地對(duì)其智能家居設(shè)備使用更長的句子說話。
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載