這把“火”究竟有多旺,我們可以從三個方面直觀地感受出來:其一,就是眾多互聯(lián)網(wǎng)巨頭在語音處理領域的積極投入;其二,是2017年之后以亞馬遜Echo為代表的智能音箱單品的火爆;其三,是類似Siri的語音助手功能在智能手機中滲透率越來越高。種種跡象都在告訴我們,智能語音相關的生態(tài)鏈正在逐漸成熟,基于智能語音的相關應用遲早有一天會成為眾多智能產(chǎn)品的標配,比如說在智能家居等應用中的語音控制功能。
當然,想做率先“吃螃蟹”的人,也就必然會面臨著一系列需要跨越的“坑”。具體到智能語音控制領域,這樣的“坑”主要來自三個方面:
首先是成本。因為成本是任何一種技術大規(guī)模普及的重要前提,特別是當我們考慮到要將語音控制功能集成到不同的嵌入式設備中去,真正做到讓語音“無處不在”的時候,成本的壓力會更為突出。
其次是缺乏整體解決方案。畢竟,對于新技術來說,完整成熟的參考設計方案會比較“罕見”。如果有,對于開發(fā)者來說將是真福利。
再有就是如何順利接入語音處理引擎。眾所周知,智能語音控制應用背后都會與一個云端的語音處理引擎相連,如亞馬遜的Alexa、科大訊飛開發(fā)語音平臺等,這其中有不少繁復的測試認證過程。
上面這三個制約因素也決定了語音控制方案開發(fā)之旅并不是一場“說走就走”的旅行,在此之前開發(fā)者免不了要做大量準備工作。
不過現(xiàn)在,情況不一樣了,因為下面這個由恩智浦開發(fā)的方案(見圖1),打破了以往的制約。在這個面積為30mmx40mm超小型電路板中,幾乎覆蓋了嵌入式語音識別所有的性能和功能需求,讓困惑開發(fā)者的難題迎刃而解。
圖1.基于恩智浦i.MX RT跨界處理器的語音控制方案(圖片來源:NXP)
基于MCU的設計
這個方案最鮮明的一個特點就是,其主控芯片采用的不是微處理器,而是一顆‘MCU’——恩智浦的i.MX RT跨界處理器。之所以稱為“跨界”,是因為一方面i.MX RT采用了主頻高達600MHz的Arm Cortex-M7內(nèi)核,性能甚至比普通的Cortex-A5都高一倍;而另一方面,其在成本和功耗方面又能夠與MCU看齊,而且繼承了MCU的開發(fā)工具鏈,使得以前熟悉MCU的開發(fā)者都能夠很快上手。正是因為這種“魚和熊掌”兼得的特性,i.MX RT一經(jīng)推出就受到了開發(fā)者的青睞。
此番將i.MX RT引入到語音控制領域,根據(jù)恩智浦的估算,與以往基于微處理器的解決方案相比可以將總系統(tǒng)成本減少一半以上。這也使得這個基于MCU的語音控制方案極具競爭力。
圖2.i.MX RT106A跨界處理器系統(tǒng)框圖(圖片來源:NXP)
整體解決方案
該方案中使用的跨界處理器的型號是i.MX RT106A,它是通用的i.MX RT1060產(chǎn)品中的一個特殊型號,專門針對基于云端的嵌入式語音應用進行了優(yōu)化,特別是可授權使用恩智浦完整的語音助手軟件解決方案,包括低延遲,遠場“喚醒字”檢測、噪聲抑制、回聲消除和語音打斷功能等一系列特性。這顯然會令開發(fā)事半功倍,也讓整個系統(tǒng)的BOM更為簡化。
除了核心的主控芯片,整個基于i.MX RT的語音控制解決方案中還包括其他一些關鍵元器件,如TFA9894D智能音頻放大器和可選的A71CH安全元件,以及一個完整的參考BOM,可為客戶提供了一個從硬件到軟件的完整的交鑰匙解決方案。
圖3.i.MX RT語音控制方案硬件框圖(圖片來源:NXP)
與Alexa連接
特別值得一提的是,該方案還可無縫連接Amazon Alexa語音服務(AVS)平臺,與AVS認證軟件、安全性和入門使用完全整合,大幅減少了植入Alexa所需的工程投資,縮短語音控制產(chǎn)品的上市時間。為此,恩智浦還在美國設置了實驗室,專門為內(nèi)置Alexa的產(chǎn)品提供測試服務,幫助客戶通過亞馬遜的最終評估。
實際上這種增值服務模式,也是亞馬遜等語音處理平臺提供商所樂見的,因為這有利于其平臺形成一個更完善的應用生態(tài)系統(tǒng),是一個雙贏的結果。所以我們也可以想見未來類似的服務會被復制到與其他智能語音處理平臺的合作中。
圖4.i.MX RT語音控制方案與AVS整合框圖(圖片來源:安富利)
總之,這個基于MCU的語音控制解決方案為開發(fā)者提供了一種“即插即用”式的開發(fā)體驗,無論是從硬件、軟件,還是與語音處理平臺功能的整合,都能快速搞掂。如果你想在自己的嵌入式產(chǎn)品中加入智能語音處理功能,現(xiàn)在可以“說走咱就走”了。