首頁 > 技術(shù) > 技術(shù)文摘 > 基于STM32的嵌入式語音識別模塊設計和實現(xiàn)

基于STM32的嵌入式語音識別模塊設計和實現(xiàn)

2011-03-24 00:00:00 作者：來源：評論：0 點擊：

　　摘要：介紹了一種以ARM為核心的嵌入式語音識別模塊的設計與實現(xiàn)。模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心，通過以LD3320芯片為核心的硬件單元實現(xiàn)語音識別功能，采用嵌入式操作系統(tǒng)μC/OS-II來實現(xiàn)統(tǒng)一的任務調(diào)度和外圍設備管理。經(jīng)過大量的實驗數(shù)據(jù)驗證，本文設計的語音識別模塊具有高實時性、高識別率、高穩(wěn)定性的優(yōu)點。
　　關(guān)鍵詞：ARM；語音識別；對話管理；LD3320；μC/OS-II
　　引言
　　服務機器人以服務為目的，因此人們需要一種更方便、更自然、更加人性化的方式與機器人交互，而不再滿足于復雜的鍵盤和按鈕操作�；诼犛X的人機交互是該領域的一個重要發(fā)展方向。目前主流的語音識別技術(shù)是基于統(tǒng)計模式。然而，由于統(tǒng)計模型訓練算法復雜，運算量大，一般由工控機、PC機或筆記本來完成，這無疑限制了它的運用。嵌入式語音交互已成為目前研究的熱門課題。
　　嵌入式語音識別系統(tǒng)和PC機的語音識別系統(tǒng)相比，雖然其運算速度和內(nèi)存容量有一定限制，但它具有體積小、功耗低、可靠性高、投入小、安裝靈活等優(yōu)點，特別適用于智能家居、機器人及消費電子等領域。
　　1 模塊整體方案及架構(gòu)
　　語音識別的基本原理如圖1所示。語音識別包括兩個階段：訓練和識別。不管是訓練還是識別，都必須對輸入語音預處理和特征提取。訓練階段所做的具體工作是通過用戶輸入若干次訓練語音，經(jīng)過預處理和特征提取后得到特征矢量參數(shù)，最后通過特征建模達到建立訓練語音的參考模型庫的目的。而識別階段所做的主要工作是將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進行相似性度量比較，然后把相似性最高的輸入特征矢量作為識別結(jié)果輸出。這樣，最終就達到了語音識別的目的。