語(yǔ)音識(shí)別演示及開發(fā)電路板
2002/11/28
1、簡(jiǎn)介
RSC-300/364演示及開發(fā)用電路板是為美國(guó)Sensory公司的RSC-300/364語(yǔ)音識(shí)別芯片所專門設(shè)計(jì)的演示及開發(fā)用電路板,它可以用來演示Sensory的各種語(yǔ)音識(shí)別技術(shù),如SD(Speaker
Dependent,特定人語(yǔ)音識(shí)別),SI(Speaker Independen,非特定人語(yǔ)音識(shí)別),SV(Speaker Verification,身份識(shí)別),RP(Record
& Play,錄音回放)等等, 也可以用來做Sensory RSC-300/364語(yǔ)音識(shí)別芯片的簡(jiǎn)易開發(fā)裝置。
2、演示程序說明
Speaker Dependent(SD)
SD 演示的是Sensory的需要說話人訓(xùn)練語(yǔ)音識(shí)別模板的語(yǔ)音識(shí)別技術(shù),它的特點(diǎn)是用戶需要先對(duì)所要識(shí)別的語(yǔ)音命令進(jìn)行訓(xùn)練,然后才能進(jìn)行語(yǔ)音識(shí)別。
本程序設(shè)定用戶可以依次訓(xùn)練32個(gè)命令, 命令無語(yǔ)言限制。SD有用FLASH SST 29EE020 作數(shù)據(jù)存儲(chǔ)器和用SEEPROM 24LC32作數(shù)據(jù)存儲(chǔ)器兩個(gè)版本,前者可以對(duì)所訓(xùn)練的語(yǔ)音命令進(jìn)行錄音,在語(yǔ)音識(shí)別時(shí)用來回放確認(rèn),后者無此功能
Speaker Independent(SI)
與SD相比,SI的最大特點(diǎn)是無需用戶訓(xùn)練,它的識(shí)別依賴于Sensory所事先已經(jīng)采集制作好了的語(yǔ)音模板,因此它的局限性較大,不僅是在語(yǔ)言上,還是在詞匯量上,都受到一定限制,但用戶使用方便。
本程序設(shè)置了六個(gè)語(yǔ)音命令:record,play,erase,call,modify,skip,用FLASH SST 29EE020 作數(shù)據(jù)存儲(chǔ)器。
Speaker Verification(SV)
SV的最大特點(diǎn)就是能夠識(shí)別用戶的身份,與SD相比,SV與SD都需要訓(xùn)練,不同的是在SD方式下,某個(gè)人訓(xùn)練的命令,在識(shí)別時(shí)由別人來說,只要兩人說得差不多,識(shí)別即可通過,而在SV方式下,某個(gè)人訓(xùn)練的命令,在識(shí)別時(shí)由別人來說,即使兩人說得差不多,也很難通過識(shí)別,因?yàn)镾V能夠識(shí)別用戶的身份,因此SV常被用在安全系統(tǒng)方面。
Record and Playback(RP)
RP主要是演示Sensory的錄音回放技術(shù),同時(shí)它也應(yīng)用了Sensory 的SI語(yǔ)音識(shí)別技術(shù)來選擇進(jìn)行錄音還是回放操作。RP錄音時(shí)間的長(zhǎng)短依外接存儲(chǔ)器的大小而定,本程序用SST29EE020(2Mbits)作為數(shù)據(jù)存儲(chǔ)器,可以存儲(chǔ)大約16
秒的錄音。
深圳捷通公司供稿 CTI論壇編輯
相關(guān)鏈接: