首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>得意音通

"得意關(guān)鍵詞檢出器"API

2003/11/24

  "得意關(guān)鍵詞檢出器"技術(shù)是一種自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)。它應(yīng)用于一些具有特定要求的場(chǎng)合, 由于速度、高檢出率或其他特定的要求,人們并不需要系統(tǒng)識(shí)別出整個(gè)句子,更不需要理解整個(gè)句子,而只關(guān)注那些包含特定詞(稱(chēng)為"關(guān)鍵詞")的句子。比如,對(duì)一些特殊人名、地名和詞語(yǔ)進(jìn)行電話(huà)監(jiān)聽(tīng),又比如通過(guò)人名進(jìn)行自動(dòng)分機(jī)接駁服務(wù),等等。

  根據(jù)一些應(yīng)用的特殊需要,關(guān)鍵詞檢出器有一些有別于其他自動(dòng)語(yǔ)音識(shí)別的地方。包括:
 。1) 有的應(yīng)用需要限定或假設(shè)一個(gè)句子只能含有一個(gè)關(guān)鍵詞(如自動(dòng)分機(jī)接駁),而有的應(yīng)用則不希望有這樣的限定(如電話(huà)監(jiān)聽(tīng))。
 。2) 有的應(yīng)用希望"寧錯(cuò)勿漏"( 如電話(huà)監(jiān)聽(tīng)),而有的應(yīng)用則希望"寧漏勿錯(cuò)"(如自動(dòng)分機(jī)接駁)。關(guān)鍵詞集內(nèi)的詞沒(méi)有被檢出,稱(chēng)為"漏識(shí)",而關(guān)鍵詞集外的詞識(shí)別成一個(gè)集內(nèi)詞,稱(chēng)為"誤警"或"虛報(bào)"。 對(duì)一個(gè)特定的關(guān)鍵詞檢出器,漏識(shí)率和誤警率兩者不可能同時(shí)達(dá)到其最低點(diǎn)。因而相對(duì)于其他語(yǔ)音識(shí)別器,關(guān)鍵詞檢出器需要在漏識(shí)率和誤警率之間找到需要的平衡點(diǎn),稱(chēng)為"操作點(diǎn)"。

  "得意關(guān)鍵詞檢出器"的應(yīng)用編程接口(API)有如下的特征:

 。1) 非特定人。得意關(guān)鍵詞檢出器對(duì)不同人的說(shuō)話(huà)有一定的適應(yīng)能力,不管是誰(shuí),只要說(shuō)的是標(biāo)準(zhǔn)普通話(huà)即可,帶一些輕微的口音沒(méi)有任何影響。
 。2) 詞表可隨意定制。開(kāi)發(fā)者可以利用API接口,方便地提供詞表定制工具,使得使用者無(wú)需具備專(zhuān)業(yè)知識(shí)就可以方便地定義自己的詞表;對(duì)新定義的詞表,系統(tǒng)無(wú)需重新訓(xùn)練,立刻可以使用。
  (3) 句中關(guān)鍵詞個(gè)數(shù)可以設(shè)定。開(kāi)發(fā)者可以根據(jù)具體的應(yīng)用情況,方便地指定一句話(huà)中僅含一個(gè)關(guān)鍵詞(只報(bào)出最可能的關(guān)鍵詞),還是允許多個(gè)關(guān)鍵詞(檢出多少關(guān)鍵詞就報(bào)多少)。
  (4) 良好的拒識(shí)性能。利用性能良好的拒識(shí)功能,檢出器將根據(jù)具體情況報(bào)出所檢出關(guān)鍵詞,不會(huì)因使用者設(shè)定的句子中可以含有的關(guān)鍵詞數(shù)目而強(qiáng)行虛報(bào)。
 。5) 得意關(guān)鍵詞檢出器具有很低的漏識(shí)率和很低的誤警率。
 。6) 操作點(diǎn)易于調(diào)整。開(kāi)發(fā)者可以根據(jù)具體應(yīng)用需要,方便地設(shè)定操作點(diǎn),以在漏識(shí)率和誤警率之間達(dá)到很好的平衡。


 。7) 得意關(guān)鍵詞檢出器利用很好的通道歸一技術(shù)可以在各種不同的信道(如固定電話(huà)或手機(jī))中使用,而不影響其性能。
  (8) 得意關(guān)鍵詞檢出器聲學(xué)模型所需存儲(chǔ)<40MB。
  應(yīng)用舉例:"得意智能語(yǔ)音總機(jī)"產(chǎn)品

  得意智能語(yǔ)音總機(jī)是利用得意關(guān)鍵詞檢出器的API開(kāi)發(fā)出來(lái)的一個(gè)具體應(yīng)用。具體技術(shù)設(shè)定為:
 。1) 詞表為人名,并附帶分機(jī)號(hào)碼信息。
 。2) 每句話(huà)中最多含一個(gè)關(guān)鍵詞。
 。3) 操作點(diǎn)靠近低誤警率一端。

  一個(gè)實(shí)際應(yīng)用范例如下。
  下表是由某公司人事部門(mén)的管理人員輸入的用戶(hù)詞表:


  修改完畢后,得意智能語(yǔ)音總機(jī)的內(nèi)部詞表編譯器將自動(dòng)把上述詞表轉(zhuǎn)換成內(nèi)部詞表。轉(zhuǎn)換過(guò)程主要用拼音標(biāo)出每個(gè)姓名的發(fā)音,同時(shí)對(duì)一人多名和多人同名進(jìn)行檢查。當(dāng)有多人同名并且沒(méi)有"確認(rèn)信息"或確認(rèn)信息不能分出這些人時(shí),內(nèi)部詞表編譯器將提示管理人員輸入可以互相區(qū)分這些人的確認(rèn)信息。在發(fā)生重名時(shí),確認(rèn)信息用以與用戶(hù)進(jìn)行對(duì)話(huà)以便確認(rèn)要找的人。
  對(duì)話(huà)示例:
  a. 系統(tǒng):請(qǐng)于嗶聲后說(shuō)出要找的人的姓名,按#跨過(guò)該提示,按0進(jìn)入人工服務(wù)…嗶…
  b. 用戶(hù):你好,我找張總。
  c. 系統(tǒng):轉(zhuǎn)接張三,請(qǐng)稍后… [轉(zhuǎn)接1001分機(jī)]。
  a. 系統(tǒng):請(qǐng)于…
  b. 用戶(hù):[按#]
  c. 系統(tǒng):?jiǎn)?br>   d. 用戶(hù):王…王五在嗎?
  e. 系統(tǒng):轉(zhuǎn)接王五,請(qǐng)稍后…[轉(zhuǎn)接1003分機(jī)]。
  a. 系統(tǒng):請(qǐng)于…
  b. 用戶(hù):[按#]
  c. 系統(tǒng):?jiǎn)?br>   d. 用戶(hù):麻煩你給我轉(zhuǎn)接李四先生。
  e. 系統(tǒng):請(qǐng)問(wèn)你找市場(chǎng)部的還是財(cái)務(wù)部的?
  f. 用戶(hù):市場(chǎng)部的李四!咀ⅲ河捎谙到y(tǒng)已經(jīng)自動(dòng)轉(zhuǎn)換為用戶(hù)確認(rèn)詞表,因此不會(huì)檢出"李四"。】
  g. 系統(tǒng):轉(zhuǎn)接市場(chǎng)部李四,請(qǐng)稍后…[轉(zhuǎn)接1002]。
  a. 系統(tǒng):請(qǐng)于…
  b. 用戶(hù):[按#]
  c. 系統(tǒng):?jiǎn)?br>   d. 用戶(hù):請(qǐng)接張山。
  e. 系統(tǒng):如果您是找張三,按1;按#可重說(shuō);按0可轉(zhuǎn)人工服務(wù)
  f. 用戶(hù):[按1]。
  g. 系統(tǒng):轉(zhuǎn)接張三,請(qǐng)稍后…[轉(zhuǎn)接1001]。

  應(yīng)用舉例:"得意導(dǎo)航員"產(chǎn)品

  利用得意關(guān)鍵詞API,可以設(shè)計(jì)一個(gè)用聲音對(duì)Windows操作系統(tǒng)進(jìn)行"發(fā)號(hào)施令"的"得意導(dǎo)航員"產(chǎn)品。在這里,用戶(hù)只需口呼命令就可以直接控制Windows,如口呼"我的電腦"、"打開(kāi)字處理(即Word)"等可以打開(kāi)相應(yīng)的資源或應(yīng)用,而且應(yīng)用程序運(yùn)行后,導(dǎo)航系統(tǒng)可以自動(dòng)提取那些當(dāng)前活動(dòng)的菜單項(xiàng),甚至是活動(dòng)菜單的隱藏菜單子項(xiàng),供用戶(hù)口呼使用。這個(gè)過(guò)程是自動(dòng)的,是對(duì)用戶(hù)透明的。
  與利用得意命令SDK開(kāi)發(fā)的語(yǔ)音命令導(dǎo)航員不同,得意導(dǎo)航員允許用戶(hù)的命令更靈活,可以?shī)A雜一些其他的字詞。

得意音通公司供稿 CTI論壇編輯



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺(tái)項(xiàng)目中標(biāo) 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測(cè)檢驗(yàn)中心對(duì)《海量語(yǔ)音文件的目標(biāo)說(shuō)話(huà)人篩選系統(tǒng)》進(jìn)行測(cè)試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開(kāi)展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開(kāi)源for Windows Mobile5.0 2009-01-23
得意聲紋識(shí)別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類(lèi)信息:     技術(shù)_語(yǔ)音識(shí)別_解決方案