首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

電話語音識別系統(tǒng)流程設計

李宏 2003/11/20

  電話語音識別系統(tǒng)為用戶提供了一個人性化的界面,人們通過電話-這個最普及的通訊工具,就可以與計算機系統(tǒng)進行交談,從而能夠查詢信息、發(fā)出控制命令和進行電子商務交易。

1 語音識別系統(tǒng)的特點

  語音識別系統(tǒng)與傳統(tǒng)的IVR最根本的區(qū)別是:語音識別系統(tǒng)擺脫了電話12個按鍵的束縛,既簡捷方便,又可節(jié)省通話時間。

  同時,由于不需記憶編碼,語音服務系統(tǒng)可以通過一個特服號提供全部服務,即建立語音門戶。不象聲訊臺,一個節(jié)目就要一個號碼,既占用了寶貴的號碼資源,也很難讓用戶記住。

  語音識別系統(tǒng)可以提供強大的導航能力,語音識別系統(tǒng)的用戶不須在聽完冗長的提示語后逐層進入,而是可以直接進入最底層服務,且各欄目之間可以任意進行跳轉。尤其是對于老客戶,直接進入所需的服務將極大地提高效率并降低通話費用。對于新用戶,系統(tǒng)的語音導航會逐步引導用戶達到目標。

  一個用戶滿意的語音識別系統(tǒng),取決于這個系統(tǒng)是否擁有優(yōu)良的識別引擎、穩(wěn)定高效的應用程序、與電信交換網(wǎng)絡的完美集成、和人性化的流程控制。流程控制是直接面向用戶的界面,它是能否滿足用戶需求的關鍵。就像一個網(wǎng)站,讓用戶迷茫的主頁肯定影響訪問量。

  合理和友好的流程,才能充分發(fā)揮語音識別的優(yōu)勢,為用戶提供人性化和個性化的服務。反之,無論技術上多么出色,系統(tǒng)集成如何完美,只要沒有向用戶提供友好的界面,語音識別系統(tǒng)只會失敗。

2 流程設計原則

  語音識別技術的優(yōu)點和缺點都很突出技術,在應用中必須揚長避短。
  優(yōu)點:無論何時何地都能使用,操作簡便,適用于各層次的用戶……
  缺點:識別率不可能達到100%,對沒有經(jīng)驗的用戶識別率更低……
  即使有更先進的技術,上述缺點也不可能克服,這是因為語音識別率受到各種因素的影響,例如:環(huán)境噪聲、電信干擾、回聲、話路質量、用戶講話習慣等。但是,通過流程設計,就能在最大限度上提高識別率,令絕大多數(shù)用戶滿意。

  簡單機械地照搬IVR流程,就會令語音識別系統(tǒng)失去特色,暴露缺點。

原則一:分層合理
  正如IVR系統(tǒng),語音識別系統(tǒng)同樣要分層。分層的目的在于:用戶并不容易記住各個欄目名稱,所以每層的欄目不要太多,以5、6個為宜。很難想象用戶能夠記住并說出10個欄目。特別是第一層主目錄,絕對不可超過這個限度,否則用戶將沒有信心使用系統(tǒng)。

  對于語音門戶,內容會很多,每層只有幾個欄目會使整個系統(tǒng)結構過于復雜,在一些用戶比較熟悉的層次里,可以放寬這一約束,進行綜合平衡。

原則二:標準和明確的提示語
  用戶通過提示語了解系統(tǒng)的服務和功能。提示語必須簡明,并且不能引起用戶的歧義。過于廣告化和文學化的詞語只會誤導用戶,例如:"投石問路"就不如"位置服務"更容易讓用戶理解。

  同時,提示語的字數(shù)要限制在3-4個字。太長,用戶容易說錯;太短,系統(tǒng)不容易識別。

原則三:跨層和跳轉
  跨層:用戶不必逐層進入欄目,只要說出最底層欄目,就能跨層進入。
  跳轉:各欄目之間可以任意跳轉,不必逐層返回。
  回主目錄:用戶在系統(tǒng)中一旦"迷路",一句"回主目錄"就會被帶到系統(tǒng)入口。

原則四:用戶幫助
  每一層,都必須有這一層的"幫助"。"幫助"中將更詳細地向用戶介紹內容和使用方法,這樣各層的提示語才能簡明扼要。"幫助"和提示語是互相補充的。

原則五:完美地完成會話
  語音識別受各種因素影響,識別率不會達到100%,用戶也可能不知道該說什么,而放棄使用。因此,在流程設計上必須幫助用戶完成整個會話流程。

  首先,通過幫助和簡潔的提示,引導用戶正確說出詞匯。

  還要提供按鍵選擇,在語音識別不能工作時,幫助用戶完成整個會話流程。按鍵作為備份方案是語音識別系統(tǒng)中絕對不能缺少的。

原則六:柔性的系統(tǒng)
  用戶可能不會說出系統(tǒng)規(guī)定的關鍵詞。因此,語音識別系統(tǒng)必須有彈性,只要意思相近,系統(tǒng)都應該能夠識別。

原則七:標準化引導設計
  為保證整個系統(tǒng)的一致性,引導提示語必須標準化,例如:返回、主目錄、上一層……,同時,特殊功能鍵(#,*)也必須統(tǒng)一定義。

  從本質上講,流程設計是一個心理學問題,合理的流程要在設計和實踐中不斷的優(yōu)化。應該專門設立流程設計小組,設計流程和監(jiān)督流程的正確性。流程設計和管理是語音識別系統(tǒng)質量管理的關鍵。這個隊伍不一定需要軟件工程師,他們應該跳出工程師的思維方式,從用戶角度出發(fā)考慮問題。

3 基本流程設計

  當用戶說出需求后,語音識別系統(tǒng)將處理以下情況:

3.1 系統(tǒng)"聽懂",繼續(xù)流程。這是最好的情況,用戶正在享受系統(tǒng)的服務。

3.2 系統(tǒng)沒有"聽懂",遇到這種情況,要區(qū)別處理:

3.2.1 系統(tǒng)沒有記錄到用戶的講話,沒有錄音?赡苁怯脩舨恢涝撝v什么,也可能是用戶講話聲音太小。此時,系統(tǒng)應該引導用戶正確講出關鍵詞,例如提示用戶"請您說……"。如果系統(tǒng)仍然沒有錄到音,系統(tǒng)就應該提示用戶大聲說出需求。如果還不能錄音,則應該提醒用戶按鍵輸入選擇了,例如:"XXX請按1,XXX請按2,……幫助請按*,返回主目錄請按#"。

3.2.2 系統(tǒng)錄音無法同規(guī)定的關鍵詞匹配。用戶講錯,或者不會使用系統(tǒng)。此時,系統(tǒng)也應該引導用戶使出正確關鍵詞。如果用戶還不能講對,系統(tǒng)仍然要在提示一次。第三次則要提醒用戶按鍵了。
3.2.3 系統(tǒng)錄音與某個關鍵詞相似,但是沒有完全匹配。系統(tǒng)則應該提示用戶"您是說XXX嗎?",讓用戶確認。從而提高識別率、體現(xiàn)出系統(tǒng)的友好和人性化。

  好的流程和導航才能能夠幫助用戶盡快熟悉語音識別系統(tǒng),讓用戶喜愛和使用。

4 自然語言對話流程

  自然語言對話是指:用戶完全用平常講話的方式說出需求,語音識別系統(tǒng)則需要根據(jù)用戶提供的信息理解用戶需求,并且滿足其需求。在流程設計上,要解決以下問題:

4.1 不考慮用戶語序。
4.2 過濾多余的、沒有意義的詞匯。例如:"我想","那個"……
4.3 提示用戶提供完整信息,用戶不必重新說出整個長句。

  例如一個航班查詢系統(tǒng)中,用戶用自然語言查詢信息,他要提供的信息有:日期、大約時間、起點、終點、或者航班號。

  用戶可以說:"我要查詢明天中午從北京到上海的航班",也可以說:"4月10日,12點左右,由北京起飛到上海"。系統(tǒng)應該對詞序沒有約束,也應該能夠處理一些模糊的概念(早上/上午/中午/……),還必須過濾"我要查詢"、"的航班"等詞匯。

  但是,如果用戶說:"北京到上海"。系統(tǒng)則應該詢問用戶:"請問您要查詢哪一天從北京到上海的航班?",用戶直接說出:"明天"就可以了。

  系統(tǒng)必須能夠提示用戶,協(xié)助其簡便地完成查詢條件的設定。

5 其他注意事項

5.1 不同系統(tǒng)的不同風格
  商業(yè)系統(tǒng)和娛樂系統(tǒng)的提示語風格是截然不同的。前者要求嚴肅和簡潔,或者則要求輕松和活潑。

  值得注意的是:所有的系統(tǒng)提示語速都應該快一些,要相信用戶能夠聽清提示。冗長和緩慢的提示,會令用戶煩躁和失去耐心。

  重復提示用戶也會浪費時間,如果沒有必要,應該盡量減少反復提示和用戶確認。

5.2 提示語
  提示語要簡潔,錄音音量要大一些。專業(yè)的配音人員和錄音設備會給用戶耳目一新的感受,堅定用戶的信心。如果配有背景音樂,效果會出乎你的意料。

  在娛樂系統(tǒng)中,隨機切換同一內容不同的提示語,會刺激用戶的參與熱情。

5.3 幫助
  "幫助"實質上是系統(tǒng)的操作說明,既是系統(tǒng)介紹和使用手冊,也是對簡潔的提示語的補充。用戶通過"幫助",可以更好地理解系統(tǒng)內容和操作方法。

5.4 用戶確認
  在一些敏感的場合,如電子交易、電子支付等,必須讓用戶通過按鍵進行確認,僅僅通過語音確認是不可靠的!當然,會話也要全程錄音。

5.5 同義詞的處理
  根據(jù)前面提到的柔性設計原則,系統(tǒng)設計時要考慮到同義詞、多音字的處理。關鍵詞標準和規(guī)范也需要同時建立起來,從而保證系統(tǒng)的識別率。

6 流程管理文檔

  語音識別系統(tǒng)要通過質量管理來保證其性能,必須制訂嚴格的管理規(guī)范。流程管理的規(guī)范化和標準化就更重要。規(guī)范化和標準化具體體現(xiàn)在管理文檔上,它不僅僅是系統(tǒng)設計和編程的基礎,也是系統(tǒng)測試和驗收的依據(jù)。

  以下流程管理文檔是必不可少的:

6.1 系統(tǒng)結構圖
  整個系統(tǒng)的流程結構圖,包括:分層設計、欄目設計等。

6.2 流程圖
  每個模塊的詳細流程,包括:分支、轉點、入口、出口等。


6.3 流程控制圖
  流程中每個轉點的詳細流程處理,包括:錯誤處理、提示語等。

6.4 關鍵詞表
  整個系統(tǒng)所有的關鍵詞表,包括:通用關鍵詞,各層/各欄目關鍵詞等。

6.5 提示語列表
  整個系統(tǒng)每個提示語的編碼,文本,錄音文件名等。

  流程設計后,系統(tǒng)的開發(fā)、調試、測試、驗收都要嚴格按照以上文檔要求進行。系統(tǒng)測試時,要向測試人員提供標準的測試報告和詳細測試程序,測試人員應該認真填寫測試報告,并將問題及時反饋。

  質量管理流程和測試標準、測試報告不在本文的范圍內,不再贅述。


作者聯(lián)系方式

李宏:glpglp@sina.com

作者供稿 CTI論壇編輯



相關鏈接:
企業(yè)無形的代言人---宇高語音撥號系統(tǒng) 2003-11-20
語音識別醞釀第二次浪潮 2003-09-15
《華爾街日報》:讓語音識別軟件解放你的手 2003-09-07
綜述:得意音通到底是什么企業(yè) 2003-08-27
語音應用客戶滿意度調研 2003-07-29

分類信息:     文摘   技術_語音識別_文摘