首頁>>廠商>>語音識別與合成>>得意音通

自然語言理解技術,智能信息服務的核動力

鄧永強 鄭方 2004/04/19

  自從互聯網普及以后,人們難于獲取信息的苦惱,很快就變?yōu)楸贿^多、龐雜的信息包圍的煩擾。雖然通過搜索引擎、目錄、人工編輯的社區(qū)等工具,人們可以獲得一定的輔助;但是這些工具的準確性和方便性仍很不足夠,急迫需要向智能化、精確化、專業(yè)化、個性化等等以用戶為中心的智能信息服務。智能信息服務將成為下一代互聯網的主旋律;而自然語言理解技術可以為信息服務帶來革命性的理念和嶄新的應用,有效提高服務的質量和滿意度,為相關行業(yè)和信息服務業(yè)創(chuàng)造更多的發(fā)展空間,是智能信息服務的核動力。

一、 走向實用的自然語言理解技術

  用自然語言與計算機進行交流,獲取合適的信息,得到滿意的服務,是人們長期以來所追求的。自然語言理解是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。NLU是自然語言理解(Natural Language Understanding)的縮寫。

  隨著計算機技術和人工智能總體技術的發(fā)展,自然語言理解不斷取得進展。機器翻譯是自然語言理解最早的研究領域。由于早期研究中理論和技術的局限,所開發(fā)的機譯系統的技術水平較低,不能滿足實際應用的要求。到了1970年代初期,對語言理解對話系統的研究取得進展。進入1980年代之后,自然語言理解的應用研究廣泛開展,機器學習研究又十分活躍,并出現了許多具有較高水平的實用化系統。這些系統是自然語言理解研究的重要成果,表明自然語言理解在理論上和應用上取得了突破性進展。

  在中國,語音和語言處理技術的研發(fā)略晚于國外。清華大學智能技術與系統國家重點實驗室屬下的語音技術中心1979年創(chuàng)立(原名語音實驗室),至今已有25年的歷史。在以清華大學語音技術中心為代表的頂尖的學術機構的帶動下,中國的語音和語言處理技術得到很大發(fā)展。

  相對于規(guī)范語言,對自然語言的理解具有更大的難度。這是因為自然語言包含大量的口語語言現象,諸如:省略、指代、更正、重復、強調、倒序等等。涉及到語音的口語對話系統將還包括噪音、含混不清、口頭語、吃音、音變等等口語語音現象。

  而相對于基于關鍵詞的技術,自然語言理解技術的優(yōu)勢是:(1)直接:在信息查詢時,用戶可以不必進行多級菜單的選取而直奔主題。(2)靈活:用戶查詢不必嚴格按照某些"關鍵詞"進行詢問,只要用戶的敘述在"語義"上與要查詢的一致。

  一個技術優(yōu)越而適用性好的自然語言理解系統,應該具備支持上下文相關分析(包括省略分析)、話題自由變換、人機混合主導以及口語對話等技術特點。

  上下文相關分析是指系統在理解當前語句時可以聯想用戶以前所說的話,進行綜合分析,因此即使有時用戶所說的話有一定的省略,系統照樣可以理解。

  話題自由變換是指系統允許用戶在多個話題之間不斷轉換,系統照樣可以記住以前的談話內容,比如用戶在問航班起飛時間時,突然問目的地與本地的時差,然后再確認要先前詢問的航班,系統都能滿意回答。而目前的一些系統,對話往往只能局限于某一個話題,一旦用戶變換話題,系統將無所適從。

  人機混合主導則是完全的自然對話,用戶可以轉換話題后在回到原來的話題(像人一樣);用戶可以"答非機問"(多回答或少回答);……而系統都可以根據實際情況提取語義信息,如果用戶詢問的信息足夠,那么系統直接回答問題;而如果用戶詢問的信息不全或者用戶遲疑太久,那么系統則主動詢問來獲取足夠的信息。而不具備人機混合主導性能的系統只能等用戶發(fā)問,如果用戶根本不知道問什么,那么系統將一直待機等待。

  口語對話是自然語言理解技術實現的難點,但是也是應用系統適用性的關鍵點?谡Z中,人們的語言很隨意,可以省略、更正、倒敘等等,這些口語現象是傳統的單單基于詞法分析的理解系統所難以解決的,而引入基于關鍵語義的技術卻可以很好地解決。

  從目前的理論和技術現狀看,通用的、高質量的自然語言處理系統,仍然是較長期的努力目標,但是針對一定應用,具有相當自然語言處理能力的實用系統已經出現。北京得意音通技術公司依托于清華大學語音技術中心,已經在某些領域實現了商品化、產業(yè)化,典型的實用系統包括:智能短信服務、智能搜索引擎、智能聊天機器人等。

二、商機無限的智能信息服務

  互聯網時代,信息服務給人們帶來極大方便和創(chuàng)造著巨大的社會效益、經濟價值的同時,也帶來了信息爆炸、信息垃圾等等煩惱。采用了自然語言理解技術的智能信息服務,將給陷入信息汪洋大海的人以指南,幫助他們更自由自主、隨心所欲地遨游,引導他們快速、準確地獲得所需的信息和服務,從而大大地拓展信息服務的發(fā)展空間,為相關產業(yè)帶來無限的商機。最近一段時間,智能信息服務已經成為國際IT業(yè)的最新潮流,獲得了億萬網民的青睞。對于使用漢語,熱衷于短信、網上聊天的中國用戶而言,智能信息服務的實用性以及蘊含的商機更是顯而易見。

  采用自然語言理解技術的智能信息服務創(chuàng)造了電子服務新概念,其最大的特點是具有中文自然語言理解功能。它首先對提出的問題進行斷詞、斷句,然后根據系統預先設置的語義規(guī)則理解整句話的意思,形成相應的查詢條件,在現有數據庫進行快速而準確查詢,給出用戶需要的答案或者提示用戶進一步輸入有關的信息。由于自然語言理解技術發(fā)展的階段性,目前還做不到象人一樣具有足夠智能的、通用的智能理解,但是只要劃定具體的領域(領域范圍可大可小,如天氣、體育等簡單信息查詢,也可以是交友、購物、保健等寬泛的智能聊天/咨詢等等),性能先進的自然語言理解技術都能量身定做出具足夠實用性的智能信息服務系統,自動理解客戶用自然語言發(fā)出的相關領域的問題,使網絡交流變得更人性化,信息查詢變得更方便、快速和準確,從而獲得高質量的電子服務。以下是現階段自然語言理解主要的應用。

  智能短信服務。短信服務商可根據具體應用領域定制一系列的智能短信業(yè)務,如旅游交通、吃喝玩樂、金融證券、交友網聚、智力競猜等受歡迎的服務,讓服務商和用戶都拋開厚重的手冊和復雜的編碼,代之以口語化的自然語言通過短信輸入,短信系統能迅速理解用戶的意思,提供準確、周到的信息和服務。這樣的服務將直接刺激用戶使用短信服務的興趣和頻率,并為短信服務商和電信運營商開發(fā)更新的、更具吸引力的業(yè)務創(chuàng)造了很好的條件。

  智能聊天機器人。目前流行于各大網站、各類即時通訊軟件的聊天機器人還沒有應用成熟的智能語言理解技術,僅僅實現了基本的、簡單的對話交流、信息查詢等功能。引入自然語言理解技術,能建立新型智能聊天機器人,通過與用戶對話、聊天等生動、靈活的形式,了解用戶的需求,利用智能搜索技術采集和分析互聯網和知識庫的信息內容,進行自動過濾、篩選、獲取有效內容,對相關信息內容進行智能化編輯整理,并返回給用戶;這樣,聊天機器人的服務將會更易用、更實用,能實現功能強大而實用的智能聊天、智能游戲、個性化的新聞定制、智能網絡搜索、智能電子商務等業(yè)務,給用戶以極大的方便、無限的樂趣。

  智能搜索引擎。普通的搜索引擎引入中文自然語言理解和知識管理技術,構造成新的智能搜索引擎,就能提供全新的信息查詢服務,創(chuàng)造更綜合的增值服務。目前的搜索引擎由于只使用關鍵詞技術,沒有引入自然語言理解,每次搜索時只是按照關鍵詞進行匹配,返回的大量信息和鏈接,其中很大部分是垃圾信息或者不是用戶需要的信息,往往導致用戶無所適從。而門戶網站或者專業(yè)網站雖然對信息進行很好的分類,但是首先要用戶記住網址,還要懂得分類的標準,然后逐層點擊相應的分類鏈接,才能獲得所需的信息。這樣的信息分類查詢給信息服務商產生很大的工作量,服務成本和進入門檻顯著提高,而用戶使用起來也不方便,導致用戶的流失。基于內容的智能搜索引擎是依靠語義網絡、漢語分詞、句法分析、處理同義詞等語言理解技術最大程度地了解用戶的信息需求,獲得更高的易用性、更準確的范圍定位、更智能的搜索結果。

  運用了先進的自然語言理解技術,智能搜索引擎可以識別并回答用戶的問題,使用戶擺脫了傳統搜索引擎基于關鍵字的束縛,指引用戶更有效、更快捷地尋找到所需的資料,同時為用戶提供相關的、有參考價值的其他內容。由于這些特點,使得智能搜索技術能夠在互聯網信息檢索的各個方面得到廣泛的應有。它可以為大型綜合搜索引擎提供后臺支持,使之具有人性化、交互性的特點。它能夠方便地實現垂直搜索引擎的專業(yè)類別內搜索;當然也可以為信息門戶網站提供方便快捷的站內信息搜索服務。

  智能搜索引擎除了在互聯網上使用外,也可以支持WAP協議而應用在手機上。其實用戶往往在逛街、旅游、交通等室外環(huán)境、移動狀態(tài)時更需要隨時查詢信息。手機是很好的查詢工具,但是手機的屏幕小、內存少、帶寬窄,不適合接收和保存大量的信息,更不可能翻看數以百計、千計的信息。傳統的基于關鍵詞搜索或者分類信息查詢模式都存在一定的缺陷,特別不適合在手機上使用;而基于自然語言理解技術的智能搜索引擎,就能很好地為手機用戶提供隨時、隨地、隨心的信息服務。

  舉一個典型的應用:精品購物指南報與得意音通公司合作提供的智能生活資訊信息服務系統,采用中文自然語言理解技術,在吃喝玩樂、影視娛樂、消費購物、戶外運動、美食餐飲、醫(yī)療保健等領域通過互聯網、短信、WAP等多種通訊手段,為商家和用戶提供更方便、直接的信息交流和互動手段,成為在北京生活、工作、學習和旅游的廣大消費者重要的信息查詢工具。

三、未來應用展望

  用戶們呼喚自然語言,因為它是人機交互的最高境界,是人機交互最自然的方式。有理由相信,在不遠的將來,任何人、在任何時刻、在任何場所、在任何設備上,都可以通過自然語言方便瀏覽網頁、互相傳遞信息,實現隨時隨地溝通交流的目標。

  不久的將來,我們可能會經常遇到這樣的應用場景。一個人到一個新的城市,如北京,他想盡快了解有關北京的生活服務信息,就可以用手機或者電話打到一個提供智能信息服務的系統。他可以直接用口語去問一個擁有海量信息的服務器:北京有哪些好玩的地方,哪些地方能夠提供很好的餐飲服務,哪些地方可以購物,那些地方可以享受文化娛樂;還可以與系統進行人機對話,輕松地買機票、訂房間等等。他通過自然語言與智能信息服務系統進行人機交互,就能享受周到的服務。在這樣的例子中,需要用到很多的技術和服務,其中最關鍵的就是交談式語音識別和理解系統。

  北京2008年奧運的舉辦,將是自然語言理解技術迅猛發(fā)展的大好契機,北京奧運會同時也將是智能信息服務的巨大舞臺。奧運會最大困難之一是"語言障礙"。國內外產業(yè)界緊密合作,要利用現代信息技術,特別是自然語言理解的最新科學技術成就,研制"面向奧運的多語言智能信息服務網絡系統",力爭在2008年北京奧運會期間為各國運動員、記者、觀眾和來自全世界數以百萬計的旅游者提供綜合、全面、多語種、可定制的信息服務,以實現申奧報告提出的"任何人、在任何時間、任何場所都能夠安全、方便、快捷、高效地獲取可支付得起的、豐富的、無語言障礙的、個性化的信息服務"的承諾。

  北京奧運的多語言信息服務將包括多語言信息同步發(fā)布、信息查詢和語音交互式的電子商務,并重點提供基于位置的信息服務。另外還提供人際交流的輔助工具,如口語翻譯機和自動翻譯電話。系統將在賽事安排、比賽成績等奧運相關信息查詢,住宿、天氣、交通、旅游、餐飲、娛樂和購物等公共服務信息查詢,比賽、演出門票、機票、火車票訂購,以及社交活動等場合提供充滿人性化的多語言智能信息服務,相當于建立了一支虛擬志愿者信息服務大軍。智能信息服務網絡系統不僅將成為北京奧運會的閃光點,有關成果也必將應用和推廣到國內以及世界不同的地區(qū)和領域,從而推動信息服務、IT產業(yè)以及相關領域的發(fā)展,形成新的經濟增長點。

  和人類進步過程中其他任何一種技術的發(fā)展歷程一樣,自然語言理解技術在任何一個不同的成熟階段都有一個不同的應用形式和不同的市場定位。在這種技術到市場再到技術的螺旋式上升的過程中,技術越來越成熟,市場也越來越成熟,從而讓技術更好地為人類服務。自然語言理解技術給智能信息服務提供了威力巨大的核動力,智能信息服務給人類更自然、自主的信息交流手段,將創(chuàng)造出全新的產業(yè)空間。人們渴望發(fā)展自然語言理解技術以加速信息、知識與文化的交流,促進社會、經濟、科學的進步,這是自然語言理解技術新的強大的推動力量,也是每一個國家都面臨的新的挑戰(zhàn)。

得意音通公司供稿 CTI論壇編輯



相關鏈接:
得意珠三角綜合智能信息增值平臺項目中標 2009-08-20
北京軟件產品質量檢測檢驗中心對《海量語音文件的目標說話人篩選系統》進行測試 2009-06-25
廣東政府和清華大學舉行了全面開展產學研合作協議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類信息:  移動增值_與_語音合成TTS     熱點專題_移動增值_新聞   文摘   技術_語音合成_文摘