一、聊天機器人50年發(fā)展簡述
在20世紀60年代中期,計算機科學家Joseph Weizenbaum發(fā)明了第一個chatbot(聊天機器人)——Eliza。Eliza通過使用模式匹配和替代方法來模擬對話,呈現出程序能更理解人們問題的假象,暫時性地讓一個真正的人類認為他們正在和另一個人聊天。
在這之后有多種不同用途的機器人被開發(fā)出來,其中一個有代表性的聊天機器人系統(tǒng)是ALICE。ALICE產生于1995年,在2000年、2001年和2004年三次獲獎,隨ALICE一同發(fā)布的AIML(Artificial Intelligence Markup Language)被廣泛應用。ALIC之后相繼有多種使用機器學習技術的聊天機器人問世,微軟小冰,AppleSiri,百度度秘等等。
現在的聊天機器人能夠理解人們所說的內容,一般是基于NLP(自然語言處理)為書面或口頭用語設定特定語義。此外,很多聊天機器人使用專業(yè)系統(tǒng)軟件,即模仿人類專家進行決策,提取一小部分信息來回答問題。
隨著深度學習的興起和AlphaGo對于深度學習的成功應用,聊天機器人又有了新的技術手段,一些聊天機器人廠商已經開始嘗試應用深度學習技術。相信在不遠的未來,更多的聊天機器人將會采用深度學習方法,接入海量數據,來預測問題進而對寬泛的主題做出快速響應,以能夠及時提出回答相關問題。
二、聊天機器人具體應用場景
一直以來說到聊天機器人,大家可能會想到微軟的小冰和小娜,以及蘋果的Siri。很多人認為他們是很有意思,但大多數情況下,沒什么用處的技術。但是近年來,它有了一些具體的應用場景,比如客服、私人助理、知識問答、陪聊等。
聊天機器人應用場景劃分
機器人類型
代表產品
客服機器人
小I機器人、京東JIMI機器人,阿里小蜜商家版
私人助理類
AppleSiri、GoogleNow、微軟Cortana、百度度秘、出門問問,助理來也
知識問答類
IBMWatson、WolframAlpha
陪聊機器人
微軟“小冰”、微信“小微”、“小黃雞”
客服機器人的主要功能是回答用戶提出的有關產品或服務的問題,降低企業(yè)客服運營成本、提升用戶體驗的目的。代表性的系統(tǒng)有小I機器人、京東JIMI機器人,阿里小蜜商家版等。用戶與客服機器人溝通,可以了解商品信息、售前、售后等問題,一般而言,當機器人不能回答用戶問題時,系統(tǒng)都會提供某種機制將用戶轉向人工客服?头䴔C器人是典型的業(yè)務機器人,閑聊話題一般在客服機器人中處于次要地位。做好客服機器人的關鍵是獲取產品和服務相關的信息以及掌握詳細的業(yè)務規(guī)則。所以類似阿里、京東這樣的公司,自身擁有海量商品信息,并自己制定業(yè)務規(guī)則和流程,相對而言就比其他公司更容易開發(fā)出實用的客服機器人。
銀行業(yè)聊天機器人和人工客服的工作劃分
私人助理類通過語音或文字與聊天機器人進行交互,如問天氣、日程管理、訂外賣、打車等,幫助用戶處理日常事務。助理類的應用有AppleSiri、GoogleNow、微軟Cortana、百度度秘、出門問問、助理來也等。AppleSiri以語音識別見長,在蘋果終端上可以用語音操作手機,是具有代表性的私人助理。助理類應用雖然目標是私人助理,但目前更多的人只是體驗或者把它當成娛樂工具,除了語音識別和自然語言處理技術限制外,更重要的因素是它并不適合有些場景,比如訂外賣,現在移動端電商非常成熟,可以一鍵購物,并且有好的UI體驗,比用語音或者打字快捷不少,語音受到環(huán)境限制(比如嘈雜環(huán)境),并且有隱私問題。所以私人助理類最關鍵的還是選好應用場景,比如車載智能設備就是非常合適的場景,開車時沒法用手操作,使用語音更安全,車內環(huán)境也相對安靜,同時一般也沒有隱私問題。
知識問答類的聊天機器人主要功能包括回答用戶以自然語言形式提出的知識性問題和需要計算和邏輯推理型的問題。典型的知識問答系統(tǒng)有IBMWatson、WolframAlpha等。此類系統(tǒng)研發(fā)成本高,周期長,在特定領域落地也不太容易,像Watson一直在醫(yī)療領域做嘗試,所以一般也只有大公司和技術創(chuàng)業(yè)型公司愿意承擔風險嘗試這個領域。另外一種簡化形式,是將知識局限在某個簡單的特定領域,典型的有兒童教育和娛樂,科大訊飛的開心熊寶可以通過語音對話的形式輔助兒童學習唐詩、宋詞以及回答簡單的常識性問題等。這種簡化形式技術難度很低,另外兒童教育市場也大,是知識問答類機器人的商業(yè)化捷徑。
閑聊類機器人的主要功能是同用戶進行閑聊式的對話,也就是陪聊。代表性的系統(tǒng)如微軟“小冰”、微信“小微”,較早的還有“小黃雞”等。此類應用有時候也能提供特定服務,如天氣預報等。娛樂類機器人處境比較尷尬,因為其很難實現商業(yè)價值,像微軟小冰除了廣告效應外,并沒有給微軟帶來實際利益,所以小冰現在也在做商業(yè)化探索,嘗試進入客服等領域。
今天,聊天機器人已經可以讓用戶感知到,它們不僅能傾聽,更能理解,未來其增長還有巨大潛力,但目前它們仍然無法重現人類溝通的互動,在充分發(fā)揮功能和做到真正被AI驅動之前,還需要克服一些障礙。
三、聊天機器人的掣肘與挑戰(zhàn)
聊天機器人面臨的最大的挑戰(zhàn)之一就是訪問并獲取大量的數據。例如大量零售業(yè)的例子中,對于消費者而言,很多消費者并不想與電腦互動,他們希望有真人客服可以幫助其解決問題;對于零售商而言,他們希望能夠利用這項最新的技術調整服務,并為消費者提供更加簡單高效的產品訂購方式。聊天機器人唯一能提供模擬真人交談的體驗的方式就是使用AI。但是為了實現這一目標,必須攻克建立大數據這一難題,這就需要通過一些方式累積數據。
在編譯收集各種數據后,還必須要考慮到聊天機器人在與不同的個人交互時的心理學,來判定每個人的性格在對話中對于體驗的影響。想象一下一個群體的每個成員對于同一件事會有完全不同的描述方式,那么這時候人們將如何與聊天機器人進行交互?此外,何時才是機器人插入對話的合適時機?它們如何引導廣大用戶群體找到正確的解決方案?聊天機器人在交互體驗更加擬人化,能更好地理解、預測語言與場景化詞匯中面臨如下多重挑戰(zhàn)。
一是整合語境的挑戰(zhàn)。為了生成明智的回復,系統(tǒng)可能需要整合語言語境(linguisticcontext)和物理語境(physicalcontext)。在長對話中,人們記錄已經被說過的話和已經交換過的信息。這是結合語言語境的例子。最普遍的方法是將對話嵌入一個向量中,但在長對話上進行這樣的操作是極富挑戰(zhàn)性的。此外還可能需要整合其它類型的語境數據,例如日期/時間、位置或用戶信息。
二是一致人格的挑戰(zhàn)。當生成回復時,對于語義相同的輸入,代理應該生成相同的回答。例如,你想在“你多大了?”和“你的年齡是多少?”上得到同樣的回答。這聽起來很簡單,但是將固定的知識或者人格整合進模型是非常困難的研究難題。許多系統(tǒng)學習如何生成語義合理的回復,但是它們沒有被訓練如何生成語義上一致的回復。這一般是因為它們是基于多個不同用戶的數據訓練的。
三是意圖與多樣性挑戰(zhàn)。生成式系統(tǒng)的普遍問題是它們往往能生成像“太好了!”或“我不知道”這樣的能適用于許多輸入情況的普遍回復。谷歌的智能回復(SmartReply)早期版本常常用“我愛你”回復一切。一定程度上這是系統(tǒng)根據數據和實際訓練目標/算法訓練的結果。然而,人類通常使用針對輸入的回復并帶有意圖。因為生成系統(tǒng)(特別是開域系統(tǒng))是不被訓練成有特定意圖的,所以它們缺乏這種多樣性。
整體來看,聊天機器人經歷了從問答機器人到對話機器人的發(fā)展,但目前大部分的聊天機器人都屬于問答機器人,也就是只能處理一問一答,不能很好的處理對話,或者說不能處理上下文,并不具備真正的人工智能特征。對話機器人現在是研究熱點,也是趨勢,但目前并沒有成熟的對話機器人,即使是號稱支持對話的機器人也是用規(guī)則或者狀態(tài)機來處理對話,能力非常有限,達不到實用目的。
四、聊天機器人創(chuàng)業(yè)投資浪潮
根據預測數據顯示,2016年全球人工智能收入預計將達到6.437億美元,到2025年將增長至368億美元。預計2018年,全世界將有60億臺設備用上人工智能技術。在這樣的前景下,人工智能的創(chuàng)新、創(chuàng)業(yè)和投資日趨活躍。
全球人工智能產業(yè)規(guī)模(來源:Tractica)
目前,一方面人工智能已經可以支撐聊天機器人在各個人機交互場景下達到靈活應用,大幅降低成本和擴大接觸客戶的范圍;另一方面聊天機器人可以快速便捷地部署在移動設備上,改善或者改變移動端信息交互模式(信息交互是手機體驗的核心),也就是說從某種程度來看,聊天機器人也許會比目前的手機應用更適合手機,下面第一個圖表比較了蘋果AppStore和Facebook聊天機器人平臺的增速,圖表顯示,在第3至第6個月,聊天機器人數量增長約170%,同期內移動應用數量增長了100%,聊天機器人增速是應用的1.7倍;第二張圖表比較了兩種技術的開發(fā)者數量。在問世的第6個月,活躍的聊天機器人開發(fā)者數量是第14個月時應用的近3倍。
聊天機器人與移動應用數量的比較
聊天機器人與移動應用開發(fā)者數量比較
基于聊天機器人可能帶來的的巨大市場潛力,商業(yè)公司紛紛開始投入到聊天機器人的產業(yè)中。很多公司也已經在傳播消息和銷售渠道交互的環(huán)節(jié)上部署了聊天應用,如Facebook不斷提高Messenger平臺創(chuàng)收能力,蘋果最近宣布將為iMessenger發(fā)布一個專用應用/聊天機器人商店。
伴隨著智能技術與生態(tài)系統(tǒng)的日益成熟與完善,聊天機器人創(chuàng)業(yè)公司蓬勃發(fā)展,風險投資資本也給該產業(yè)的繁榮注入了動力。目前,聊天機器人還處于發(fā)展早期階段,或許未來2年內,人與采用人工智能技術的聊天機器人之間將能進行更復雜的對話。但可以預見的是聊天機器人和人工智能的融合是一項重要投資,這類標的的投資價值未來可期。
五、聊天機器人未來展望
聊天機器人是當下AI最火的分支之一,現在以及接下來的幾年里,它們將在生活中越來越普及,在服務中也愈加隱形。新型及創(chuàng)新性的用戶案例可以幫助聊天機器人在多個領域提高使用性能,更好地服務于用戶。當然,真正的問題是,聊天機器人是否可以滿足用戶的期待,以及是否可以說服習慣于真人聊天的用戶轉而使用機器人——如,Facebook將聊天機器人集成到其Messenger應用中,讓企業(yè)可以在上面與他們的客戶進行互動;亞馬遜Echo可以讓用戶使用聊天機器人來打開音樂播放器或者支付信用卡賬單;達美樂披薩可以讓顧客通過社交媒體下訂單。
如果我們回顧AI領域在過去50年的演變與發(fā)展,最大的成就莫過于為AI研究開天辟地的算法。并且隨著普及與應用,比如瀏覽器搜索算法,我們不再將它視為AI。我們在聊天機器人中看到了同樣的趨勢,因為這些算法正在運用于更多的地方,而不僅在你所知的聊天軟件中;蛟S在未來的10年內,我們將不會覺得聊天機器人有何特別之處,而是將它視為類似app或是亟待想象的一種黑科技那樣,習以為常。