首頁>>>技術>>>CRM  CRM產品

制造業(yè)CRM的客戶流失分析

陳思行 陳保鋼 2009/09/14

  隨著全球經濟一體化的浪潮,中國正在成為世界制造業(yè)的中心,它為中國的企業(yè)提供了更多機會的同時,也帶來了更強勁的競爭。隨著全球化競爭的加劇,制造企業(yè)開始尋求新的戰(zhàn)略競爭點,整個產業(yè)也逐漸從產品和價格競爭轉向服務競爭。為了提高企業(yè)的競爭力,目前很多企業(yè)在信息化技術方面加大了投入。比如ERP、PDM和CRM等信息技術在企業(yè)的推廣應用等。

  ERP的意思是企業(yè)資源計劃,系統主要包括四大部分,即財務管理、生產制造管理、分銷與后勤管理及其他管理模塊。它的重點是在企業(yè)的內部生產領域。它強調的是以產品為中心,以企業(yè)內部生產領域為重點。

  PDM側重于對產品開發(fā)階段數據和企業(yè)內部產品數據的管理,它的體系結構是強調以文檔為中心的研發(fā)流程管理,重點在于建立文檔之間的聯接。

  CRM (Custom Relationship Management)的意思是客戶關系管理,它強調把客戶放在核心位置,其理念要求企業(yè)完整地認識整個客戶生命周期,圍繞“客戶接觸點”,提供與客戶溝通的統一、集成的平臺和工具,涉及企業(yè)一切與客戶有關的信息交互進行處理,提高員工、客戶接觸的效率和客戶反饋率,為客戶提供整體的服務!同時采用數據挖掘技術對有關信息進行分析,得到有價值的信息和知識。

  如果說現在企業(yè)的競爭是產品的競爭、企業(yè)資源的競爭,那么,不久的將來它將轉向以客戶為中心的服務上。CRM系統正是為滿足上述需求應運而生。目前,在發(fā)達國家,制造業(yè)的服務創(chuàng)新已成為企業(yè)利潤的增長點。

  本文針對CRM客戶關系管理中的客戶流失問題,結合制造業(yè)的特點,從數據挖掘技術層面進行思路探討。試圖得到企業(yè)管理層面和信息技術層面對CRM客戶關系管理中的客戶流失問題予以關注,為企業(yè)未來贏得新的利潤增長點。

  1.問題由來

  CRM對制造商的作用在于了解客戶所有的行為活動并確保與客戶的關系。它能把前端辦公和后臺生產聯系起來,是企業(yè)和客戶的交叉點,能幫助制造商制造出定制化的產品,增加銷售并降低營銷開支,且使客戶的購買變得更加方便。制造業(yè)CRM系統主要包括營銷管理、銷售管理、服務管理、呼叫中心、客戶信息管理、決策支持等多個模塊。它的關鍵技術之一在于能否提供基于聯機分析處理的數據倉庫技術,從而具備動態(tài)、整合的客戶數據管理和查詢功能,對客戶購買行為具有參考功能;對客戶流失具有警告功能。此外,CRM的客戶分類技術,讓企業(yè)建立起一對一的客戶服務體系,實行差異化客戶管理(如根據客戶特點,可將其分為① 內在價值型客戶。② 外在價值型客戶。③ 戰(zhàn)略型價值客戶), 為客戶創(chuàng)造非同一般的價值,也是企業(yè)從中獲得長久利潤、需要引起關注的關鍵技術之一。

  工程機械尤其是混凝土機械近年來獲得了迅猛發(fā)展,與此同時,混凝土機械產品市場又有兩大特點:一是市場需求發(fā)展大,產品使用周期短,兩三年后的回頭客相當多;二是隨著社會改革的推進和國家投資方向的轉移,客戶群體會有較大方面的變動。如國有企業(yè)占主體時,以國企為主要購買力;而隨著商品租賃業(yè)發(fā)展,個體購買又成為了主力;而大型建設施工購買又回到了建設施工單位。由于市場的競爭,相同產品的制造廠家對客戶的爭奪往往相當激烈,有時甚至到了白熱化的地步。

  顯然,我們既要大力發(fā)展新客戶,又要努力保留舊客戶。保留一個舊客戶要比爭取一個新客戶便宜的多。為改進保留客戶的一種途徑就是客戶真正流失之前準確預測并采取行動挽留客戶,而基于客戶關系管理的數據挖掘技術和方法是解決該問題的途徑。一般說來,針對CRM中客戶獲得、客戶保留、客戶忠誠和客戶贏利分析各個方面,客戶特性及客戶行為信息的分類具有相當重要的意義。最大程度的預測潛在的客戶流失是我們需要密切關注的。采用數據挖掘的分類思路可以在制造業(yè)客戶關系管理中起到相當重要的作用。

  2.CRM軟件中常用數據挖掘方法

  利用數據挖掘的分類算法構造CRM的分類器,是數據挖掘技術在商業(yè)領域中的重要應用之一。數據挖掘的中的聚類方法和決策樹分類算法是常見的,也是一種相對準確、有效的分類方法。

  CRM相關技術的發(fā)展日新月異,它包括運營型(前臺),分析型(后臺),協作型(渠道)。這里尤其是分析型CRM的技術發(fā)展得最快,這也是很多CRM理想中的功能實現成為可能的關鍵。數據倉庫,數據挖掘和呼叫中心是三個其主要的技術組成。本文主要分析數據挖掘部分。

  所謂數據挖掘是從大型的數據庫中提取隱藏的、有預測性的信息,它是能幫助企業(yè)從已有數據中提取到最先進和流行的趨勢并為其提供效益。簡言之,數據挖掘是應用數據分析和運算法則來探索數據模式并進行科學地描述和預測。

  常用的數據挖掘方法有如下幾種:

  2.1 回歸預測

  回歸預測是比較傳統的預測方法,它是根據歷史記錄分析得出總體趨勢,并將這種趨勢用某種數學方程式來表示。利用這個方程式,就可以輸人未來的一個或多個變量計算出預測結果。如果方程式的變量是一次方的,那么就成為直線性回歸,如果是多次訪問的,就成為區(qū)線性回歸。典型的客戶流失預測都可以采取回歸分析的方法。

  2.2 決策樹

  決策樹是一種類似于枝丫形狀的二分制。數據分析和預測方法,主要適用于對數據進行歸類分割和預測。根據客戶特征,對客戶大市場進行分割,從而得到相對較小的客戶群體。

  2.3 聚類和鄰點預測

  聚類和鄰點預測對于客戶關系管理來說是有類似的分析目的的。聚類是指如何將一批數據按照相似特性歸類,使我們能對他們有一個形象的概括性理解;鄰點預測是在歸類的基礎上對未來數據進行預測。

  2.4 規(guī)則導引

  規(guī)則導引是從一個樣本數據庫中發(fā)現并歸納出數據行為模式,即用“如果A,那么B,否則就是C”,這樣的判斷語句來描述這種隱藏在數據倉庫中的規(guī)律。數據挖掘技術中的規(guī)則導引就是要從大量的客戶數據中發(fā)掘出這些規(guī)則。

  3.制造企業(yè)CRM數據挖掘綜述

  在CRM系統中,最重要最有挑戰(zhàn)性的則是對流失客戶的預測。制造企業(yè)營銷和市場部門,根據購買產品的客戶信息資料,通過數據挖掘方法,往往可以預測潛在的流失客戶。

  客戶流失分析就是應用數據挖掘技術,預測哪些是潛在流失客戶,同時評估出最有效的客戶保持方法。本文提出一套基于制造業(yè)CRM系統中預測客戶流失的方法的基本思路。

  該方法一般分為三個步驟:第一,應用軟件對數據進行挖掘測試,其中包括統一的客戶資料,客戶屬性,購買信息,模型參數,模型等等。第二,應用數據分析方法和所討論的數據挖掘技術對客戶流失前的行為分析進行簡化的知識發(fā)現。第三,應用系統聚類和決策樹ID3的方法對模型應用的實驗結果進行過程分析。

  常見的數據挖掘主要分為兩種:即探索性的數據挖掘和驗證性的數據挖掘。其中探索性的數據挖掘中最常使用的就是聚類,而驗證性數據挖掘的代表就是分類。聚類分析法是一種無監(jiān)督的自下而上的學習過程,主要目的是把沒有“標記”的數據分為有意義的“組”(或者就叫聚類);而分類是給定已知“標記”的訓練數據,然后通過學習得到描述模式,然后運用該模式對未來的數據進行分類,是一種帶監(jiān)督的自上而下的學習,如決策樹ID3法。由于這兩種類別具有一定的典型性,都可以用于數據挖掘的客戶流失分析。

  3.1數據源介紹

  進行數據分析首先必須從客戶的數據庫中間找到最能夠代表和刻畫客戶行為的屬性。針對2005一2006兩年中,某企業(yè)800個購買某工程機械產品的客戶信息,從中了解到導致客戶流失的因素較多,但有共性的部分也有很多。因此,我們把客戶與本公司交易次數、公司屬性、公司資產規(guī)模、付款方式、公司所在地、產品用途作為統計信息中的主要屬性。

  我們將所擁有的所有可能的客戶信息屬性變量轉換成0,1,2等屬性,其他數字變量不變,應用2一檢驗,選除了某特定制造企業(yè)客戶流失的一般統計屬性。

  3.2 系統聚類實驗分析

  系統聚類法實驗的基本思想是:設有n個樣品,每個樣品測得m項指標。然后用不同的數據表示客觀數據的定量屬性和定性屬性。當定義或計算樣品間的距離(或相似系數)和類與類之間的距離之后?梢詫個樣品各自自成一類,這時類間的距離與樣品間的距離是等價的;然后將距離最近的兩類合并,并計算新類與其他的類間距離,再按最小距離準則并類。這樣每次縮小一類,直到所有的樣品都并成一類為止。這個過程再可以用譜系聚類圖形象表達出來。

  3.3 實驗聚類

  根據特定產品、眾多客戶的統計信息中的主要屬性,按照上述系統聚類實驗,得到我們所需要的信息。

  基于上述個體行為數據進行聚類操作,在對未來行為的預測能力上,往往比其他類型的數據效果更好、更精準。

  3.4 決策樹ID3法實驗及分析

  決策樹技術是用于分類和預測的主要技術,決策樹學習是以實例為基礎的歸納學習算法。著眼于從一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則。它采用自頂向下的遞歸方式,在決策樹的內部節(jié)點進行屬性的比較,并根據不同屬性判斷從該節(jié)點向下的分支,在決策樹的葉節(jié)點得到結論。所以從根到葉節(jié)點就對應著一條合取規(guī)則,整棵樹就對應著一組析取表達式規(guī)則。

  考慮一個任意的變量,它有兩個不同的值A和B。假設已知這個變量不同值的概率分配,將估測該概率分配的不純度。

  情況1.如果P(A)=1和P(B)=0,那么知道這個變量的值一定為A,不存在不純度,因此已知變量結果值不會帶來任何的信息。

  情況2.如果P(A)=P(B)=0.5,那么它的不純度明顯地高于P(A)=0.1和P(B)二0.9的情況。在這種情況下,已知變量的結果值就會攜帶信息。

  不純度的最佳評估方法是平均信息量,也就是信息熵。定義如下:設S是s個樣本數據集合。假定類標號屬性具有m個不同值,定義m個不同類C;(i=l,2,…,m)。設s:,是類C中的樣本數,對一個給定的樣本分類所需的期望信息或者信息墑為:
,

其中P為任意樣本屬于Ci的概率,并用Si/S估計。信息增益:信息增益是指期望信息或者信息嫡的有效減少量(通常用“字節(jié)”衡量),根據它能夠確定在什么樣的層次上選擇什么樣的變量來分類。假設存在兩個類P和N,并且記錄集5中包括x個屬于類P的記錄和y個屬于類N的記錄。那么,用于確定記錄集5中某個記錄屬于哪個類的所有信息量為:


  假設使用變量A作為決策樹的根節(jié)點,把記錄集s分為子類{s1,s2,…,sk},其中每個si={i=1,2,…k}中包括個屬于類P的記錄。那么,用于在所有的子類中分類的信息量為:


  假設選擇變量A作為分類節(jié)點,那么它的信息增量值一定大于其它信息增量值。變量A的信息增量為:Gain(A)=Info(S)-E(A)

  信息增益可通過下式計算:

信息量:

期望熵:

信息增益:Gain(A)=Info(p,n)-E(A)

  重復上述步驟,分別得到各個根節(jié)點,同時計算相應屬性的信息增益值。最后,根據公式計算結果得到制造企業(yè)是否需要對該潛在的流失客戶實施新的服務的決策樹,如圖1所示。

  3.5 實驗規(guī)則引導結果及實驗方法分析及評價

  遍歷決策樹,輸出葉結點類屬性值,ID3通過不斷的循環(huán)處理,逐步求精決策樹,直至找到一個完全正確的決策樹。用ID3算法構造的決策樹是從頂向下歸納,最后形成了一組類似IF……THEN的規(guī)則。其最原始的程序只是用來區(qū)分象棋中的走步,所以區(qū)分的類別只有兩種,即真或假,其屬性值也是一些離散有限的值,F在ID3算法己發(fā)展到允許多于兩個類別,而其屬性值可以是整數或實數,這里僅僅采用了它最原始的原則,提供一條基本分析思路。這種算法利用了互信息(信息增益)的概念,算法的基礎理論清晰,使得算法較簡單。該算法的計算時間是例子個數、特征個數、結點個數之積的線性函數。而且搜索空間是完全的假設空間,目標函數必在搜索空間中,不存在無解的危險?梢岳萌坑柧毨慕y計性質進行決策,從而抵抗噪音。

  但用信息增益作為特征選擇量存在一個假設,即訓練例子集中的正、反例的比例應與實際問題領域里正反例比例相同。但一般實際情況并不能保證相同,因而計算訓練集的信息增益就有偏差。ID3在建樹時,每個節(jié)點僅含有一個特征,是一種單變元的算法,特征間的相關性強調不夠。雖然將多個特征用一棵樹連在一起,但聯系還是松散的。

  正因為如此,我們在具體的客戶關系數據處理中,目前仍處于一種摸索的階段。但上述方法的探討,仍值得借鑒或進一步深人研究。

  4 結語

  本文試圖將數據挖掘技術中有最代表性的系統聚類分析法和決策樹ID3算法思路應用于制造企業(yè)的客戶流失分析,為基于制造行業(yè)的CRM的客戶流失分析做一初步的探討。對于數據挖掘遇到的個體行為數據,分別運用兩種較有代表性的數據挖掘方法進行具體實驗和理論方法分析比較。嘗試應用聚類分析和決策樹這兩種有代表的數據挖掘方法融入到制造業(yè)客戶流失管理的信息處理中,為制造企業(yè)針對不同客戶群體提供個性化服務提供一個分析思路,為未來企業(yè)信息化競爭創(chuàng)建一個良好的平臺。

CIO時代



相關鏈接:
CRM的九大好處詳解 2009-09-14
從咨詢角度做CRM 2009-09-14
客戶管理的三種境界:讓客戶口碑傳播是最高境界 2009-09-11
四步驟讓CRM重生不再成神話 2009-09-11
SaaS規(guī)模化發(fā)展需要標準化產品和服務 2009-09-11