1. 定義商業問題
每一個CRM應用程序都有一個或多個商業目標,為此你需要建立完全不同的模型。
2. 建立行銷數據庫
數據準備和模型建立之間可能反復進行,因為你從模型中學到新的東西,而這又要你修改數據。如果你想獲得良好的模型,在你建立行銷數據庫的時候,你好需要對它進行凈化。你需要的數據可能在不同的數據庫中,如客戶數據庫,產品數據庫以及事務處理數據庫。這意味你需要集成鞏固數據到單一的行銷數據庫中并且去除來之多個數據源的數據在值商的差異。沒有恰當進行數據值差異的數據是質量問題的主要來源。在多個數據源中出現的較大差異主要在數據定義和使用的方法上。數據值的一些矛盾是很容易發現的,如同樣的客戶有幾個不同的(不同的系統正在使用)的地址;但還有一些如同一個客戶有不同的名字,更糟的是有不同的客戶識別編碼。
3. 研究數據
在建立良好的預測模型之前,你必須理解你使用的數據的含義。通過聚集各種數據摘要(如平均值、標準偏離)和關注數據描述開始進行研究數據。你可能為多維數據建立交叉表格。圖像化和可視化工具是數據準備中的所必需的,但它們對數據分析的重要性卻不能過分強調。數據可視化常產生導致新的洞察力和成功的內容。一些非常有用的普偏的數據顯示是柱狀圖,它顯示了數據值得分布情況。你也可以看到不同參數的二維獲三維的散點圖。這種增加第三變量的能力極大地提高了一些圖形的可用性。
4. 為建模準備數據
這是建立模型之前的數據準備的最后一步。這一步中主要有四個主要的部分:
首先,你要為建立模型選擇變量。理想情況是:將你擁有的所有變量加入到數據采集工具中,找到那些最好的預測。但在實際中,這是非常棘手的。其中一個原因是建立模型的時間隨著變量得增加而增加。另一個原因就是盲目性,包括無關緊要的數據列被加入,卻很少甚至不能提高預測能力。
下一步是從原始數據中構件新的預測依據。例如預測信用風險使用使用債務收入的比率而不是單獨使用債務和收入作為預測依據的變量可以產生更準確的結果并且更容易理解。
接著,你需要從數據中選取一個子集或標本來建立模型。即使你有許多數據;然而使用所有的數據會花費太長的時間或者需要買更好的硬件,但你并不愿意如此。使用恰當的隨機挑選的子集并不會產生CRM問題的信息的不足。建立模型的兩種選擇為:使用所有得數據建立一個模型或者建立多個以數據標本為基礎的模型;后者常常能幫助你建立更準確有力的模型。
最后,你需要轉換變量,使之和你選定用來建立模型的運算法則一致。
5. 數據采集模型的建立
關于模型建立的需要記住的最重要的就是模型建立是一個迭代的過程。你需要研究可供選擇的模型,從中找到過解決你的商業問題最有用的。在你探究一個好的模型過程中獲悉的知識或許要求你回頭修改你正在使用的數據甚至修改你的問題的陳述。
大多數CRM應用程序都給予一種叫做被監督學習的協議。你開始使用客戶信息,而且要求產生的結果是已知的。例如,你有來自以前的郵件列表的歷史數據,它與你現在使用的數據非常相似。或者,你可能不得不進行郵寄測試來確定人們對一個提議的響應如何。你將數據分為兩組,使用第一組來培養建立或評估你的模型,接著使用第二組數據來測試模型。當培養和測試周期完成之后,模型也就建立起來了。
6. 評價模型
評價模型結果的方法中,最可能產生評價過高的基準就是精確性。假設你有一個提議僅僅有1%的人響應。模型預測“沒有人會響應”,這個預測99%是正確的,但那確實100%的無效。另一個常使用的基準“提高多少”,這用來衡量使用模型后完成的改進有多大,但是它并沒有考慮成本和收入。
7. 將數據采集運用到CRM方案中
在建立CRM應用中,數據采集常常是整個產品中很小的但意義重大的一部分。例如:以數據采集為基礎預測模式可能將各個領域專家的知識結合在一個很大的被許多類型的人使用的應用程序中。
數據采集被實際建立在應用程序中的方式由你的客戶交互作用的本質所決定。你與客戶的交互作用的兩種方式:客戶主動聯系你(inbound)或者你主動聯系他們(outbound)。這時數據采集展開的需求是完全不同的。
后一種方式的特征有你的公司所決定;因為聯系活動是由你的公司發起,例如直接郵寄活動。結果,通過運用模型到你的客戶數據庫,你選擇客戶進行聯系。Outbound商業活動的另一種類型是廣告活動。這用情形下,你對由模型顯示的具有良好前景的特征和你的廣告可以影響的人的特征進行匹配。
在inbound事務中,如電話定購,Internet訂購,客戶服務呼叫等,應用程序必須實時響應;因此數據采集是內含在這種應用程序中的并且積極地做出推薦動作。
無論哪一種情形,在運用模型到新數據中你必須處理的一個關鍵問題是你在建立模型中的使用數據轉換。如果在無論來自事務處理還是數據庫的輸入數據中包含了年齡、收入、性別字段,但是模型需要的年齡收入比率和性別已經改變為二元變量,因此你必須轉換輸入數據。當你想快速展開大量模型時,不費力的插入這些轉換數據就變成了最重要的生產力因素。