一、CRM系統客戶數據倉庫模型設計
數據結構圖。星型和雪花結構是在CRM系統數據倉庫中應用最為廣泛的數據結構,它們的主要優點是能夠提供多為的模式,并能實現對數據的快速查詢和連接。星型結構勢非范式的,以查詢為中心的模型,這種模型的最大優點是能夠提供所謂的星連接,通過一步連接就可以獲取大部分所需要的信息,并能很快得到輸出結果,這種模型里信息可分為兩大類:事實表和維表。
邏輯數據模型設計。邏輯模型式通用化的數據模型它的典型產品是實體關系圖,用于描述現實世界中實體和實體間的關系。
(1)客戶數據。少量的客戶數據不足以提供有關客戶偏好和消費的真實、實時的信息。從客戶數據的來源來看,客戶數據有一部分可以從企業現有的操作型系統獲取,如ERP、SCM、HR系統但這對有效的客戶智能實現是遠遠不夠的。大多客戶知識的發現需要集成至少5年甚至更長時間的客戶數據。因此,能對客戶智能起到全面支持作用的數據環境必須包括集成的客戶數據和該客戶的歷史數據。
(2)產品數據。產品數據包括下面幾個方面:產品類別信息:包括類別ID和名稱;產品價格信息:產品ID、單價等;產品材料信息:材料ID、名稱;供應商信息:供應商ID、名稱、供應價、供應日期。
(3)訂單信息數據。訂單信息包括下面幾個方面:訂單固有信息:包括訂單ID、日期等;客戶信息:包括客戶ID、名稱等;產品信息:包括產品名稱、設計屬性等。
二、數據倉庫的物理設計
(1)表空間設計。表空間設計主要是為了把邏輯意義的區分開,也為性能考慮,所以可以在表名前加前綴作為區分表所在的區。
(2)歸檔設計。由于數據在數據倉庫中的頻繁加載、刪除,以及插入的操作,如果選用歸檔模式會使數據倉庫產生大量日志。如果歸檔將嚴重影響性能,而且數據倉庫對數據恢復的要求不高,所以采用非歸檔模式。
(3)安全性設計。數據庫中所有法人用任務表全部放在一個用戶下,以方便在各個區之間加載轉換,再建一個用戶用于展現,對所有的業務表只有只讀權限。
(4)參數設計。由于數據倉庫經常刪除、插入,很少更新的特點,相對一般業務系統,加大塊的大小,增加preused和減少prefree。
(5)備份恢復。這里采用每2天一次冷備份和一周一次邏輯備份。可以接受恢復兩天前的數據,然后通過ETL重新從源數據庫中獲取最新數據。