為了能夠讓CRM系統(tǒng)向企業(yè)決策,客戶管理等業(yè)務(wù)提供更準(zhǔn)確的數(shù)據(jù)支持,在整個(gè)項(xiàng)目生命周期中,如何從數(shù)據(jù)庫層面和業(yè)務(wù)層面,雙向?qū)?shù)據(jù)質(zhì)量進(jìn)行有效的管理和控制,從而降低臟數(shù)據(jù)對(duì)企業(yè)決策造成的影響。
決定一個(gè)CRM系統(tǒng)成敗的關(guān)鍵,往往就是數(shù)據(jù)質(zhì)量的優(yōu)劣。劣質(zhì)的數(shù)據(jù)來源不一,通過分析,其原因主要有以下幾種:
1、缺乏驗(yàn)證程序。很多系統(tǒng)沒有在初期就對(duì)用戶的輸入等過程提供完整的驗(yàn)證程序,導(dǎo)致誤輸入等因素對(duì)數(shù)據(jù)質(zhì)量造成一定影響。
2、數(shù)據(jù)格式有效但不正確。往往有些看似有效的數(shù)據(jù),但卻是錯(cuò)誤的。
3、系統(tǒng)更新。在原系統(tǒng)發(fā)生結(jié)構(gòu)性變化時(shí),如果管理員新增加了一個(gè)字段或下拉值,但是沒有及時(shí)通知相關(guān)的系統(tǒng)工程師,就會(huì)導(dǎo)致一線員工繼續(xù)使用舊的字段或下拉值去匹配新的信息類型。
4、系統(tǒng)接口過多。
5、缺乏參照完整性檢查。
6、不匹配的規(guī)則和定義。
7、維度漸變。隨著時(shí)間的推移而可能發(fā)生改變的維度,也在某種程度上影響著數(shù)據(jù)質(zhì)量。
數(shù)據(jù)質(zhì)量管理方案
據(jù)實(shí)際工作情況來看,往往當(dāng)我們檢查出臟數(shù)據(jù)時(shí),它已經(jīng)大量的存在于數(shù)據(jù)庫中了,檢查的成本高而效益低。要采用事前預(yù)防的方法,從一開始就將質(zhì)量融入到數(shù)據(jù)中,以降低臟數(shù)據(jù)的發(fā)生率。在實(shí)際項(xiàng)目中,將數(shù)據(jù)質(zhì)量的控制在宏觀上劃分為了三個(gè)階段,由于第三階段屬于數(shù)據(jù)挖掘范疇,是在建立了準(zhǔn)確,完整的數(shù)據(jù)庫基礎(chǔ)上實(shí)現(xiàn)的。
數(shù)據(jù)質(zhì)量規(guī)劃階段
完整的信息架構(gòu)在數(shù)據(jù)質(zhì)量管理中占據(jù)著重要的位置,這個(gè)架構(gòu)一定是針對(duì)業(yè)務(wù)規(guī)則建立的,且能夠靈活應(yīng)對(duì)將來可能出現(xiàn)的業(yè)務(wù)規(guī)則或數(shù)據(jù)流變更。
信息,簡要的說就是數(shù)據(jù)和知識(shí)。信息架構(gòu)的工作在本質(zhì)上就是將一些數(shù)據(jù)轉(zhuǎn)化為我們可以直觀的理解的知識(shí),或者將我們獲得的知識(shí)轉(zhuǎn)化為數(shù)據(jù),一邊可以傳遞,再利用。它應(yīng)當(dāng)是兼具兩者的設(shè)計(jì)過程。大體上應(yīng)該包含三件工作:
1、架構(gòu)設(shè)計(jì):首先我們要確定系統(tǒng)中信息的單元的大小,并決定這些單元之間的關(guān)系。
2、組織方式:將這些組件組合成有意義的,具有特色的類別。也稱為邏輯分類。
3、標(biāo)記:將上一步得到的分類用一個(gè)唯一的標(biāo)簽來命名。
數(shù)據(jù)質(zhì)量控制階段
設(shè)計(jì)質(zhì)量,即我們上面所說的質(zhì)量規(guī)劃階段,其目的是要收集質(zhì)量需求并將它們轉(zhuǎn)換為一套標(biāo)準(zhǔn)來執(zhí)行。接下來的執(zhí)行過程中,就存在著數(shù)據(jù)質(zhì)量控制的問題,宏觀上從三個(gè)方面來看:可信性、及時(shí)性、可用性。
驗(yàn)證生產(chǎn)數(shù)據(jù)的可信度要制訂即包括單變量特征也包括多變量特征的檢查規(guī)則。對(duì)于某些字段,它有可能同時(shí)存在多種約束條件,這些檢查的規(guī)則要在數(shù)據(jù)結(jié)構(gòu)確立后就明確。此外,這里還應(yīng)重點(diǎn)考慮的一項(xiàng)工作是重復(fù)數(shù)據(jù)的檢查。
結(jié)合項(xiàng)目中的實(shí)際情況來說,重復(fù)數(shù)據(jù)可以歸為兩類,一類是在數(shù)據(jù)庫中已經(jīng)存在重復(fù)的記錄,所以要將這些冗余的數(shù)據(jù)清除,或是歸檔。另一類是根據(jù)業(yè)務(wù)規(guī)則需要清洗,但并不違反數(shù)據(jù)庫的邏輯規(guī)則。
另一個(gè)重要因素就是數(shù)據(jù)流的控制。往往一些企業(yè)的CRM系統(tǒng)的數(shù)據(jù)流的來源和去向較為復(fù)雜。任何環(huán)節(jié)發(fā)現(xiàn)了臟數(shù)據(jù)先不要急于去做數(shù)據(jù)清洗,應(yīng)該順著數(shù)據(jù)流去尋找源頭,在確定從根本上修復(fù)了程序后再開始數(shù)據(jù)清洗工作。
關(guān)鍵字: 數(shù)據(jù) 質(zhì)量 方案