SQL SERVER 2012 DQS 是新的功能,下面通过实例练习来实现数据净化.
1,启动DATA QUALITY CLIENT,建立一个新 KNOWLEDGE BASE,根据DQS 文件.
2,选择DOMANIN MANAGEMENT,点NEXT
所有DOMAIN已经列出,注意DOMAIN RULE,这里以EMAIL ADDRESS为例,结尾为@ADVENTURE-WORKS.COM,并且要符合REGULAR EXPRESSION.
再看上面的TITLE ENRICHMENT,它是组合DOMAIN,包括 GENDER,MARITAL STATUS,TITLE三个DOMAIN,看它的RULE,很清楚。
女性,已婚,是MRS,呵呵,不应该是 MR OR MS.
3,建立一个新DATA PROJECT,选CLEANSING,NEXT,选数据源,支持SQL和EXCEL等,然后与DOMAIN进行MAPPING,点“开始"
,,,,,,,,,,,,,,,,,,,,,,,,,,,,DQS SERVER 开始工作...........................CLEANSING
结束后,进入互动CLEANSING阶段,可以批准,拒绝,编辑,修订等等,,,,
4,最后是出口数据,根据需求,有不同选择。