小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

SQL Server 2012 數(shù)據(jù)質(zhì)量服務實戰(zhàn)簡介(Data Quality Services)

 imelee 2016-06-11

SQL Server 2012 數(shù)據(jù)質(zhì)量服務實戰(zhàn)簡介(Data Quality Services)

http://blog.csdn.net/niyi0318/article/details/8099493

數(shù)據(jù)質(zhì)量服務是包含在SQL Server 2012中的一個組件。我們需要安裝數(shù)據(jù)質(zhì)量服務端和客戶端,這些在sqlserver 2012的安裝文件中都可以找到。安裝服務端以后,在我們sqlserver數(shù)據(jù)庫中會出現(xiàn)3個新的以DQS開頭的數(shù)據(jù)庫

這三個數(shù)據(jù)庫分別用來存儲數(shù)據(jù)質(zhì)量服務的知識庫,總體和臨時數(shù)據(jù)。

安裝完成以后,我們可以用客戶端來打開數(shù)據(jù)質(zhì)量服務的管理界面

總體分三個大類,

知識庫的管理(Knowledge Base Management)

數(shù)據(jù)質(zhì)量項目(Data Quality Projects)

管理(Administration)

上圖為創(chuàng)建知識庫的界面,所有的數(shù)據(jù)質(zhì)量項目都是基于知識庫的,知識庫里面包含具體的“域”(Domain),針對域來設定數(shù)據(jù)清理的規(guī)則。知識庫我們可以看成是個表結(jié)構(gòu),域相當于字段。對域的規(guī)則可以是單獨字段的也可以是組合字段的。

上圖為域的管理,我們可以添加域,設置域的格式,數(shù)據(jù)類型,規(guī)則,引用等等。

當知識庫建立以后,我們需要對知識庫進行訓練(Knowledge Base Discovery),一般情況下,我們可以取小部分真實數(shù)據(jù)來對知識庫來進行訓練,訓練的次數(shù)越多,涵蓋的情況越多,知識庫也就越豐富越具體。

上圖為知識庫訓練的界面,數(shù)據(jù)源可以是excel或者SQL Server數(shù)據(jù)庫,下方設置相應的字段映射之后,就可以開始進行訓練了。訓練完之后,我們可以根據(jù)訓練的結(jié)果可以進行設置,添加域的規(guī)則,修改域的引用等操作。

當一個知識庫完成以后,我們就可以正式的使用數(shù)據(jù)質(zhì)量項目來進行數(shù)據(jù)的清理。

而且在SSIS 2012中也添加了相對應的數(shù)據(jù)質(zhì)量服務的組件,這樣我們就可以很方便在SSIS 包中使用數(shù)據(jù)質(zhì)量服務來完成數(shù)據(jù)的清洗。

當前世面上有很多行業(yè)的標準的第三方的知識庫,我們也可以直接導入這些已經(jīng)很成熟的知識庫來對我們的數(shù)據(jù)直接進行清洗,大大的方便了我們操作一致性和準確性。

 

注意:當前版本下,DQS服務端不支持卸載,需要卸載的時候,需要手動刪除那三個數(shù)據(jù)庫,兩個相對應的instance的login,master database中的一個存儲過程。

 

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多