| Kettle 是什么 Kettle 是一款國外開源的 ETL 工具,對商業(yè)用戶也沒有限制,純 Java 編寫,可以在 Window、Linux、Unix 上運(yùn)行,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定。Kettle 中文名稱叫水壺,它允許管理來自不同數(shù)據(jù)庫的數(shù)據(jù),把各種數(shù)據(jù)放到一個(gè)壺里,然后以一種指定的格式流出。Kettle 中有兩種腳本文件,Transformation 和 Job, Transformation 完成針對數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,Job 則完成整個(gè)工作流的控制。通過圖形界面設(shè)計(jì)實(shí)現(xiàn)做什么業(yè)務(wù),并在 Job 下的 start 模塊,有一個(gè)定時(shí)功能,可以每日,每周等方式進(jìn)行定時(shí)。 Kettle 的核心組件
 
 Kettle 的執(zhí)行分為兩個(gè)層次:Job(作業(yè),.kjb 后綴)和 Transformation(轉(zhuǎn)換,.ktr 后綴) 簡單地說,一個(gè)轉(zhuǎn)換就是一個(gè) ETL 的過程,而作業(yè)則是多個(gè)轉(zhuǎn)換、作業(yè)的集合,在作業(yè)中可以對轉(zhuǎn)換或作業(yè)進(jìn)行調(diào)度、定時(shí)任務(wù)等。 在實(shí)際過程中,寫的流程不能很復(fù)雜,當(dāng)數(shù)據(jù)抽取需要多步驟時(shí),需要分成多個(gè)轉(zhuǎn)換,在集成到一個(gè)作業(yè)里順序擺放,然后執(zhí)行即可。 官網(wǎng)各個(gè)版本下載地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/Kettle 是純 Java 編程的開源軟件,需要安裝 JDK,并配置環(huán)境變量,解壓后直接使用無需安裝。 需準(zhǔn)備的其他東西:數(shù)據(jù)庫驅(qū)動(dòng),如將驅(qū)動(dòng)放在 Kettle 根目錄的 bin 文件夾下面即可。 打開 Kettle 只需要運(yùn)行 Spoon.bat (win)/ spoon.sh (Linux / macOS),即可打開 Spoon 圖形工具。 如下圖,執(zhí)行   歡迎頁面 需求:把數(shù)據(jù)從 CSV 文件復(fù)制到 Excel 文件 CSV 文件輸入將 「CSV 文件輸入」拖拽到右側(cè)的工作區(qū),雙擊進(jìn)行編輯,瀏覽選擇準(zhǔn)備好的測試文件,點(diǎn)擊「獲取字段」自動(dòng)獲取 CSV 文件中表頭信息,輸入配置完成,下一步進(jìn)行輸出配置。 Excel 輸出將 「Excel 輸出」拖拽到右側(cè)的工作區(qū),雙擊進(jìn)行編輯,這步比較簡單,瀏覽選擇輸出目錄和設(shè)置文件名,完成配置。  轉(zhuǎn)換文件按住 shift + 鼠標(biāo)左鍵可以建立連接,保存轉(zhuǎn)換配置  運(yùn)行轉(zhuǎn)換 查看結(jié)果 初步了解 Kettle 核心組件及其使用
 分步操作一個(gè) HelloWrold 過程
 | 
|  |