kettle学习笔记06—常用基本操作

旧巷老猫 提交于 2019-11-27 15:41:59

1.启动方式

Spoon.bat: 图形界面方式启动作业和转换设计器。 
Pan.bat: 命令行方式执行转换。 
Kitchen.bat: 命令行方式执行作业。

2.转换和作业

Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。 
•转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)。 
•作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,转换也是一个作业项。

3.输入步骤简介

输入类步骤用来从外部获取数据,可以获取数据的数据源包括,文本文件(txt,csv,xml,json)数据库、 Excel 文件等桌面文件,自定义的数据等。对特殊数据源和应用需求可以自定义输入插件。 例子:生成随机数步骤

4.转换步骤简介

转换类步骤是对数据进行各种形式转换所用到的步骤。例如:字段选择、计算器、增加常量

5.流程步骤简介

流程步骤是用来控制数据流的步骤。一般不对数据进行操作,只是控制数据流。 例如:过滤步骤

6.连接步骤简介

连接步骤用来将不同数据集连接到一起。 例如:笛卡尔乘积

7.输出步骤简介

输出步骤是输出数据的步骤,常见的输出包括文本文件输出、表输出等,可以根据应用的需求开发插件以其他形式输出。例如:表输出

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!