kettle

3.kettle-定时执行任务

三世轮回 提交于 2019-12-02 19:14:25
kettle定时任务可以 用两种方法。 第一种 如下,但这种缺点也很明显,就是该job窗口不能关闭。(重复时间含义问题截图来自 https://www.cnblogs.com/biehongli/p/10241227.html ) 第二种 ,kettle中调度kitchen.bat定时执行任务 参照网址: https://blog.csdn.net/maenlai0086/article/details/80590523 我写的bat文件(autoexceKettle.bat): @rem 进入 Kitchen.bat所在目录 D: cd D:\Program Files\pdi-ce-8.2.0.0-342\data-integration\ @rem 作业(job)文件路径和日志文件路径 @rem 执行kitchen执行job,并写入日志 kitchen.bat /file:D:\kettle\all-Job.kjb /level:Basic>>D:\kettle\log\kettle_%date:~0,4%%date:~5,2%%date:~8,2%.log 然后设置windows自带的定时任务,定时执行autoexceKettle.bat这个bat文件就可以了。 在D:\kettle\log\可查看日志(每天生成一个): windows2008创建自动任务: 来源:

Kettle 入门

笑着哭i 提交于 2019-12-02 10:31:37
1 概述 1.1 什么是 Kettle? Kettle 是一款开源的 ETL 工具,纯 Java 编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。 1.2 Kettle 工程存储方式 以 XML 形式存储 以资源库方式存储(数据库资源库和文件资源库) 1.3 Kettle 的两种设计 1.4 Kettle 的组成 1、勺子(Spoon.bat/spoon.sh): 是一个图形化的界面,可以让我们用图形化的方式开发转换和作业,Windows 选择Spoon.bat,Linux 选择 spoon.sh 2、煎锅(Pan.bat/pan.sh): 利用 Pan 可以用命令行的形式调用 Trans 3、厨房(Kitchen.bat/kitchen.sh): 利用 Kitchen 可以使用命令行调用 Job 4、菜单(Carte.bat/ Carte.sh):Carte 是一个轻量级的 Web 容器,用于建立专用、远程的 ETL Server 1.5 Kettle 的特点 2 安装部署 官网地址 https://community.hitachivantara.com/docs/DOC-1009855 下载地址 [https://sourceforge.net/projects/pentaho/files/Data%20Integration/]

用Kettle的一套流程完成对整个数据库迁移

与世无争的帅哥 提交于 2019-12-02 10:19:17
需求: 1.你是否遇到了需要将mysql数据库中的所有表与数据迁移到Oracle。 2.你是否还在使用kettle重复的画着:表输入-表输出、创建表,而烦恼。 下面为你实现了一套通用的数据库迁移流程。 技术引导: 实现之初,在kettle提供的例子中找到了一个类似的(samples\jobs\process all tables)。 通过相关改造,终于达到目标。 实现过程解剖: 整套流程分为:2个job,4个trans。 使用到的Trans插件:表输入、字段选择、复制记录到结果、从结果获取记录、设置变量、自定义java脚本、表输出。 1.大job。 2.要迁移的源库表名称获取,并设置到结果集,为下面的job使用。 注意: 针对MySql,以上“ 表输入 ”的SQL语句为 show tables,但是该语句查询出的结果包含视图(View),因此后续步骤向该语句查询出的表中插入数据时会报错。 如果所要迁移的库中存在视图,可以使用以下语句来查询所有需要迁移的表: select TABLE_NAME from information_schema. TABLES where TABLE_SCHEMA = '数据库名' and TABLE_TYPE = 'BASE TABLE' 3.配置子job为前面的每一条记录(即每个表)执行一次该子job 4.下面是子job。 5.获取记录中的表名称

kettle下载安装使用教程

荒凉一梦 提交于 2019-12-02 03:12:12
Kettle简介 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。 1、Kettle的下载与安装(本文使用kettle版本为pdi-ce-7.1.0.0-12)点击下载地址 官方网站 2、下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可。然后打开Spoon.bat,如图所示: 因为,运行spoon在不同的平台上运行spoon所支持的脚本: Spoon.bat:在Windows平台上运行spoon; Spoon.sh:在Linux、AppleOSX、Solaris平台上运行Spoon。 3、初步启动和使用 可能 出现的问题总结 因为是纯java编写要安装jdk配置环境变量 如果启动还报错 ERROR:could not create the java virtual machine!

spoon(kettle)基本配置(链接Mysql和Oracle)

青春壹個敷衍的年華 提交于 2019-12-02 02:38:31
1、下载spoon包和驱动 我所使用的spoon包,包括spoon7.1、Mysql驱动和Oracle驱动 链接:https://pan.baidu.com/s/16Q-iUNB7qGU0xlKbGTw-vg 提取码:q9h5 如果自己本地已安装Oracle数据库或者oracle客户端,可以使用其自带的Oracle驱动, 在目录 ..\product\11.2.0\dbhome_1\jdbc\lib 下的所有ojdbc开头的jar包 2、双击spoon.bat打开spoon主页面 点击左上角'文件',新建一个转换,配置数据连接(以mysql数据库为例) 选择左侧工作区的‘主对象树’,选择DB连接,右击选择新建,输入配置信息 如果数据库在本地,主机名可写localhost,如果不在本地要写数据库所在主机ip 点击测试,出现下面的弹框,则说明配置正确 Oracle数据库连接可参考以下配置: 来源: https://www.cnblogs.com/mynsfm/p/11726335.html

达梦数据库连接Kettle

99封情书 提交于 2019-12-02 00:02:30
达梦数据库连接Kettle,首先将达梦的jdbc(在达梦的安装目录/jdbc/下)放到kettle的对应文件夹中(/libext/jdbc/下),由于kettle没有开发达梦数据库的对应连接方式,因此用普通的连接方式(generic database)来连接达梦数据库,输入url:jdbc:dm://localhost/DMSERVER,驱动:dm.jdbc.driver.DmDriver,用户名和密码,测试一下会发现连接端口不是5236而是1152,不用过问这个东西,这是普通连接使用的端口。亲测可用 对了,达梦的jdbc有几个版本,其中jdk为1.7的使用jdbc14的版本,jdk为1.8的使用jdbc16的版本。如果使用还不行,可以多试试。我就在这方面纠结了一天,总是报错: 因为错误不能提取数据库信息,Unable to get list of procedures from database meta-data:。更改一下jdbc的版本就可以了。 也可以写一个DM的连接方式,就是将普通链接的代码更改一下,百度文库有这个介绍,介绍的还是很详细的,可以参考。 来源: CSDN 作者: weizhiying 链接: https://blog.csdn.net/weizhiying/article/details/44489105

Kettle连接达梦数据库

一曲冷凌霜 提交于 2019-12-02 00:01:18
实习的公司,要将原先的oracle数据库迁移到国产的达梦数据库中,用的kettle,不知道的可以百度一下,这里简单介绍一下,kettle如何连接达梦数据库: 下载最新版的kettle(我的是5.1.0) 将达梦的jdbc驱动复制黏贴到 [kettle安装目录]\data-integration\lib 下 在数据库连接中,点击新建,填入如下参数: 点击测试,验证成功后,点击确认即可。 来源: CSDN 作者: 箫声若紫烟 链接: https://blog.csdn.net/young_kim1/article/details/47860233

kettle的用法

泄露秘密 提交于 2019-12-01 13:44:19
一: 从一个数据库导入表的数据到另一个 数据库的表中(表数据同步) 1:在 主对象树-- DB连接 中新建 连接: 在选项中 设置字符集: 2: 在 核心对象中 先增加一个 表输入: 再增加一个 插入/更新:把 2.0test_mogu_db 数据库 中的 gpms_score 表 的所有数据都查出来, 插入到 pre_graduation 库的 gpms_score 表中: 插入/更新操作 的 表字段是 目标库 pre_graduation 的 表字段, 流字段是第一步输入的流。 上面的 是主键,下面的是需要插入的字段。 来源: https://www.cnblogs.com/z360519549/p/11688938.html