kettle工具使用教程

kettle工具使用教程kettle工具使用教程Kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

kettle工具使用教程

Kettle简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。(引用百度百科)

具体教程

原文链接

  1. Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)
    kettle的最新下载地址:http://community.pentaho.com/projects/data-integration/
  2. 打开kettle。
    首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
     然后打开Spoon.bat,如图所示:
     图1
  3. 建立转换。
    在文件->新建装换。
    新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
    图2
    建立数据库连接的过程与其他数据库管理软件连接数据库类似。
    注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
    ps:达梦数据库配置截图
    图3
  4. 简单的数据表插入\更新
    (1)新建表插入新建表插入
    在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
    图4
    双击拖过来的表,可以编辑表输入。
    选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
    图5
    (2)通过插入\更新输出到表。
    在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:
    图6
    编辑插入更新:
      首先:表输入连接插入更新。
        选中表输入,按住shift键,拖向插入更新。
    图7
    然后:双击插入更新,编辑它。
    图8
      到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
  5. 使用作业控制上面装换执行。
    使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
    图9
    双击start可以编辑,可以设置执行时间等等
    图10
    点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr
    图11
      最后点击运行即可。
    到这里,一个简单的通过作业调度的kettle就算做完了。

注意点

Oracle数据库历史数据同步需注意点:
表输入时,注意类型转换,不然执行同步转换步骤时会出现无效数字的情况。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/181275.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • Could not determine java version from ‘11.0.8‘

    Could not determine java version from ‘11.0.8‘

  • SAP_SD常用BAPI

    SAP_SD常用BAPI1、创建销售订单:BAPI_SALESORDER_CREATEFROMDAT22、创建退货销售订单:BAPI_CUSTOMERRETURN_CREATE3、根据销售订单生成交货单:BAPI_DELIVERYPROCESSING_EXEC4、修改外向交货单:BAPI_OUTB_DELIVERY_CHANGE5、修改内向交货单:BAPI_INB_DELIVERY_CHANGE6、交…

  • CANoe/CANalyzer诊断功能的深入理解以及CAPL诊断编程实现

    CANoe/CANalyzer诊断功能的深入理解以及CAPL诊断编程实现之前和大家分享了CANoe的基础使用(分析、仿真、测试、诊断),这篇文章将继续深入探讨如何使用CANoe/CANalyzer中的诊断功能。诊断用于在将ECU安装到系统之前或之后配置,维护,支持,控制和扩展ECU,例如,一辆车。诊断通常在请求-响应方案中执行:测试仪(客户端)向…

  • PCI,PCI-X,PCI-E

    PCI,PCI-X,PCI-EPCI-X是PCI总线的扩展架构,PCI-X频率不像PCI那样固定,而是可以随着设备的变化而变化的。PCI-X采用64位PCI总线(PCI為32bit),可以支持66,100,133MHz这些频率。而在未来,可能将提供更多的频率支持。PCI-X标准的提出主要面向服务器I/O结构。PCI-X的设计目标在于提高CPU与外设之间的传输速度,能使服务器的I/O速度提高两倍。与原来的PCI标准开发商不同的是

  • 数据挖掘在电子商务中的应用

    数据挖掘在电子商务中的应用如何对大量信息进行有效组织利用,使用户能够从大量繁杂的信息中找出真正有价值的信息和知识,帮助企业制定更好的营销策略。信息处理技术有了新的应用研究课题——数据挖掘。 1.数据挖掘在电子商务中的作用  数据挖掘技术之所以可以服务电子商务,是因为它能够挖掘出活动过程中的潜在信息以指导电子商务营销活动。在电子商务中其作用有4个方面:  (1)挖掘客户活动规律,针对性的在电子商务平台下以提供…

  • oracle并非所有变量都已绑定

    oracle并非所有变量都已绑定给Model中变量赋初始值就OK了。

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号