Kettle 培训技术文档Etl 介绍ETL(Extract-Transform-Load的缩写即数据抽取转换装载的过程)对于金融IT 来说经常会遇到大数据量的处理转换迁移所以了解并掌握一种etl工具的使用必不可少Kettle是一款国外开源的etl工具纯java编写绿色无需安装数据抽取高效稳定Kettle中有两种脚本文件transformation和jobtransformation完成针对
基础部分:Pan命令来执行转换下面给出的是pan参数Kitchen 命令用于执行作业Carte 用于添加新的执行引擎Encr 加密工具Kettle的资源库和Carte的登录密码都是用Encr加密的使用中遇到的问题及总结:这两个组件用之前必须先对数据进行排序否则数据会不准确而且merge join会很慢尽量要少用这个组件默认automit false所以如果要执行一些sql必须在后面加