kettle使用实录
最近工作需要研究了一下kettle的使用。从安装说起,下了个3.2版本安装,发现不用安装。。。直接点spoon.bat报错not find the main class
郁闷极了,上他们官网论坛看看说不用安装,自己又调试.bat脚本环境变量,重新安装jdk1.6接不得要领。最后哥们过来一看,日下错包了,下的是源代码开发包,又重新下个rc包,执行kettle.exe搞定。
从设计理念来说,他属于开源的不错etl,数据流入流出都很方便,回忆起以前自己用php读数据库sqlserver,格式处理,再导入mysql那叫一个麻烦,有他就省心了,他支持多数常见的数据库类型,支持csv xml css excel等等数据格式,转化支持去重,数据联合,加行,加列,拆分,行列转换,居然还给了计算器和mail,牛逼大了。支持数据仓库的维度和联合处理,方便一大堆。
我主要就用到界面的job系统,从文件和数据库导入,处理,导入另外一个数据库,说专业了就是数据库集群的异步同步,通过trigger+kittle很容易实现了一般数据量的交互。
例子就不说了,他有个cn的html说明 说的很清楚了。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/476/showart_1962837.html 回复 1# odin_free
大哥 给个下载的地址 我也想要 http://kettle.pentaho.com/ 恩后来我自己手写了一个php版本数据异步同步,跟他学习的同步理念和实现机制。 回复 1# odin_free
大哥,有相关参考资料没?最近想整这东西,不知从何下手。
页:
[1]