odin_free 发表于 2009-06-12 15:15

kettle使用实录

最近工作需要研究了一下kettle的使用。
从安装说起,下了个3.2版本安装,发现不用安装。。。直接点spoon.bat报错not find the main class
郁闷极了,上他们官网论坛看看说不用安装,自己又调试.bat脚本环境变量,重新安装jdk1.6接不得要领。最后哥们过来一看,日下错包了,下的是源代码开发包,又重新下个rc包,执行kettle.exe搞定。
从设计理念来说,他属于开源的不错etl,数据流入流出都很方便,回忆起以前自己用php读数据库sqlserver,格式处理,再导入mysql那叫一个麻烦,有他就省心了,他支持多数常见的数据库类型,支持csv xml css excel等等数据格式,转化支持去重,数据联合,加行,加列,拆分,行列转换,居然还给了计算器和mail,牛逼大了。支持数据仓库的维度和联合处理,方便一大堆。
我主要就用到界面的job系统,从文件和数据库导入,处理,导入另外一个数据库,说专业了就是数据库集群的异步同步,通过trigger+kittle很容易实现了一般数据量的交互。
例子就不说了,他有个cn的html说明 说的很清楚了。
               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/476/showart_1962837.html

zzj6 发表于 2011-11-24 11:27

回复 1# odin_free


    大哥 给个下载的地址 我也想要

odin_free 发表于 2011-11-24 13:56

http://kettle.pentaho.com/

odin_free 发表于 2011-11-24 15:48

恩后来我自己手写了一个php版本数据异步同步,跟他学习的同步理念和实现机制。

shoringchow 发表于 2012-04-08 16:28

回复 1# odin_free


大哥,有相关参考资料没?最近想整这东西,不知从何下手。

   
页: [1]
查看完整版本: kettle使用实录