位置：首页>> 网络编程>> 网络编程>> Kettle下载与安装保姆级教程(最新)

Kettle下载与安装保姆级教程(最新)

作者：亭子下的李子　　发布时间：2023-07-29 17:10:41　

标签：Kettle,安装,配置,下载

Kettle简介

Kettle最早是一个开源的ETL（Extract-Transform-Load的缩写）工具，全称为KDE Extraction, Transportation, Transformation and Loading Environment。后来Kettle重命名为Pentaho Data Integration 。
它由Java开发，支持跨平台运行，其特性包括：支持100％无编码、拖拽方式开发ETL数据管道；可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源；支持ETL数据管道加入机器学习算法。
Kettle是一个实现ETL开发的一款开发工具，Spoon是Kettle工具提供的图形化界面。

主要功能

Pentaho Data Integration作为一个端对端的数据集成平台，可以对多种数据源进行抽取(Extraction)、加载（Loading）、数据落湖（Data Lake Injection）、对数据进行各种清洗（Cleasing）、转换（Transformation）、混合（Blending），并支持多维联机分析处理（OLAP）和数据挖掘（Data mining）。

运行环境

Pentaho Data Integration服务器端支持：Windows Server, CentOS, RHEL, Ubuntu
Pentaho Data Integration开发客户端（Spoon）支持：Windows, Ubuntu Desktop, MacOS
Pentaho User Console（浏览器端）支持：Internet Explorer, Chrome, Firefox,
Safari, Edge

Kettle下载

下载地址：

Kettle是一款免安装软件，下载后即可直接运行，Kettle官网

官网的下载速度比较慢，大家也可以从我分享的百度云下载（版本是7.1）

链接: https://pan.baidu.com/s/1gatm2AqffltRrHxhLALcwQ?pwd=abtv
提取码: abtv

Kettle下载安装pdi-ce-7.1.0.0-12教程

kettlespoon脚本之家下载

运行Kettle

因为Kettle是纯java编写，所以启动前要先预装JDK并配置环境变量。
Windows下双击Spoon.bat文件运行Kettle，打开spoon图形工具。
在Linux、AppleOSX、Solaris平台上，双击Spoon.sh运行。

当出现下图所示，则说明启动成功。

导入数据库驱动jar包

看你需要连接什么数据库，就将数据库的驱动jar包放到xxx\pdi-ce-7.1.0.0-12\data-integration\lib目录下，重启spoon即可。

Oracle/Mysql驱动下载链接：

链接: https://pan.baidu.com/s/13KkL5sAjtoEebs3X7TWoMQ?pwd=n6hf
提取码: n6hf

Kettle使用

配置资源库与数据库

现在让我们重新双击Spoon.bat，运行Kettle工具。
点击右上角的connect标志，出现弹窗（如下图），点击Other Repositories。

在新的弹窗中选择Database Repository选项，点击Get Started。

输入资源库名称（自定义），点击Database Connection创建数据库连接。

点击创建新的数据库连接。

这里左侧有5种连接方式，按自己需求进行选择，默认选一般；数据库连接名称（自定义）；数据类型，什么数据库就选什么，我这里是连接Oracle数据，所以选择Oracle；
连接方式，默认选第一个；最后再将你的数据库连接信息（IP，端口，库名称，用户名和密码）填写上就OK。

填好后，点击测试按钮，出现如下图的弹窗即连接成功，然后点击确定按钮。

可以看到刚刚连接的数据库sourceDB，这里我是创建两个数据源，通过点击新增按钮可以创建多个数据源连接。
选中数据源，即可对其进行编辑，删除操作。
最后点击Back返回。

点击Finish按钮，即可。

创建成功，选中Connect Now。

进入登录页面，默认是admin用户，密码也是admin，启动后可以修改用户密码或添加其他用户。

注意事项：这里在配置数据源时，虽然成功了，但是在后面创建作业选择数据库时，可能出现刚刚配置的数据库不见了，可以在创建作业后，再重新配置一下数据库（如下图）。具体原因还不清楚

修改、添加用户信息

点击工具–>资源库–>探索资源按钮，或者直接点击下图红色框中的图标。

选择安全按钮，即可新增、编辑、删除用户信息。

好啦，以上就是Kettle的安装配置教程，后面会再出一个Kettle使用教程。

来源：https://blog.csdn.net/weixin_43407520/article/details/123593474

0

投稿

猜你喜欢

python使用pandas读写excel文件的方法实例
引言现在本地创建一个excel表，以及两个sheet，具体数据如下：sheet1： sheet2:读取excel文件pandas.
使用 prometheus python 库编写自定义指标的方法(完整代码)
虽然 prometheus 已有大量可直接使用的 exporter 可供使用，以满足收集不同的监控指标的需要。例如，node exporte
Vue.js 中取得后台原生HTML字符串原样显示问题的解决方法
今天使用vue调试页面，发现了页面上的一个问题，后台数据传过来的HTML字符串并没有被转换为正常的HTML代码，一拍脑门，发现忘记转换了，于
使用Python对Excel进行读写操作
学习Python的过程中，我们会遇到Excel的读写问题。这时，我们可以使用xlwt模块将数据写入Excel表格中，使用xlrd模块从Exc
基于Numba提高python运行效率过程解析
Numba是Python的即时编译器，在使用NumPy数组和函数以及循环的代码上效果最佳。使用Numba的最常见方法是通过其装饰器集合，这些
gVim, gVim Easy, gVim Read-only 的简单区别
我在Window XP中安装了Gvim7.2，然后桌面上出现了三个快捷方式，gvim72.exe,gvim read-only,gvim e
Python 序列化 pickle/cPickle模块使用介绍
Python序列化的概念很简单。内存里面有一个数据结构，你希望将它保存下来，重用，或者发送给其他人。你会怎么做？这取决于你想要怎么保存，怎么
python正则表达式匹配IP代码实例
这篇文章主要介绍了python正则表达式匹配IP代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的
Django web框架使用url path name详解
quicktool/view.py文件修改视图函数index()，渲染一个home.html模板from django.shortcuts
对Python发送带header的http请求方法详解
简单的header import urllib2request = urllib2.Request('http://example.
asp Response.flush 实时显示进度
写程序的人在编写由asp页面生成静态页面html的时候，如果同时生成大量页面，一定遇到过浏览器下方的进度条上显示着3％，6％，10％等缓慢增
Python远程开发环境部署与调试过程图解
这篇文章主要介绍了Python远程开发环境部署与调试过程图解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需
MySQL的存储过程写法和Cursor的使用
本文中介绍了一个MySQL的存储过程，其中涉及Cursor的使用，示例如下：CREATE PROCEDURE `justifyGroupNu
python获取指定网页上所有超链接的方法
本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下：这段python代码通过urllib2抓取网页，然
Python如何使用vars返回对象的属性列表
英文文档：vars([object])Return the __dict__ attribute for a module, class,
对python中的控制条件、循环和跳出详解
对python中的控制条件、循环和跳出详解代码缩进(代码块)：python用缩进表示代码块，没有其他语言的大括号缩进是强制检查，整个代码缩进
Python文件及目录操作实例详解
本文实例讲述了Python文件及目录操作的方法。分享给大家供大家参考。具体分析如下：在python中对文件及目录的操作一般涉及多os模块，o
浅谈Python2、Python3相对路径、绝对路径导入方法
os.path.dirname() 获取父目录os.path.basename() #获取文件名或者文件夹名python2缺省为相对路径导入
python中数组和列表的简单实例
#环境win64+anaconda+python3.6list & array（1）list不具有array的全部属性（如维度、转置
Mysql允许外网访问设置步骤
1、打开mysql.exe(MySQL Command Line Client)，输入密码2、输入：use mysql;3、查询host输入

HTTP头信息总结

Git远程操作详解

解决在pycharm运行代码,调用CMD窗口的命令运行显示乱码问题

2019-nCoV 全国新型肺炎疫情每日动态趋势可视图

numpy.sum()的使用详解

编程知识点(1)关键词之存储类型

pytest解读fixtures之Teardown处理yield和addfinalizer方案

Pyqt+matplotlib 实现实时画图案例

pytorch实现mnist分类的示例讲解

油猴脚本编写教程详解

Windows7系统更改用户账户图片的2种方法（图文教程）

另一个伊甸超越时空的猫钻石怎么分配使用

Word制作：工作证明，零基础自学办公软件

我的起源木制储物箱怎么做_木制储物箱属性及制作配方分享

安装完Python包然后找不到模块的解决步骤

Java中抽象类和接口介绍

Bootstrap图片轮播效果详解

升级Win11后触摸屏不能用了怎么解决？触摸屏不能用解决方法

python实现根据月份和日期得到星座的方法

在Windows PC上设置并运行iCloud图文教程

手机版 网络编程 asp之家 www.aspxhome.com