pentaho之kettle篇---kettle基本操作

摘要:
打开导入并选择CSV文件导入。双击CSV文件输入图标,可以看到以下内容:步骤名称:步骤的名称,可以随意选择。原则是理解这一步骤中所做的工作。这样,您可以选择CSV格式的文件。单击以获取字段,如下图所示:单击“预览”,系统将提示您尚未输入要预览的行数。

今天先来做一个简单的kettle的例子。

打开输入,选择CSV文件输入。

pentaho之kettle篇---kettle基本操作第1张

双击CSV文件输入图标,可以看见如下:

pentaho之kettle篇---kettle基本操作第2张

步骤名称:就是你这一步的名字,可以任意取,原则就是要明白,清楚这一步是做了什么操作。

文件名:是你要选取的这个.CSV结尾的文件的名称。

列分隔符:每个CSV文件都是有一定的规则的,要么是分号是分隔符,要么是逗号是分隔符等等。

包含列头行:这个是针对你的这个CSV是否具有表头,如果有就勾上,否则他就把第一行的表头当成数据导入了。

这样选择一个CSV格式的文件之后就可以了,接下来点击一下获取字段,得到如下图所示:

pentaho之kettle篇---kettle基本操作第3张

点击一下预览,会提示要预览的行数没输入你要预览的行数就行了。

pentaho之kettle篇---kettle基本操作第4张

以上就是预览的内容了。

之后点击确定就OK了。

之后再来说说输出的操作。

这次输出的操作我们选择的是MySQL数据库,首先需要文件---->新建------->数据库连接。

pentaho之kettle篇---kettle基本操作第5张

填写上基本的数据库信息就OK了,点击测试出现

pentaho之kettle篇---kettle基本操作第6张

说明你的连库信息是正确的,点击确定就可以了。这一步的连接数据库只是针对于这个装换的。对于其他转换我们需要重新制定数据库!

双击表输出:

pentaho之kettle篇---kettle基本操作第7张

数据库连接就是我们刚才创建的数据库连接,如果不是我们想要的,可以另外再创建一个连接。

目标数据库如果没有创建的话,我们可以先写一个名字,然后再点击SQL,就出现了一个执行创建的sql的界面:

pentaho之kettle篇---kettle基本操作第8张

里面有些字段的类型是可以改的,改成你需要的字段的类型。之后点击执行就行了。这一次我们再查看一下我们数据库里面的表,就有字段了。

pentaho之kettle篇---kettle基本操作第9张

下面我们点击Run,

输出日志如下:

pentaho之kettle篇---kettle基本操作第10张

步骤度量如下:

pentaho之kettle篇---kettle基本操作第11张

之前表里面有2823个数据,所以这一次执行成功了!

但是!!!

这里面有一个问题,我们可以再Run一下这个转换,发现又导入了2823条记录。再来看看数据库里面的数据:

pentaho之kettle篇---kettle基本操作第12张

纳尼,怎么是5646???

怎么解决???

这中间是需要一个过滤的操作的,基本的思想就是:ID一样的就是Update,ID不一样的就是插入就去就可以了。

这就需要另外一个输出的功能了,就是插入/更新。

pentaho之kettle篇---kettle基本操作第13张

在这里面设置需要过滤的条件就可以了。

pentaho之kettle篇---kettle基本操作第14张

至此一个transformation就可以了。

免责声明:文章转载自《pentaho之kettle篇---kettle基本操作》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇css cross-fade()实现背景图像半透明效果Andrioid Studio生成jar, aar包下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

oracle中监听程序当前无法识别连接描述符中请求服务 的解决方法

原因如下: 你oracle安装成功后,一直未停止数据库(即数据库是启动的),客户端配置成功后,应该一直不会有什么问题。 而一旦你和我同事一样,有时把Oracle安装在虚拟机中,而且Oracle安装完毕后,没在进行任何监听的配置,则虚拟机再启动,则就会出现ORA-12514的问题。如下图       如下是解决思路: 根据出错信息判断出客户端未监听...

mysql 数据库存储路径更改

使用了VPS一段时间之后发现磁盘空间快满了。本人的VPS在购买的时候买了500gb的磁盘,提供商赠送了20GB的高性能系统磁盘。这样系统就有两个磁盘空间了。在初次安装mysql 的时候将数据库目录安装在了系统盘。(第一个磁盘)使用了一段时间之后数据库存储量变大,快将20GB的存放空间占满了。因此必须将存放数据空间换地方了。嘿嘿下面是简单的操作了,不合理之处...

oracle 数据库备份 cmd 命令

语句:exp SDE/SDE@IP:1521/orcl FILE=C:数据库备份sde%date:~0,4%%date:~5,2%%date:~8,2%.dmp  COMPRESS=y direct=y log=C:数据库备份logsde%date:~0,4%%date:~5,2%%date:~8,2%.log 在这里主要要保证C盘下有数据库备份和数据库备...

centos7安装配置mysql8

 centos7安装配置mysql8 第一步:下载mysql 百度云下载地址:链接:https://pan.baidu.com/s/1HPG0Yju9wd9T2VULZIb03g    提取码:z299 第二步:查找并卸载原有的mysql数据库        1、 使用rpm -qa | grep mysql 命令查找mysql数据库软件包及依赖包,若没有...

解读SQL 内存数据库的细节

相信大家对内存数据库的 概念并不陌生,之前园子里也有多位大牛介绍过SQL内存数据库的创建方法,我曾仔细 拜读过,有了大致了解,不过仍有很多细节不清晰,比如: (1)内存数据库是把整个数据库放到内存中的吗? (2)数据都在内存里面,那宕机或者断电了,数据不是没有了吗? (3)据在内存是怎么存放的,还是按照页的方式吗,一行的大小有限制吗? (4)内存数据...

MySQL、MongoDB、Redis 数据库之间的区别

NoSQL 的全称是 Not Only SQL,也可以理解非关系型的数据库,是一种新型的革命式的数据库设计方式,不过它不是为了取代传统的关系型数据库而被设计的,它们分别代表了不同的数据库设计思路。 MongoDB:它是一个内存数据库,数据都是放在内存里面的。对数据的操作大部分都在内存中,但MongoDB并不是单纯的内存数据库。MongoDB 是由 C++...