Informatica 简单使用

摘要:
映射是Informatica的映射,即ETL的规范,包括源、目标和过程的设计。① 要将导入的文件放置在服务器目录中,请首先在informationa控制台上设置目录。

1. Informatica简介

① Repository manager 主要用来维护资料库的目录,对象,建完对象可以创建demo的folder。

② Administration Console是完全基于web的,管理所有的节点,服务,在里面包括资料库的一些用户,权限等信息。

③ Designer主要用来设计mapping。Mapping是informatica的一个映射,也就是说是ETL的一个规范,包括对源,目标,过程的设计。

④ workflow主要用于将mapping实例化,也就是设计一个session,如果session很多的话需要将它们设计成一个串行或者并行的过程,它们组成的session就叫做workflow,即工作流。

⑤ workflow monitor用来监控、执行workflow。

⑥ 控件:Source Qualified Transformation:ETL经常会用到的组件,对数据源,包括文件,也包括数据表进行抽取。无论数据源是表还是平面文件源,都会用到该组件。

2. 新建带过滤条件的workflow

D:

① 选在source,import source ,odbc data source中选择oracle的odbc设置,如果没有,要在管理工具中自行设置,具体如图。

 Informatica 简单使用第1张

② 同理,在target中设置目标数据表的连接,然后设置mapping,设置成功之后,转入w中设置工作流,

W:

① 在edit task->mapping中,source和target分别要设置源和目标的连接驱动。

② 在edit task->properties->parameter filename里面写入参数所在文件夹的地址(该参数在服务器的目录下,是事先设定好的文件)。

③ 在左项目条件source 中,edit task->mapping->source filter里面写入过滤的参数条件。

④ 在左项目条件target中,edit task->mapping->pre SQL里面写入执行前的更新数据表语句。

注意事项:

目标表的的数据表如果带有系统目录前缀,在设置mapping的连接条件时将无法识别前缀,因此没有办法传输数据。

3. 在Designer中设置过滤参数问题

① 设置参数之后,参数的默认值是字符如图,M中运行结果错误,无法解析参数,数据没有被导入。

 Informatica 简单使用第2张

4. 往GP数据库中导入平面文件源。

① 要将所导入的文件放入服务器的目录下,先在informatica控制台设置目录。

 Informatica 简单使用第3张

② 设置workflow时,在source里设置如下目录,其中source filetype包含两种情况,Direct设置如下图

 Informatica 简单使用第4张

③ indirect方式是选择表名列表文件,按文件列表运行。

 Informatica 简单使用第5张

5. 设置同时将两个表导入一个数据表中的workflow

6. 两个并无关联的mapping一起运行

① 在target load plan里面设置mapping运行的先后顺序。

7. 带expression Transformation组件的workflow

① 导入源表

② 手工创建目标表,可以在target菜单中选择great创建,也可以复制目标库中类似的表进行修改。前提是目标库中存在这样的表。

③ 手工创建目标表,target菜单下,generate/execute SQL

④ Filtertransformation组件:过滤组件将传到目标表的数据进行筛选,过滤。过滤不能对原来的表字段进行修改。值改变传递值的行数。

⑤ Expression Transformation组件:不改变抽取数据的行数,是被动的函数组件。不能实现汇总级的函数的操作。执行的先后顺序,先执行input,后执行valuable,valuable相当于一个局部的变量,按照顺序执行,后执行output。

⑥ Reusable Transformation组件:

8. Workflow的调度方式

① 手工执行(现在都是在手工执行)

② Workflow scheduler(调度程序调度)

③ pmcmd startworkflow

④ command task

⑤ worklet

9. informatica语法规则

① 输入的字符用 单引号 扩起来,连接字符用 || ,基本跟oracle保持一致。

② DECODE(IN_GENDER, 'M', 'MALE', 'N', 'FEMALE', 'UNK')

DECODE(TRUE,

IN_AGE < 20, 'LESS THAN 20',

IN_AGE  >= 20  AND  IN_AGE <= 29,  '20 TO 29',

IN_AGE  >= 30  AND  IN_AGE <= 39,  '30 TO 39',

IN_AGE  >= 40  AND  IN_AGE <= 49,  '40 TO 49',

IN_AGE  >= 50  AND  IN_AGE <= 60,  '50 TO 60',

IN_AGE  >  60, 'GREATER THAN 60'

)

DECODE(字段名, '条件1', '返回值1', '条件2', '返回值2', '缺省值')

免责声明:文章转载自《Informatica 简单使用》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇仿射变换及其变换矩阵的理解G代码简单解释下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

iptables禁止端口和开放端口

1、关闭所有的 INPUT FORWARD OUTPUT 只对某些端口开放。 下面是命令实现: iptables -P INPUT DROP iptables -P FORWARD DROP iptables -P OUTPUT DROP 再用命令 iptables -L -n 查看 是否设置好, 好看到全部 DROP 了 这样的设置好了,我们只是...

C# 将日期转换为时间戳(日期与时间戳互转)

public static class AbpExtensions { /// <summary> /// 返回10位时间戳 Timestamp /// </summary> /// <param name="target"></param> /// <retur...

【 linux编程 】 Makefile

Makefile:跟我一起写Makefile:https://seisman.github.io/how-to-write-makefile/overview.htmlMakefile中的include命令详解https://www.cnblogs.com/cuckoos/articles/5049984.html一 什么是makefile一个工程中的源文...

(转)SQLSERVER表分区的介绍(一)

下面进入正题吧,很多时候当单张数据表的数据量比较大的时候比如千万级别条记录、上亿级别记录,如果不做优化,那么查询的效率大家清楚。 有经验的人会通过各种手段做优化,其中表分区就是其中一种手段。 个人对表分区的口语化解释:把一张表分成几个区域 例如:一张业务表,有一个字段是月份或者年份,那么可以按照月份/年份来分区,当客户要查询某个月份/年份的数据的时候就到那...

自动化运维管理平台设计

      互联网发展到如今,对于一般企业线上线下机器成千上万数量级已经是司空见惯。对于运维人员来说,手动去管理那一万台机器,简直就是无法完成的任务。随之而产生的 是运维自动化,帮助运维人员管理监控那一堆跑着各种各样服务的机器。其实,到了今天这种地步,运维自动化早就是一种家常便饭的事情。开源社区或者是商业软件有非常多监控、运维管理平台。但是,就像穿衣服一样...

(转)PHP正则表达式匹配嵌套HTML标签的方法和技巧

正则表达式是一个非常有用的编程技能。一般来说,简单的抓取一个HTML页面的某一条信息,比如<title>标题</title>,是很容易实现的。但是,我们往往要抓取某一个列表页面里的多个重复的<div></div>块里的特定内容,并且<div></div>块还有嵌套的使用,我们抓取的则是...