详解kettle工具记录集连接功能及实验测试

概述

今天主要介绍下kettle的记录集连接功能和一些注意点。


一、什么是记录集连接

记录集连接可以实现数据集合的关联,也分为内连接,左连接,右连接,外连接。

多表的join,可以直接用sql写入【表输入】组件,也可以借助kettle提供的【记录集连接】组件,使用kettle的记录集连接组件,首先必须要两个输入数据集是有序的,并且是根据需要join的字段排序,可以借助kettle的【排序记录】组件。

步骤:

1:首先根据【排序记录】组件将两个数据集需要join的字段进行排序。
2:使用记录集连接组件对数据集进行排序。

注:

1:第一个步骤为连接的主表
2:连接类型分为,内链接,左外连接,右外连接,全外连接。
3:两个步骤的连接字段必须和排序记录中的名称一致。

其他:

1:步骤名称:在单一转换中名称必须唯一。
2:第一个步骤:指定要合并的第一个输入步骤。
3:第二个步骤:指定要合并的第二个输入步骤。
4:连接类型:选择合并可用的类型。
5:连接字段:指定要做关联的字段。

二、记录集连接实验

需求:将A表(code,部门,指标)、B表(code,部门,核心内容)组合输出结果:S表(code,部门,指标,核心内容)

1、准备A表、B表

A表:

详解kettle工具记录集连接功能及实验测试

B表:

详解kettle工具记录集连接功能及实验测试

2、kettle流程

详解kettle工具记录集连接功能及实验测试

其中以code进行排序,注意AB两张表的code都是不重复的

详解kettle工具记录集连接功能及实验测试

详解kettle工具记录集连接功能及实验测试

3、结果:

详解kettle工具记录集连接功能及实验测试


觉得有用的朋友多帮忙转发哦!后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~

详解kettle工具记录集连接功能及实验测试

相关推荐