分析型数据库 - Teradata - 《数据开发与治理平台Easydata用户手册-V9.0 Update04》

Teradata

更新时间: 2025-05-20 15:40:21

离线同步任务支持Teradata数据源，支持该数据源的抽取（Reader）和导入（Writer），当前支持的版本为：16.20.25.00。

在使用之前需要在项目中心（新）完成Teradata数据源的登记并测试通过。
数据源登记过程中，需要填写如下信息：

数据源名称：Teradata数据源的名称
归属项目：由于元数据中心是项目组级别，因此此处支持选择项目组下的项目，默认为当前项目名称
数据源标识：仅允许包含英文小写、数字、下划线，只允许英文小写开头，最大长度为64个字符。平台内唯一，保存数据源后数据标识不可修改
负责人：默认为当前创建人员
协助管理员：同负责人，有该数据源的管理权限，包括编辑、设置“源系统账号映射”。可在安全中心为自己或其他人设置该数据源的使用权限
数据源连接：根据jdbc:teradata://SeverIP/DATABASE={database},DBS_PORT={port}格式进行填写
用户名：填写访问数据源的用户名
密码：填写用户名所对应的密码
自定义属性：支持添加数据源的其它配置

唯一性校验规则：基于数据源连接+用户名进行校验。

数据源配置完成后，需点击测试连接按钮进行测试，测试通过后才可使用。

除了数据源需要准备之外，进行离线同步任务创建和数据源的使用都需要在安全中心-功能权限中添加相应的权限（可参考数据传输权限、元数据中心权限)。

以Teradata to Hive为例，在数据来源端选择Teradata数据源类型及数据源名称，选择需要进行读取的表。

数据过滤支持条件、流水型及自定义。

条件型：按列设置过滤规则，可添加一或多组条件，条件默认为AND关系。
流水型：从选择字段的起始值开始读取数据，读取到最新记录位置，下次从上次的最新记录读取至当前的最新记录。流水型数据过滤方式生效满足以下条件：1. 选取的字段是单调递增的；2. 离线开发任务提交到线上调度执行。
自定义：填写where过滤语句（不含where关键字），通常用作增量同步，支持系统参数和参数组参数。

特殊字符替换、并发读取、流量控制根据实际情况进行填写。

以Hive to Teradata为例，当Teradata作为数据去向时，除了需要填写数据源类型、数据源等基础信息之外，还可以填写PreSql和PostSql。

PreSql：导入数据前执行的SQL语句，例如清除旧数据；目前向导模式仅允许执行五条SQL语句，多条SQL语句通过“;”分隔，最大长度为2000个字符。
PostSql：导入数据后执行的SQL语句，例如加上某一个时间戳；目前向导模式仅允许执行五条SQL语句，多条SQL语句通过“;”分隔，最大长度为2000个字符。

Teradata支持INSERT（追加）写入规则，支持流量控制配置。