更新合辑(2025年)
版本:v7.15.2
新增功能1.【离线开发】转交任务支持设置是否审批
- 功能介绍:
- 在离线开发-设置-项目配置-基础配置-转交任务设置中,支持选择是否开启转交任务审批。开关对当前项目下所有集群生效,用于控制在离线开发-批量操作 和 任务运维中心-任务列表 转交任务时是否需要审批。开关如果开启,所有任务转交均需要提交审批,审批通过后才可转交。
- 审批流程默认为一级审批,审批人为新负责人,支持在流程协作与通知中心修改审批流程。
- 转交任务发起审批工单时,会校验新负责人是否拥有任务的全部权限,如否的话会在转交任务结果中做出提醒,但不会阻断发起审批工单。同时,在转交任务结果-原因列,支持点击快捷前往查看工单。
功能详细使用步骤:
离线开发-设置-项目配置-基础配置-转交任务设置:选择是否开启转交任务审批
批量操作-转交任务:批量触发创建转交工单
1.【离线开发+自助分析】针对安全中心管控数据权限的Doris数据源,支持对接Doris表权限
- 功能介绍:
- 针对安全中心管控数据权限的Doris数据源(即在平台管理登记且配置了Ranger Service信息的平台级Doris数据源),离线开发和自助分析对接了Doris表权限。
- 离线开发和自助分析的Doris库表显示以及表详情弹窗中的权限展示,会对接Doris表权限。离线开发和自助分析的Doris库表显示,当项目组中心-配置管理-项目内库表展示开关关闭时,仅展示用户有权限的库表;开关开启时,展示全部库表。
2.【公共资源】参数组、资源组增加“管理员”
- 功能介绍:
- 参数组、资源组增加“管理员”配置项,管理员同负责人,拥有该参数组/资源组的所有操作权限。
- 参数组发布中心发布、参数组导入时,会判断接收方/导入方是否存在管理员对应的用户账号,如不存在则实际导入时将不导入该账号。
3.【离线开发】节点的输出参数支持自定义参数名称
功能介绍:
节点的输出参数的“参数名称”支持自定义,以解决此前系统内置的outputs类参数无法通过参数名表达参数业务含义的问题。注意:输出参数一经引用,不可重命名。
1.【离线开发】解决同一任务多节点tab的运行按钮的运行状态展示未隔离的问题
版本:v7.15.0+v7.15.1
新增功能1.【离线开发】离线开发配置支持设置报警规则模板
功能介绍:
- 在离线开发配置的项目-集群配置的基础配置中,支持添加、修改和删除规则模板。 在任务的报警设置中支持引用规则模板来快捷添加报警规则。 注意:报警规则添加完成后,规则模板的修改不会影响已添加的报警规则。
功能详细使用步骤:
2.【离线开发】批量操作支持批量添加报警规则和批量删除报警规则
功能介绍:
- 批量操作支持批量添加报警规则和批量删除报警规则。
- 如果报警对象类型选择节点/质量监控,将删除选中的任务下所有满足触发规则的节点/质量监控的报警规则。
触发规则如果选择:任务运行超时、任务完成超时、节点运行超时,不支持配置具体超时时间,系统将自动删除选中任务下所有对应类型的报警规则。
3.【项目中心】支持申请删除队列
功能介绍:
- 在项目中心-资源管理-集群资源详情页,支持申请删除队列。
- 点击删除队列按钮,并填写申请原因后,就会创建审批工单。审批通过后,系统将自动执行删除队列。
针对NDH集群的Yarn队列,审批通过后Yarn队列的数据将会被清除,且不可恢复;针对非NDH集群的Yarn队列,审批通过后,仅移除当前集群和Yarn队列的绑定关系,Yarn队列的数据不会清除。
4.【离线开发】代码搜索的“下载搜索结果”支持选择要下载的列
功能介绍:
下载搜索结果时,点击“下载所有列”,会直接下载Excel文件,点击“选择要下载的列”,支持基于用户选择要下载的列来生成Excel文件。
5.【离线开发】代码搜索的“下载搜索结果”对接项目中心功能权限
功能介绍:
- 在项目中心-功能权限,支持管控”下载搜索结果“的权限。
项目负责人和项目管理员,默认有”下载搜索结果“的权限,且不可取消;“全部成员(包含新增成员)”,默认有“下载搜索结果”的权限,支持取消。
6.【离线开发】SQL节点内运行支持选择是否开启语法检查
功能介绍:
- SQL节点,节点内运行是否配置是否开启语法检查。开启后,在运行前将自动检查SQL语法,确保SQL语句正确无误。建议开启以避免因语法错误导致的运行失败。
针对历史已创建的节点,语法检查已自动开启。
7.【离线开发】任务调度设置的智能推荐功能,智能推荐标签的逻辑优化
- 功能介绍:
- 在调度设置的【任务依赖】和【节点依赖】中,如果已添加的上游节点仍在当前最新一次的智能推荐范围内,则智能推荐完成后原来已添加的上游节点,也增加【智能推荐】的标签。
8.【离线开发】提交上线检测支持“调度依赖检测”
- 功能介绍:
- 提交检测-调度设置检测新增检测项“调度依赖检测”,检测任务的调度设置是否存在多余依赖或缺少依赖。
- 此检测项如检测不通过,仅作风险提示,不会阻断提交上线。
- 调度依赖检测规则说明:1、如果上游依赖节点的输出表未作为本任务节点的输入表,则认为存在多余依赖。其中,解析上游依赖节点的输出表时取上游线上模式的代码;2、如果本任务节点的输入表对应的产出任务未作为上游依赖节点,则认为缺少依赖。其中,查询本任务节点的输入表对应的产出任务时仅取线上模式调度对应的产出任务;3、节点的输入表与输出表支持在任务内传递,即同一任务内的上游节点的输出表会视作下游节点的输出表,下游节点的输入表会作为上游节点的输入表。需注意,任务之间的依赖关系不支持传递,建议用户按照实际依赖情况添加依赖关系,便于直观地查看和管理血缘。
- 此外,在离线开发配置-项目配置-提交检测中,支持设置是否允许跳过该检测项。设置为是后,提交上线检测时将允许用户点击“跳过检测”来跳过该检测项。跳过后,提交上线检测报告中会显示用户已跳过检测,作为风险项提示,不阻断提交上线。
- 功能使用注意事项
- 任务组任务不支持调度依赖检测
功能详细使用步骤:
1.【离线开发】针对Doris节点,自定义血缘支持设置是否为永久血缘
- 功能介绍:
- 针对Doris节点-自定义血缘,支持勾选该组血缘是否为永久血缘。
- 如勾选为永久血缘,则节点运行(含开发模式运行、线上模式调度等)成功后即会推送血缘至数据资产地图,该血缘将不会被系统自动清理。仅当删除血缘并重新运行节点或取消勾选永久血缘并重新运行节点后,永久血缘会被清理。
- 血缘的系统清理机制如下:1、静默血缘:血缘产生7天后自动清理(7天为默认值,支持运维后台配置);2、活跃血缘:任务在近7天内应调度但实际未调度,则血缘自动清理;任务的输入表或输出表发生变更,则原血缘自动清理(7天为默认值,支持运维后台配置)。
2.【离线开发】批量操作支持按照开发模式调度生效时间、开发模式调度周期、线上模式调度生效时间、线上模式调度周期筛选任务,支持一键展开或收起表格开发模式调度信息和线上模式调度信息列内容
3.【项目中心】安全漏洞修复:修复“申请新项目”时后台支持查询全量用户的问题。
4.【自助分析】HANA适配新版本2.20.17
5.【离线开发】节点内运行和提交上线时,针对SQL节点和OracleSQL节点增加代码检测
功能介绍:
针对SQL节点(引擎类型为Spark、Hive、Impala、Inceptor、Argodb)和OracleSQL节点,如果SQL语句末尾为注释,会导致运行失败。故此版本在节点内运行和提交上线检测中增加了检测,作为风险提示,不阻断运行和提交上线。
版本:v7.14.8+v7.14.9
新增功能1.【离线开发】代码搜索支持AND/OR多条件组合匹配
- 功能介绍:
- 代码搜索框中,支持输入关键词、AND、OR、(、) 。输入内容后,请键入Enter生成标签,搜索框最多支持2048个字符。
- 逻辑优先级上,AND默认高于OR,并支持通过()来调整优先级。
- 示例:A AND B OR C,指代码【包含A和B 或 包含C 】;A AND (B OR C),指代码【包含A 且 包含B或C】。
- 功能详细使用步骤:
1.【离线开发】“离线同步专用队列”拆分应用场景
- 功能介绍:
- 此前,如设置离线同步专用队列,则在【数据传输-离线同步任务-试运行、离线开发-离线同步节点-开发模式运行、离线开发-离线同步节点-线上调度、任务运维中心-离线同步节点-重跑、补数据】下均会使用该队列。考虑到离线同步任务在试运行、调度等不同场景下,使用队列可能存在差异,故支持区分应用场景设置离线同步专用队列。
- 此处调整不影响历史任务,如此前已设置离线同步专用队列,则4处应用场景均会置为该队列
- 注意:此处的离线同步专用队列不控制数据传输-数据导入任务的执行队列。
- 功能详细使用步骤:
2、【离线开发】代码搜索-下载搜索结果,针对节点代码超出Excel单元格长度上限的情况增加截断策略
- 功能介绍:
- 此前,如下载搜索结果中存在节点的SQL代码字符长度超出Excel单元格长度上限32767个字符,则下载文件内容会为空。针对此问题,此版本增加了处置策略,节点代码如超出Excel单元格长度上限,将作截断处理,可点击任务链接前往查看节点完整代码。
版本:v7.14.6+v7.14.7
新增功能1.【离线开发】批量操作新增“任务池”,支持对“任务池”全量任务批量执行操作
- 功能介绍:
- 批量操作列表页,支持批量添加任务至任务池。任务池的任务数上限默认为1000,如需调整上线请联系运维人员修改EasyOps配置。
- 在任务池内,支持基于数据源引用添加任务。选择某一数据源后,支持添加引用该数据源的离线开发任务,具体包含: 离线同步节点、SQL节点、轮询节点引用该数据源。最多支持搜索1000个任务。
- 在任务池内,支持基于任务血缘添加任务。首先,请选择源头任务,支持以任务池已添加的所有任务或手动指定的任务作为源头任务。随后,请选择任务模式,指计算任务血缘时是按照线上模式的任务依赖来计算,还是按照任务的开发模式的任务依赖来计算。最后,请选择血缘方向和血缘层级。配置完成后,系统会按照以上血缘配置来搜索任务。最多支持搜索1000个任务。
- 考虑到批量删除、取消调度等批量操作,如下游任务未操作会导致上游任务也操作失败,故在任务池内支持检测上下游。通过检测上下游,可以识别出任务的直接上游 或 直接下游不在任务池内的任务。在查看某一任务的直接下游任务时,也支持将所有不在任务池内的本项目的直接下游任务添加至任务池。
- 支持对“任务池”的全量任务批量执行操作,并支持前往批量操作的操作历史查看任务池批量操作的操作历史。
功能详细使用步骤:
2.【离线开发】批量操作新增操作类型:发送通知、下载任务清单
功能介绍:
批量操作新增操作类型:发送通知、下载任务清单。
3.【自助分析】Query/Notebook支持代码恢复
功能介绍:
Query/Notebook支持本地代码缓存机制,如修改未保存,再次进入该Query/Notebook时会提示已缓存了未保存的代码,支持选择使用服务器已保存的代码或本地缓存的代码。
4.【离线开发】任务运行设置中,完成通知新增选项:质量异常、质量检测失败
- 功能介绍:
- 如任务开发模式运行的节点配置了质量监控(含嵌套流节点被引用的任务配置了dqc),则完成通知新增2个选项:质量异常、质量检测失败。任务运行完成后,如果符合条件则会发送报警。
- 功能详细使用步骤:
- 功能入口:
- 功能入口:
1.【离线开发+自助分析】Doris适配2.1.7版本
2.【离线开发】任务停止中时,”停止“按钮禁用以避免重复停止
3.【自助分析】数据源类型为默认类型时,Hive引擎增加Hive3驱动
4.【离线开发】任务未修改时,“保存”按钮禁用
5.【离线开发】任务提交上线成功后,页面自动刷新展示最新的任务版本
版本:v7.14.4+v7.14.5
新增功能1.【自助分析】"运行结果"新增功能
- 功能介绍:
- 支持调整列宽,调整方式为拖拽列标题边界线。
- 支持选中行、选中列、选中单元格,支持右键或快捷键(Windows系统:ctrl+c/Mac系统:command+c)复制选中内容。注意:如命中下载和分享审批策略,则不可复制。
- 支持查看行详情(行转列),并支持复制行内容。
- 支持查看单元格,用于单元格字段内容超长时查看完整内容。
- 页面布局及视觉优化。
2.【离线开发】代码类型节点支持“查看版本”
- 功能介绍:
- 针对DB2、达梦、Doris、GaussDB、GPSQL、MySQL、OceanBase、OracleSQL、SQLServer、StarRocks、TiDB、VerticaSQL、Python、Shell、Perl节点,支持“查看版本”功能,支持查看节点历史版本和版本比对,节点内容为代码和其他设置。
- 功能详细使用步骤:
- 功能入口:
3.【离线开发】Doris节点、StarRocks节点、轮询节点且执行数据源类型为Doris/StarRocks,库表信息库表名称)、智能推荐依赖、代码提示适配三元组形式
- 功能介绍:
- 三元组背景知识介绍:在 Doris/StarRocks 中,可以创建多个 Catalog 指向不同的数据源(如 Hive、Iceberg、MySQL),Doris/StarRocks 自动通过 Catalog 获取对应数据源的数据库、表、列、分区、数据位置等,用户可以通过“catalog.db.table”的形式,查询catalog对应的数据源的表。
- 针对Doris节点、StarRocks节点、轮询节点且执行数据源类型为Doris/StarRocks,此前已支持三元组形式的SQL执行,此版本在库表信息(含复制库表名称)、智能推荐依赖、代码提示也适配了三元组形式。
- 注意:请先在 Doris/StarRocks 数据源登记时开启“联邦查询”并关联catalog后,此版本新增功能才可生效。
1.【离线开发】针对最近一次智能推荐的依赖节点增加标签展示
- 功能介绍:
- 调度设置中,在依赖对象-任务依赖和节点依赖中,点击智能推荐按钮后,针对最近一次智能推荐出的节点会展示【智能推荐】的标签。
2.【离线开发】针对底座为TDH,优化SQL节点的代码解析功能
3.【离线开发】增加调度日历获取失败的重试逻辑
- 功能介绍:
- 获取调度日历失败增加重试机制。如达到重试次数时调度日历仍获取失败,则生成实例并置失败。
版本:v7.14.3
新增功能1.【离线开发】支持设置节点代码模板
- 功能介绍:
- 针对以下节点类型:SQL、Python、DB2、达梦、Doris、GaussDB、GPSQL、Oceanbase、SQLServer、StarRocks、TiDB、VerticaSQL、Shell、Perl,支持由项目负责人/管理员在配置管理-项目集群配置-基础配置-节点默认设置中设置节点代码模板。
- 设置代码模板后,该项目-集群下新增节点时代码默认填充此模板,不影响历史节点。
- 代码模板支持变量 :${Author}、${CreateTime},分别表示节点的创建人的用户名和创建时间(变量值格式如:2025-01-01 00:00:00)。
功能详细使用步骤:
功能入口:
2.【离线开发】支持下载代码搜索结果
- 功能介绍:
- 支持将搜索到的结果下载为Excel文件。下载结果条数上限与可查看的结果条数上线保持一致,最多支持下载100条结果。
功能详细使用步骤:
功能入口:
3.【离线开发】对接控制台,支持使用控制台管理的Python环境
- 功能介绍:
- 在控制台当前项目组-集群下注册Python环境后,在离线开发任务开发模式支持选择授权给当前项目、可用性为已启用、使用范围包含该执行模式的Python环境。此外,离线开发任务提交上线时,提交上线检测中会判断节点/任务调度设置中选择的Python环境是否已存在(强规则)和Python环境的开发模式和线上模式是否一致(弱规则),其中已存在的判断条件包含:发布状态是否为已发布或修改待发布、可用性为已启用、授权项目包含当前项目、使用范围包含选择的执行模式。
- 离线开发任务开发模式运行时,使用最新编辑的python环境;线上模式运行时,使用最新发布版本的python环境。
- 离线开发任务通过发布中心发布时,如发布到开发模式,则检测接收方是否存在1)环境标识相同、2)状态为未发布或已发布或修改待发布,可用性为已启用 3)授权项目包含当前项目、4)使用范围包含选择的执行模式 的开发模式Python环境;如发布到线上模式,则检测接收方是否存在1)环境标识相同、2)状态为已发布或修改待发布、可用性为已启用 3)授权项目包含当前项目4)使用范围包含选择的执行模式 的线上模式Python环境。
1.【项目中心】注册库的库名称取消不能以"_dev"结尾的限制
- 功能介绍:
- 此前考虑到数据沙箱功能会为正式库注册"_dev"结尾的测试库,为避免正式库和测试库混淆,注册库时库名称不允许以"_dev"结尾。由于数据沙箱功能不再对外开放,所以针对未使用数据沙箱功能的客户环境,注册库的库名称取消不能以"_dev"结尾的限制。
版本:v7.14.2
新增功能1.【离线开发】支持回收站功能
功能介绍:
- 离线开发被删除后,任务会进入回收站。回收站默认保留近30天删除的任务,到期后系统自动永久删除任务。
- 在回收站内,支持还原任务。还原任务时,如原负责人或所属文件夹不存在,会提示用户重新选择负责人和所属文件夹。
- 在回收站内,支持删除单个任务,以及清空回收站。在回收站删除任务后,任务永久删除,且无法恢复。
- 在安全中心-安全审计-操作审计日志,支持查看在回收站删除任务和还原任务的事件日志。
- 回收站权限说明:对于项目负责人/项目管理员,支持查看、删除、还原当前项目-集群下的所有任务;对于项目负责人/项目管理员以外的项目成员,支持查看、删除、还原当前项目-集群下本人作为负责人和删除人的任务。
- 在“设置-项目配置-基础配置-回收站设置“模块,支持由项目负责人和管理员修改当前项目的回收站任务保留期限和配置删除提醒。开启提醒后,可在相应的时机向通知人发送提醒,避免任务被永久删除后无法恢复。
功能详细使用步骤:
- 功能入口:点击后,即可进入回收站。
版本:v7.14.1
新增功能1.【离线开发+自助分析】支持执行Doris存储过程
- 功能介绍:
- 离线开发的Doris节点和自助分析的Doris数据源,支持执行Doris存储过程。 不支持存储过程表和字段血缘。
1.【离线开发】离线同步节点相关交互优化
- 功能介绍:
- 此前存在的问题是:用户在离线同步节点选择了无编辑权限的离线同步任务,保留离线开发任务时会由于无权限保存失败。以及离线开发任务提交上线时,如果用户没有引用的离线同步任务的提交权限,也会提交上线失败。
- 故此版本进行了交互优化。在离线同步节点引用详情选择任务时,该用户无编辑权限的任务置灰不可选。在提交上线离线开发任务时,提交上线检测中会检测用户是否有传输任务的提交上线权限,无权限则检测不通过阻断提交。
版本:v7.14.0
新增功能1.【离线开发】支持批量配置质量监控
- 功能介绍:
- 支持批量移除节点配置的质量监控,支持基于批量选择的质量监控任务来批量新建配置了质量监控的虚拟节点。
- 仅当用户有任务的“新建和编辑节点、运行、运行设置、结果预览、调度设置、报警设置”权限时可操作。
- 功能详细使用步骤:
- 功能入口:
2.【离线开发】批量操作新增“操作历史”,支持查看历史操作记录
- 功能介绍:
- 批量操作支持查看操作历史,操作历史中会展示已执行完成和执行中的批量操作的操作人、操作类型、操作明细、状态等信息。
- 默认仅保存180天内的操作历史,如需调整保存期限请联系平台运维人员操作。
- 功能详细使用步骤:
- 功能入口:
3.【离线开发】任务调度设置的“原始优先级”功能支持针对离线同步节点生效
- 功能介绍:
- 针对CS调度的Yarn集群,SQL节点、离线同步节点、Spark节点和MR节点,在线上调度时,支持将任务的优先级传递给Yarn队列来执行,高优先级任务优先获取Yarn资源。其中Spark引擎需要3.0以上。
1.【离线开发+自助分析】Doris和StarRocks新增代码扫描规则
- 功能介绍:
- 在离线开发和自助分析模块,新增代码扫描规则,具体包含:表跨层依赖、select字段和插入表字段数量不一致、select字段和插入表字段名称或类型不一致、表关联on字段类型不一致。
2.【离线开发】执行引擎为Spark的节点提交方式优化
- 功能介绍:
- 针对升级此版本后新建的任务,改为使用spark-submit命令行方式提交任务,历史任务不受影响。
- 优化背景是: Spark的标准提交方式是通过Spark-submit命令行拼接实现的。而我们当前的任务提交方式是通过反射调Spark main 启动任务。这是一个非常规的提交方式,会导致我们的任务进程、spark的提交进程和spark clinet模式的 driver进程之间耦合,并相互影响。此外,随着Spark的版本迭代,也逐步抛弃了我们当前使用的 Spark mian方法,改为了 spark launcher main方法,这也导致不兼容情况日益增多,亟须解决。
3.【自助分析】SQL切分优化,解决SQL语句分号后带空格就会报错的问题