更新合辑(2023年)
更新时间: 2024-12-04 15:37:46
版本:v1.9.8
新增功能
1.配合离线开发新增GaussDB节点运维操作
- 功能介绍:
- 离线开发现已支持GaussDB节点的代码开发,将节点提交上线进行周期调度后,可在任务运维中心查看GaussDB节点的实例日志、运行情况等信息。
功能优化
1.质量监控告警显示对应的项目集群
- 功能介绍:
- 质量监控告警内容中增加显示质量监控任务所在项目集群,方便用户高效查看报警信息。
2.值班组提醒配置支持配置电话告警
- 质量监控告警内容中增加显示质量监控任务所在项目集群,方便用户高效查看报警信息。
- 功能介绍:
- 值班组提醒新增电话告警通道,用户可选择使用电话方式来通知值班人员进行值班的提醒。
版本:v1.9.7
新增功能
1.配合离线开发新增python节点运维操作
- 功能介绍:
- 离线开发现已支持python节点的代码开发,将节点提交上线进行周期调度后,可在任务运维中心查看python节点的实例日志、运行情况等信息。
版本:v1.9.6
功能优化
1.任务转交审批工单迁移至新流协
- 功能介绍:
- 若当前项目开通了离线开发任务线上执行个人账号的功能,则在任务运维中心转交任务时需要走工单审批,原先这部分工单的审批是在老流协中进行的,此次升级后,会迁移到新流协进行审批操作。
- 功能使用注意事项
- 原先老流协的工单将不支持审批,若存在未完成的工单,用户需要手动撤回后重新发起转交动作;任务运维中心的转交记录中将不再显示老流协的工单记录。
版本:v1.9.5
新增功能
1.补数据支持预览补数实例
- 功能介绍:
- 用户创建补数据任务时,需要设置补数据时间范围和补数据周期,有些情况下涉及实例较多、补数周期较复杂,无法直观看到补数据的实例是否是自己预期的。针对这一问题,任务运维中心支持预览补数实例,在真正创建补数据任务之前,就可以确认即将要补数据的任务是否与预期一致。
功能优化
1.上游依赖详情列表中支持搜索
- 功能介绍:
- 当某个任务存在较多上游依赖时,如果想找某一个上游任务的话不太方便,此次升级后,查看上游依赖详情的列表均支持按照任务/节点名称搜索,用户可以快速定位某个关注的上游任务查看其完成情况。
版本:v1.9.4
新增功能
1.任务诊断模块新增异常实例列表
- 功能介绍:
- 用户可以在任务诊断模块中查看异常实例列表,目前支持“未按时就绪”、“就绪超时”和“阻塞下游”三种异常实例的查看。未按时就绪实例列表中展示的是已到计划执行时间但仍未就绪的实例列表。若一个任务有多个超时未就绪的实例,则列表中仅会展示计划执行时间最新的那一个实例;就绪超时默认展示就绪时长已超过5分钟的实例列表,用户也可以手动修改超时规则;阻塞下游列表中展示的上游已运行成功,而当前实例运行状态非成功,导致下游依赖实例未按时就绪或运行的实例。
2.任务支持修改节点平均运行时长
- 功能介绍:
- 场景1:任务运行出现异常,导致运行时长过长,在恢复正常以后,基线计算的预计完成时间根据节点的历史平均运行时间计算出基线存在预警,因此仍然会产生报警影响用户;
- 场景2:任务每天早晚各调度一次,两次执行时长不一致,基线取任务平均运行时长计算预计完成时间,导致实际短时间能完成的任务预计其计划完成时间较晚,导致基线报警影响用户;
- 针对以上由于任务平均运行时长异常导致基线发生无效告警的场景,用户可以手动修改节点平均运行时长,从而使基线告警更合理与高效。
- 功能详细使用步骤
- 在任务详情-影响基线页面中,可以查看当前任务的影响基线的所有节点列表,可以点击查看执行历史,查看该节点的历史执行情况,可以点击修改平均运行时长,手动修正任务的平均运行时长。
- 目前支持两种方式修改平均运行时长,包括剔除异常值和自定义时长。
版本:v1.9.3
新增功能
1.支持重跑下游功能
- 功能介绍:
- 新增重跑下游功能,用户可以选择运行方式为线上调度,且就绪时间为昨日0点以后的实例及其下游运行方式为线上调度的实例进行重跑操作;重跑下游功能支持开启冻结模式,开启冻结模式后,可以选择冻结未就绪的下游实例,在上游数据发生问题,而下游实例未就绪时,可以使用该功能进行一键重跑,同时避免下游数据被污染。
- 注意事项
- 需要有相关实例的重跑权限,才可以选择上下游实例一起重跑。
功能优化
1.报警规则新增“任务/节点开始”和“任务/节点完成”
- 功能介绍:
- 新增报警规则类型,支持在任务/节点开始运行和运行结束时发送报警通知。
版本:v1.9.2
功能优化
1.补数据支持选择是否执行质量监控任务
- 功能介绍:
- 补数据设置中支持是否执行质量监控任务,当选择执行质量监控任务时,通知条件可以选择是否要接收质量检测失败或质量检测异常的通知。
2.批量操作返回弹窗内容优化
- 功能介绍:
- 在任务运维中心进行批量重跑、终止实例等操作时,增加返回弹窗的优化,展示任务或实例的提交进度与结果,并支持终止提交。
3.周期实例列表支持不显示嵌套实例
- 功能介绍:
- 嵌套流节点引用的任务会在嵌套流节点线上调度执行、重跑和补数据时会生成对应的实例,原先这部分实例会显示在周期实例列表中,此次升级后,将默认不展示这部分实例,用户可手动开启开关展示。
版本:v1.9.1
功能优化
1.基线支持订阅
- 功能介绍:
- 当非值班组成员也想要关注基线报警信息时,可以使用此功能。在基线运维页面提供“基线订阅管理”的入口,点击后可以进行新增、编辑和删除基线订阅规则等操作。
版本:v1.9.0
功能优化
1.任务循环告警逻辑优化
- 功能介绍:
- 在任务开启了循环报警的情况下,原先需要在报警历史中响应对应报警或者将任务置成功后,循环报警会自动结束;此次升级后,若检测到有相同计划执行时间下且状态为运行中和运行成功的重跑或补数据实例,则循环报警也将自动结束,避免频繁告警。
版本:v1.8.9
功能优化
1.实例详情页关系视图支持查看节点信息
- 功能介绍:
- 实例详情页的关系视图中,点击节点可以查看节点运行时长等信息。
2.置成功时支持输入备注信息
- 功能介绍:
- 原先置成功后无法记录置成功原因,导致后续无法复盘任务状态,此次升级后支持输入备注信息,同时在实例诊断标签页可以查看备注信息。
3.基线完成通知接入电话告警智能取消
- 功能介绍:
- 若基线触发条件选择了基线完成,通知方式选择电话,并开启了电话告警智能取消,则基线完成的通知不再发送电话告警,避免打扰值班人员。
版本:v1.8.8
新增功能
1.新增任务诊断功能
- 功能介绍:
- 新增任务诊断的单独模块,支持调度依赖诊断(原血缘诊断)与Spark性能诊断。支持将任务加入诊断白名单,加入诊断白名单后的任务将不会出现在异常任务列表中;在任务详情页面可以查看诊断详细信息。
- 注意事项:
- Spark性能诊断,需要用户部署easyeagle 2.x版本才可使用。
功能优化
1.补数据支持发送报警给报警组
- 功能介绍:
- 用户创建补数据任务时,可以在通知设置中选择接收人为报警组。
2.基线支持配置触发条件
- 功能介绍:
- 基线编辑页面支持配置触发条件,触发条件包括预警、预计破线、已破线、关联实例运行失败、关联实例运行变慢、基线完成。
版本:v1.8.7
新增功能
1.新增节点诊断功能
- 功能介绍:
- 实例开始运行后,各节点按照依赖关系依次执行,但由于某些原因,节点未能正常执行,包括依赖未满足、设置了重试延迟等情况,用户排查问题往往链路长、定位难。针对这种情况,任务运维中心将原先的实例诊断进行升级,支持节点粒度的诊断,针对节点未执行、执行使用的资源情况以及执行失败,从三个维度来对节点进行诊断,即执行诊断、成本诊断和结果诊断,帮助用户快速定位问题,迅速解决问题。
- 注意事项:
- 节点的成本诊断,需要用户部署easyeagle 2.x版本才可使用。
2.支持实例诊断
- 功能介绍:
- 基线的优先级从高中低调整为L1到L4,基线的优先级支持传递给任务,从而实现任务的统一管控,仅需将高优先级的任务挂在相应基线上,就可以实现重要任务的统一管理。
- 注意事项:
- 原先优先级为高的基线此次升级后显示为L3,原先优先级为中的基线此次升级后显示为L2,原先优先级为低的基线此次升级后显示为L1。
3.新增基线智能免打扰功能
- 功能介绍:
- 当出现任务运行变慢等异常情况后,基线会及时发送预警等报警信息,但有时运维人员将问题处理以后,由于基线计算出仍然处于预警或预计破线状态时,告警会继续发送,对运维人员造成困扰。因此任务运维中心提供智能免打扰功能,在开启智能免打扰功能后,同一实例引发的告警信息将不再发送,若基线检测到告警原因变化,则会继续正常发送告警。
- 注意事项:
- 仅基线当天的值班人员有权限开启智能免打扰功能
4.实例支持批量置成功
- 功能介绍:
- 实例支持批量置成功,在实例列表中选中需要置成功的实例后,可一键置成功。
5.支持单个任务和批量任务修改首次执行时间
- 功能介绍:
- 当任务因为某些原因出现实例堆积的问题时(例如十分钟调度的任务,当前时间还在执行1个小时前的任务,但实际已经不需要这一批过期实例),此时可以使用修改首次执行时间的功能,将首次执行时间调整为当前最近的一次调度计划执行时间,则计划执行时间在最新首次执行时间之前的未就绪实例会被取消,任务将从最新首次执行时间开始调度。
- 注意事项:
- 若任务编辑调度需要走审批,或正在审批流程中,则不支持修改首次执行时间,需前往离线开发编辑调度并走流程审批。
功能优化
1.任务列表与实例的批量操作按钮优化
- 功能介绍:
- 任务列表与实例列表的批量操作按钮从页面上方同一调整到页面下方。
2.重试记录详情中增加展示重试间隔
- 功能介绍:
- 重试记录详情中增加展示重试间隔,同时增加文案说明:开始时间会包含重试间隔。节点真正开始的时间为显示的开始时间加上重试间隔的时间。
3.加速器增加显示操作记录
- 功能介绍:
- 管理员可以操作加速器,在资源紧张的情况下优先保障重要任务的产出,此次版本升级后,加速器支持查看操作记录,方便管理加速器的使用。
4.实例血缘图中支持右键重跑
- 功能介绍:
- 实例血缘图中支持右键重跑,不需要跳转到对应实例详情页面再进行重跑操作。
版本:v1.8.6
新增功能
1.补数据支持补上游数据
- 功能介绍:
- 在业务场景中经常会碰到下游的任务出现问题,需要上游重新调度起来,但是由下游去反推到上游只能由人工去定位上游的任务,然后再从上游开始补数据,操作复杂。此次更新任务运维中心将支持在创建补数据任务时,自定义补数范围,包括仅下游任务、仅上游任务和上下游任务。
2.支持实例诊断
- 功能介绍:
- 实例诊断通过将实例的生命周期分为三个阶段,实例准备、实例提交和实例运行,有针对性地对不同阶段实例进行各项检查,从而帮助用户快速定位到实例的问题原因,例如实例到了就绪时间却未生成,实例被系统终止以及任务运行失败等异常情况。
功能优化
1.重跑时支持上游依赖判断
- 功能介绍:
- 当由于某些原因出现任务大批量失败,导致任务依赖的下游都被终止时,用户想要重跑上下游实例,往往需要按照依赖关系去重跑上下游,但原先任务运维中心批量重跑操作会一次性拉起所有实例进行重跑,不再校验其上游依赖,导致任务会出现重跑时上游并非成功而导致下游产出数据异常的问题。此次升级后,在批量和单个重跑任务的时候,会保留任务的依赖关系,如果系统检测到被重跑任务所依赖的上游不满足依赖条件,下游会处于就绪等待上游的状态,直到上游成功后,下游才会开始正常运行。如果用户不需要判断依赖,则可以选择强制重跑。
2.支持快捷筛选已到计划执行时间但未就绪的实例
- 功能介绍:
- 实例未就绪时,可能是因为未到达计划执行时间,也可能是因为上游依赖未完成,或是任务已被加入冻结池等原因,支持用户快捷筛选已到计划执行时间但未就绪的实例,从而及时发现被阻塞的异常实例。