Apache DolphinScheduler 3.4.0 版本正式发布了。这次升级,重点在企业级调度能力的跃迁,多租户隔离、工作流并发性能、任务容错告警、资源治理以及日志可观测性这几个方向,都有实质性的提升。无论是金融级复杂的编排需求,还是互联网百万级高吞吐的调度场景,3.4.0 都用更健壮的架构、更精细的控制和更友好的体验,帮大家构建一个稳定、高效、安全的自动化工作流中枢。简单说,该升级了。
升级与获取
官方下载页面支持多镜像源,地址在:
https://www.php.cn/link/20913c01b73eb72bf3bbd8b570e4dfa4
GitHub Release 页面也同步开放:
https://www.php.cn/link/9b13696ffd06f61e1b775a5e56d5afc6
升级之前,建议读一下官方的《集群升级指南》,确保配置能平滑迁移,版本兼容性没问题。
核心特性演进与关键变更
✅ 全面接入通用 OIDC 身份认证
3.4.0 原生集成了 OpenID Connect(OIDC)协议,直接打通企业统一身份中台。支持 Keycloak、Okta、Azure AD 这些主流 IdP 的一键对接,单点登录(SSO)和联邦身份管理不再是难题。省去了定制开发的成本,将 DolphinScheduler 无缝纳入企业 IAM 体系,运维配置成本显著降低,访问安全性和账号生命周期管理的一致性也更好了。

(参考图)
✅ 首发 gRPC 任务插件能力
这次新增了原生 gRPC 任务类型,可以直接调用远程微服务暴露的 gRPC 接口作为调度单元。不用再通过 Shell 封装或 HTTP 中转,借助 Protocol Buffers 的强契约和二进制高效通信,跨语言、跨服务的任务集成可靠性和执行效率都大幅提升,尤其适合云原生和 Service Mesh 架构下的任务协同场景。



✅ 工作流串行策略深度重构
Workflow Serial Strategy 的核心机制被重写了。引入了一个专门的串行命令队列表 t_ds_serial_command,配套构建了 WorkflowSerialCoordinator 协调器和策略解析引擎,精准支撑 SERIAL_WAIT(等待前序完成)、SERIAL_PRIORITY(优先抢占)、SERIAL_DISCARD(丢弃冲突)这三类串行语义。触发判定、状态同步和队列调度路径都得到了优化,串行场景下工作流的行为更可预测、易审计、抗压能力更强。
✅ 精简任务类型体系:移除 PyTorch 内置任务
基于社区使用数据和长期维护评估,3.4.0 正式下线了内置的 PyTorch 任务类型。目的是降低核心调度内核的耦合度,提升系统的轻量化水平和版本迭代的敏捷性。推荐大家通过 Shell/Python 任务封装或者自定义插件的方式来运行 PyTorch 计算作业,这样既灵活又好维护。
稳定性增强与关键修复
? Kubernetes Worker 部署能力升级
Helm Chart 里的 Worker StatefulSet 新增了 Secrets 注入和 InitContainers 支持:
- Secrets 可以安全注入 TLS 证书、数据库凭据等敏感配置;
- InitContainers 能预执行环境校验、目录初始化、依赖预热这些前置逻辑。
容器化部署的安全基线和启动一致性都得到了全面提升。
⚡ SQL 任务支持实时取消
SQL 类型任务首次获得原生 Cancel 指令下发能力。当 SQL 执行异常卡顿或误操作导致长时间运行时,用户可以直接通过 Web UI 或 API 主动终止,避免无效资源占用和阻塞扩散,任务治理体验和集群资源周转率都会显著改善。
? 条件节点失败响应逻辑修正
修复了条件任务节点(Conditions Node)在上游任务失败时,没有按 DAG 定义触发分支判断的问题。确保“失败→跳转”的逻辑严格对齐用户的编排意图,不会因为调度引擎的缺陷导致工作流逻辑断裂。
? ZooKeeper Failover 节点自动清理
修复了 Master 启动异常中断后残留 /failover 注册路径的问题,强化了注册中心状态一致性,HA 模式下集群的自愈能力和故障恢复可靠性都更有保障。
? Worker Group 关联逻辑一致性加固
修正了项目(Project)与 Worker Group 绑定/解绑操作在 API 层的行为偏差,确保资源分组策略在前端、后端和调度引擎中保持全程一致,多租户资源隔离和精细化调度的基础更加坚实。
此外,3.4.0 还包含了 时区与安全配置标准化、TraceId 全链路透传、Failover 自动清理与可重入锁优化、任务组索引加速、日志查询与 DataX 参数校验增强、PostgreSQL JDBC 与 Spring Boot 安全漏洞(CVE)修复等数十项改进。完整的清单见这里:
https://www.php.cn/link/9b13696ffd06f61e1b775a5e56d5afc6
典型 Bug 修复亮点
? “Inactive” 状态标记失效问题修复
修复了特定生命周期事件下,任务无法正确进入 Inactive 状态的问题,让 UI 展示和引擎内部状态统一起来,消除了状态不一致的风险。
? Workflow Lineage 删除彻底性优化
重构了血缘关系清理流程,确保删除操作能级联清除所有关联元数据和引用索引,不会有残留链路影响后续的影响分析和依赖追踪。
其他修复还包括:子工作流触发参数丢失、前置失败条件下条件节点不执行、项目级 Worker Group 绑定/移除逻辑异常等,具体细节可以看 Release Note。
文档持续完善
- 正式发布了 Apache DolphinScheduler 3.3.2 版本说明文档;
- 修复了文档 CI 构建流程的缺陷,提升了自动化发布的稳定性;
- 补充了 Prometheus 指标接口认证配置指南及 Kubernetes 下的实践说明;
- 同步更新了 JdbcRegistry 引入事务机制后的使用说明,确保文档和代码行为严格对齐。
致谢
这次发布凝聚了全球社区开发者的智慧和热情。特别致敬 3.4.0 版本的 Release Manager @Gallardot,全程主导版本管控、候选版验证、构建测试及 Apache 投票流程,保障了高质量交付。
诚挚感谢以下贡献者(GitHub ID,排名不分先后):
Gallardot、njnu‑seafish、det101、Mrhs121、EinsteinInIct、sanfeng‑lhh、ruanwenjun、tusaryan、qiong‑zhou、SbloodyS、kvermeulen、npofsi、CauliflowerEater、ChaoquanTao、dill21yu、sdhzwc、zhan7236、KwongHing、jmmc‑tools、liunaijie
也感谢每一位提交 Issue、撰写文档、参与讨论、提供测试反馈的社区成员。正是大家的持续投入,驱动 DolphinScheduler 不断进化。欢迎更多伙伴加入开源共建,一起打造下一代智能工作流基础设施!
源码直达:点击访问
