• 深度解析当当网分布式作业调度框架elastic-job项目
  • 专心滴打铁 发表于 2015/9/23 23:33:00 | 分类标签: 系统架构 网站架构 分布式 开源
  • 当当近期开源了分布式作业调度框架elastic-job项目。elastic-job是当当内部应用框架ddframe中dd-job的作业模块中分离出来的分布式弹性作业框架。去掉了dd-job中监控和ddframe接入规范部分。ddframe其他模块也有可独立开源的部分,之前当当曾开源过dd-soa的基石模块DubboX。

    elastic-job和ddframe关系见下图:

    Elastic-job的主要包括以下功能:

    定时任务:基于成熟的定时任务作业框架Quartz cron表达式执行定时任务。
    作业注册中心:基于Zookeeper和其客户端Curator实现的全局作业注册控制中心。用于注册,控制和协调分布式作业执行。
    作业分片:将一个任务分片成为多个小任务项在多服务器上同时执行。
    弹性扩容缩容:运行中的作业服务器崩溃,或新增加n台作业服务器,作业框架将在下次作业执行前重新分片,不影响当前作业执行。
    支持多种作业执行模式:支持OneOff(类似Quartz原生作业),Perpetual(类似TbSchedule作业)和SequencePerpetual(类似TbSchedule和kafka的合并,但处理时维持分片顺序)三种作业模式。
    失效转移:运行中的作业服务器崩溃不会导致重新分片,只会在下次作业启动时分片。启用失效转移功能可以在本次作业执行过程中,监测其他作业服务器空闲,抓取未完成的孤儿分片项执行。
    运行时状态收集:监控作业运行时状态,统计最近一段时间处理的数据成功和失败数量,记录作业上次运行开始时间,结束时间和下次运行时间。
    作业停止,恢复和禁用:用于操作作业启停,并可以禁止某作业运行(上线时常用)。
    被错过执行的作业重触发:自动记录错过执行的作业,并在上次作业完成后自动触发。可参考Quartz的misfire。
    多线程快速处理数据:使用多线程处理抓取到的数据,提升吞吐量。
    幂等性:重复作业任务项判定,不重复执行已运行的作业任务项。由于开启幂等性需要监听作业运行状态,对瞬时反复运行的作业对性能有较大影响。
    容错处理:作业服务器与Zookeeper服务器通信失败则立即停止作业运行,防止作业注册中心将失效的分片分项配给其他作业服务器,而当前作业服务器仍在执行任务,导致重复执行。
    Spring支持:支持spring容器,自定义命名空间,支持占位符。
    运维平台:提供运维界面,可以管理作业和注册中心。


    上面列出的功能已在当当内部稳定使用,现在开源,供大家参考和指正。也希望感兴趣的朋友也来为elastic-job贡献更多的改进。未来也将会开源更多的ddframe子模块。

    注:elastic-job严格遵循Apache 2.0许可证的要求。

    附:ddframe简介

    ddframe是针对技术部Java体系提供的统一应用开发框架。

    目的:

    分离技术和业务,封装技术细节,将应用开发人员的精力集中在业务开发上;
    可快速配置启动,降低新项目搭建框架的成本;
    统一框架,将项目分为业务+框架+云平台+治理;
    提供统一的编码,配置,监控,日志的标准和规范;
    组件可插拔,不强制业务开发人员使用框架的全部内容;
    灵活的提供定制化功能,框架不限制引入其他技术组件;
    模板代码自动化生成,降低书写难度;
    提供独立的工具箱和分布式技术组件产品;
    推动SOA以及微服务进程。

  • 请您注意

    ·自觉遵守:爱国、守法、自律、真实、文明的原则

    ·尊重网上道德,遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规

    ·严禁发表危害国家安全,破坏民族团结、国家宗教政策和社会稳定,含侮辱、诽谤、教唆、淫秽等内容的作品

    ·承担一切因您的行为而直接或间接导致的民事或刑事法律责任

    ·您在编程中国社区新闻评论发表的作品,本网站有权在网站内保留、转载、引用或者删除

    ·参与本评论即表明您已经阅读并接受上述条款

  • 感谢本文作者
  • 作者头像
  • 昵称:专心滴打铁
  • 加入时间:2013/7/13 0:00:00
  • TA的签名
  • 这家伙很懒,虾米都没写
  • +进入TA的空间
  • 以下内容也很赞哦
分享按钮