多计算中心作业迁移系统JMS的设计与实现
Design and Implementation of Job Migration System (JMS) in Multiple Computing Centers
DOI: 10.12677/CSA.2018.83042, PDF,    国家自然科学基金支持
作者: 冯鸣夏*, 伍卫国:西安交通大学电子与信息工程学院,陕西 西安
关键词: 高性能计算作业迁移容错微服务架构High-Performance Computing Job Migration Fault-Tolerant Micro-Services Architecture
摘要: 各个高性能计算中心之间缺少统一的作业管理策略和作业迁移机制。当遇到计算中心例行维护或者用户采用检查点技术进行异地作业灾备容错时,需要将作业迁移到其他计算中心执行。针对该问题,设计实现了多中心作业迁移调度系统JMS。该系统采用了微服务架构的设计模式,支持多计算中心间的作业迁移,为用户提供了多中心作业管理和终端访问的web portal。实际测试表明,JMS具有操作简单,可扩展性强等特点。
Abstract: There is a lack of unified job management strategy and job migration mechanism between high performance computing centers. When there is a routine maintenance in a computing center or the user adopts the checkpoint technology to make fault tolerance, jobs need migrating to other computing centers for execution. Aiming at the problem, this paper proposed a JMS system which adopts the design mode of microservice architecture, supports job migration in multiple computing centers and provides the function of multi-center job management and terminal access for users by web portal. Theoretical analysis and test show that JMS is user-friendly and has good scalability.
文章引用:冯鸣夏, 伍卫国. 多计算中心作业迁移系统JMS的设计与实现[J]. 计算机科学与应用, 2018, 8(3): 378-388. https://doi.org/10.12677/CSA.2018.83042

参考文献

[1] Xiao, H., Wu, H. and Chi, X. (2008) SCE: Grid Environment for Scientific Computing. 2nd International Conference on Networks for Grid Applications (GridNets 2008), 8-10 October 2008, Beijing, 35-42.
[2] 曹宏嘉, 卢宇彤, 谢旻. 资源管理系统中基于作业检查点的自动容错[J]. 计算机工程与科学, 2009, 31(11): 66-68.
[3] 戴志辉, 肖海力, 曹荣强, 等. 三层架构超级计算环境容错框架[J]. 计算机应用研究, 2011, 28(7): 2576-2579.
[4] 毛祺, 卢胜林. 基于DockerSwarm集群的容器迁移策略的实现[J]. 信息技术, 2016(9): 156-160.
[5] 房锦章. 基于Docker技术的GUI应用的在线迁移研究[D]: [硕士或博士学位论文]. 北京: 中国科学院大学, 2016.
[6] 张汉林, 王泽鹏, 陈宁江. 基于能耗感知的虚拟机迁移管理软件[J]. 广西科学院学报, 2017, 33(1): 48-52.
[7] 刘圣卓, 姜进磊, 杨广文. 基于副本的跨数据中心虚拟机快速迁移算法[J]. 清华大学学报(自然科学版), 2015(5): 579-584.
[8] Richardson, L. and Ruby, S. (2007) Restful Web Services. O’reilly Media Inc., Sebastopol, 199-204.
[9] Namiot, D. and Sneps-Sneppe, M. (2014) On Micro-Services Architecture. International Journal of Open Information Technologies, 2, 24-27.
[10] Rathore, N.K. and Chana, I. (2016) Job Migration Policies for Grid Environment. Wireless Personal Communications, 89, 241-269. [Google Scholar] [CrossRef