返回招聘信息一览

超算云平台运维开发工程师

岗位职责:

1、负责运行维护研究院云平台(平台包括底层计算和存储云,也包括数据中台部分),包括并不限于备份,弹性扩展,迁移等操作。保障科研与办公云平台高效,稳定的运行;

2、作为维护人员,参与云平台总体架构的设计、软件功能开发等工作;

3、结合云平台提高的接口(API),开发云平台运行监控脚本/程序;

4、收集云平台客户需求,根据需要和系统,架构,开发一起提高云平台服务质量和能力;

5、负责与前端、规约工程师一起完成产品开发及项目交付;作为维护人员,加入DEVOPS开发模式;

6、负责编写云平台软件应用功能详细设计和应用说明文件。


岗位要求:

1、全日制大学本科及以上学历,计算机相关专业;

2、有至少两种云平台维护经验(包括但不限于VMWARE, OpenStack, 华为/阿里/腾讯等云平台);

3、HPC运维能力(至少包括PBS,SLURM,LSF中一种调度器);

4、有GPU/FPGA AI 云资源维护经验者优先;熟悉Tensorflow, Pytorch AI 框架者优先; 有PBS高性能计算、科研运算经验者优先;

5、具有良好的职业操守,高度的工作责任心,有比较强的执行力,组织管理能力和学习能力,工作认真细致、爱岗敬业,良好的沟通协调能力、团队合作能力和抗压抗挫能力;