1、负责公司软件平台的部署和服务器运行中的日常监控、报警及日常处理,能快速解决故障并输出报告;
2、负责完善服务器的监控体系及监控维度,对监控进行优化,解决监控盲点、难点;
3、参与架构优化、容灾优化、性能优化等项目,分析系统瓶颈,容量评估、完成扩容、架构改造等工程;
4、负责应用系统的生产/开发/测试/uat环境发布,包括环境的搭建、应用的部署、运维等;
5、负责应用运维突发事件和问题的跟踪、解决和管理;
6、及时响应并处理线上故障,保障线上业务7X24小时稳定运行。
任职要求:
1、大专以上学历,3年以上运维管理经验;
2、熟悉阿里云的技术,熟悉Linux操作系统,centos优先,掌握Shell相关配置脚本;
3、熟悉以下平台:Nginx、Tomcat、haproxy、ActiveMq等,有分布式、负载均衡经验优先;
4、熟悉自动化工具和容器:Docker、Kubernetes、Jenkins;
5、熟悉Mysql高可用、容灾、备份恢复、数据迁移等技术;
6、配合研发高效迭代产品,解决日志的查看和定时清理;
7、优化并改善系统架构,提高系统稳定性和安全性。