1、负责保障公司服务的高可用,并保持系统的稳定性与可靠性
2、负责生产、测试、灰度环境K8s集群搭建及 harbor 高可用部署、版本升级等
3、集中管理并优化公司的运维生态组件,包括 Prometheus 监控、ELK 日志系统、SDN 网络、分布
式存储及 Redis、Kafka、MySQL 等中间件,提升资源利用率及系统弹性
4、协助业务团队上云(天翼云),对服务进行容器化改造、优化 JVM 参数,节约运维成本
5、设计和实施自动化工具和脚本,编写CICD发布流水线
6、负责推进运维标准化、自动化,提升工作效率
7、负责域名全生命周期管理,包括续费、备案、DNS 解析、安全审计及等级保护
8、负责维护机房网络的整体运行,如各路由器、交换机,防火墙,Linux/windows 服务器等的正常运
作。制定各种运维文档,维护方案的编写等
9、负责公司 IT 日常支持,以及邮箱、打印、VPN、门禁、OA 、电话、网络等系统日常支持