负责公司线上系统运维,提升业务稳定性,制定和优化运维解决方案,包含容灾/弹性扩容
负责jenkins 构建流水线业务CI/CD的发布和数据同步的工作
项目的环境的部署、资源的调配、管理与日常维护系统的稳定,日常运维文档的撰写整理工作
配合各研发方向合作,提供高效的监控、故障快速处理的手段和能力,提升运维工作效率
参与业务系统容量测算和规划设计,优化资源运维成本
负责Kubernetes核心组件的扩展与维护,保障Kubernetes系统稳定性
负责k8s operator 开发,运维规范、流程文档编制,并将其工具化、平台化,确保运维安全
关注最新的漏洞信息,进行风险评估,协助安全专家制定漏洞修复方案
搭建公司内部的一套自动化平台,完善产品上线流程,将公司的Springcloud开发的微服务电商项目基于jenkins流水
线实现自动发布、自动回滚。
个人职责:
一、规划阶段:
1.调研DevOps工具链中需要的具体技术,找到最佳实践方案;
2.制定项目完成周期和可实现的目标;
3.项目人员和成本规划
二、实施阶段:
1、部署的具体服务:jenkins,gitlab,harbor,docker,nexus,sonarqube,kubernetes,Springcloud源码
2、将Springcloud开发的java代码,基于Dockerfile构建镜像
3、将构建好的镜像传到镜像仓库harbor中
4、基于Jenkinspipeline构建流水线,能自动将Springcloud代码进行编译打包、构建镜像、基于k8s部署
三、测试阶段:上述服务部署调通之后开始测试,测试通过之后交付到项目组
四、后期维护管理:交付成功之后,负责维护和管理,以及日常上线操作
五、Kubernetes平台架构设计
六、Prometheus+Loki监控日志系统设计
七、JenkinsCI/CD流设计,推动团队完成自动化平台的建设