1.熟练维护常用中间件如 MySQL、Redis、Kafka、ES和 RabbitMQ ,保障关键服务的正常运行。
2.基于 GitLab CI/CD 和 Jenkins 设计企业级自动化流水线,实现代码构建-测试-部署全流程标准化,交付效率提升 45%。
3.在 Kubernetes和 Docker上管理有丰富经验,熟练进行容器化部署和编排,为应用提供灵活的运行环境;主导完成多个业务的
Docker 容器化迁移,资源利用率提高 25%。
4.搭建 Zabbix 和 Prometheus+Grafana 监控平台,实现全栈指标采集与智能告警,MTTR(平均故障修复时间)缩短至 15 分钟
内。
5.通过 Logstash+ELK 构建日志分析系统,提升异常排查效率。
6.精通 Linux 服务器管理及 Shell 脚本开发,具备高效的运维自动化能力;熟练使用 Ansible 等配置管理工具,实现基础设施的标
准化部署。
7.参与 50+ 节点自建机房从 0 到 1 的架构设计与实施,涵盖网络规划、硬件选型及灾备方案设计。
kubernetes集群部署及迁移 负责人
内容:
2022.11-2024.03
1. 背景:公司多个项目线下测试环境服务一直使用 docker 方式部署,较为分散,非常不利于对的应用服务管理,而 docker 相对
于k8s而言,docker 扩容的便捷性,可扩展性,自愈性等方便远远比不上k8s,在此基础上,在我建议下,领导同意在线下内网环
境部署一套k8s集群。
2. 架构设计:部署方案采用双 master,3个 etcd 节点,另加一台 worker ,与 etcd 节点一同作为 node 节点,并采用 kuboard
可视化面板管理。
3. 部署实施:采用 kubeaz 方式开始部署,包括开发、测试环境。通过自动化脚本和配置管理工具,简化了部署过程,提高了部
署的一致性和可靠性。
4. 应用管理:管理和维护集群中的应用,包括容器编排、服务发现、负载均衡和故障恢复等方面,实现应用的自动化扩缩容和平
滑升级。
5. 监控与调优:使用 Prometheus 等监控工具,实时监控和分析集群的性能和健康状态,定期进行性能调优和故障排查,提高集
群的性能和可用性。。最后采用 Velero 进行集群的定时备份。
6. 项目迁移:优化基础镜像,并将多个项目所有 docker 中单实例 JAVA 应用迁移至集群中。