热衷于 DevOps,精通以下技术和工具:
Linux、MySQL、Nginx、Traefk、Redis、Kubernetes 、kafka、Ansible、Apollo 、SkyWalking、Prometheus、GitLa
b、Argo、Harbor、MinIO、Ceph
拥有丰富的公有云与私有云经验,规划、实施与升级20多个大型 Kubernetes 平台,200节点以上,维护 GPU 集群,成功落
地 DevOps 体系,实现代码从开发到发布的自动化。部署后服务启动报错,以及运行时程序出现故障,无需运维人员参与,
开发能通过平台快速解决各类问题。
曾任职于联想,并有5年阿里云,积累了丰富的实践经验。
项目概述:
Lenovo EARTH PaaS(以下简称EARTH)是一款基于Docker和Kubernetes研发的PaaS平台。EARTH更好的发挥了
Kubernetes 产品特性,简化了Kubernetes 集群安装和部署,让开发者更关注业务本身,有效的实现应用的快速构建和部
署,提高效率和资源利用率。
业绩:
1,容器运行节点调度管理风险,如多个 pod 副本在一个节点
2,解决容器集群网络架构存在的问题,管理流量和业务流量网络没有分开等问题
3,gitlab 集群部署,总共 10 个节点,10t 数据量
4, 云平台优化,对问题进行总结,提出改进,故障进行及时定位,分析和解决,并制定后续的改进和规避方案与对部署运维工
具的优化
5, 云平台运维,包括容器平台含监控、日志、仓库等组件高可用、高性能的变更管理、功能优化、升级迭代、服务监控分析、
故障处理等,保障平台安全稳定运行
6, earth-logs 平台升级,保证更换 rocky 8 日志平台稳定运行
7, 系统组件迁移到 Argocd ,运维实现gitops
项目概述:
基于科技金融集团总体战略规划,建设资金管理系统体系。为现有保理、商旅业务线上化,以及针对集团内外部更多场景、用
户(包含企业用户、C类用户)的金融需求,提供统一的科技金融服务。
业绩:
底层 dubbo 框架,中间件Apollo、Nexus、Jenkins、Git、Yearning、Elastic-Job、SonarQube、Dubbo 控制台、
SkyWalking、Prometheus、LPG、Argo、Harbor 等服务。实现大部分服务与 LDAP 的集成,统一账户管理。并通过
Apollo 实现动态配置管理,利用 Jenkins、Git 和 SonarQube 实现代码质量扫描及配置生成,并通过钉钉进行告警通知,负
责人通过 Argo 更新服务。使用 Prometheus 监控硬件状态,利用 LPG 收集业务日志,确保以最小资源消耗收集多个节点的
日志并进行持久化存储。参与新项目的前期规划与实施,确保系统架构的合理性与安全性。
除了基本常用监控外,针对nginx进行单独监控,能具体到某个接口响应时间,请求成功率,每日uv,pv等信息,并且支持5xx与访问超时等告警,及时发现服务故障
k8s平台:此平台集群高可用设计,支持微服务架构, 容器化部署, 采用前后端分离的微服务架构;并且区分测试区域与生产区域,最大限度保障网络安全;支持服务水平扩展,负载均衡; 备份有两中方案,一种备份etcd数据,备份与还原是针对整个集群的. 更详细备份velero ,可以精确到