k8s docker lxc kvm GitOps FinOps DevOps ci/cd ArgoCD
我在运维与 SRE 方向具备成熟的一线与架构经验,熟悉 Linux 系统在生产环境中的深度运维,包括内核参数调优、资源管理、网络协议栈优化以及故障根因定位。能够独立构建和维护基于 Kubernetes、k3s、Cilium、Longhorn 的完整平台体系,熟悉容器运行时、服务发现、SDN、存储复制策略与集群弹性能力。对 MySQL、OceanBase、etcd 等核心组件有可靠的部署、备份、扩容、性能优化与问题恢复经验。掌握 CI/CD、灰度发布、可观测性体系(日志、指标、追踪)以及生产事故处置流程,能快速稳定地恢复服务并改进系统可靠性。在架构层面强调自动化、可重复性和工程规范,可为外包项目提供高质量的问题排查、系统优化与平台构建支持。
- 云原生监控与运维体系建设(2023.04–至今):构建端到端自动化与可观测性平台,系统可用性>99.95%,MTTR下降60%。 - HTTP3全站升级(2023.01):基于nginx-quic实现全站QUIC/UDP支持,流量成本节省30%。
- 信创CI优化(2021.03–2022.08):实现x86/ARM/MIPS零代码迁移与国产处理器适配。
- 自动巡检系统(2022.08–2022.09):基于Selenium自动生成报告,节省人工1小时/天。
- 内部系统性能优化(2021.09):启用HTTP/2与静态压缩,响应时间缩短75%,性能提升4倍。
技术选型 采用 k3s 作为 Kubernetes 发行版,原因是部署快速、依赖少、资源占用低;网络层选择 Cilium,以 eBPF 提升网络性能并提供更透明的网络策略;持久化存储交由 Longhorn 实现数据副本管理,避免单节点故障导致的数据丢失。 架构设计 平台
整体方案 设计并实现了基于 GitOps 的自动化交付平台,核心由 ArgoCD 驱动,通过 Git 仓库作为单一可信源,统一管理配置、部署策略与应用生命周期。结合自研的发布控制面,实现「提交即部署」与「版本即回滚」的能力。 平台能力建设 自动环境校验:上线前自动扫