云原生基础设施工程师 | 交付型 DevOps | 擅长 Go 开发与自动化自愈体系
1. PaaS 组件高可用部署
精通 MySQL、ClickHouse、Redis、Kafka、ZooKeeper 等组件的多模式集群部署与 VIP 高可用配置。可独立交付 K8s 生产级集群,并提供标准运维手册和故障排查文档,确保交接后团队可自主维护。
2. 服务容器化与 K8s 迁移
支持传统服务平滑容器化改造:Dockerfile 编写优化、Docker Compose 编排、YAML/Helm 部署文件制作。具备 Go 开发能力,可编写定制化部署工具,将复杂迁移流程封装为一键式 CLI,降低人为出错率。
3. Prometheus + Grafana + Alertmanager 全链路监控
不止于搭建,更擅长监控自愈化改造:可根据业务需求开发自定义 Exporter、设计告警收敛与分级策略、打通邮件/钉钉/企业微信通知闭环。核心差异:能将监控数据反向驱动自愈动作(如检测异常自动重启服务、保留故障现场日志)。
4. 交付承诺
所有项目均提供结构化运维文档(含快速恢复指南、日常巡检清单、架构拓扑图),让您摆脱对个人的依赖,真正拥有系统的掌控权。
案例:Rsync 高可用自愈守护程序
某客户生产环境 Rsync 同步服务偶发异常退出,导致备份任务中断。
我的方案:使用 Go 编写独立守护进程,内嵌于 Rsync 主程序中。守护进程持续检测 Rsync 端口连通性及进程状态,一旦发现异常,自动触发拉起逻辑,并在重启前清理残留临时文件,防止同步冲突。
价值:将故障恢复时间从人工介入的 10-30 分钟缩短至 秒级自愈,告警同时闭环处理,无需人工干预。
案例:Rsync 高可用自愈守护程序 某客户生产环境 Rsync 同步服务偶发异常退出,导致备份任务中断。 我的方案:使用 Go 编写独立守护进程,内嵌于 Rsync 主程序中。守护进程持续检测 Rsync 端口连通性及进程状态,一旦发现异常,自动触发拉起逻辑,并在重
案例:Rsync 高可用自愈守护程序 某客户生产环境 Rsync 同步服务偶发异常退出,导致备份任务中断。 我的方案:使用 Go 编写独立守护进程,内嵌于 Rsync 主程序中。守护进程持续检测 Rsync 端口连通性及进程状态,一旦发现异常,自动触发拉起逻辑,并在重