熟悉 Linux 运维,能处理常见故障排查(CPU、内存、磁盘、网络)
熟悉 Docker 与 Kubernetes 基本使用,支持容器部署与应用发布
熟悉 Nginx 反向代理、负载均衡与基础高可用配置
使用 Prometheus / Grafana / Zabbix 进行监控告警
会 Shell 脚本,能做自动化运维
了解 TCP/IP、HTTP 协议及常见网络问题排查
负责应用系统日常运维与稳定性保障,处理线上故障与问题排查
基于 Nginx + Keepalived 搭建高可用架构,提高服务可用性
负责 Kubernetes 集群维护与容器化应用部署与发布
搭建 Prometheus + Grafana + Zabbix 监控体系,实现统一监控与告警
使用 Shell 脚本进行运维自动化改造,提升发布与运维效率
针对公司线下环境原有的单点 Nginx 架构存在的节点失效风险,牵头主导 4 套核心线下环境向 Tengine + Keepalived 高可用架 构的深度重构,项目涉及引入双机热备机制与 VIP 自动漂移方案;制定统一配置模板与证书命名规范,并将核心配置纳管至运维一 体化平
应用节点出向访问 实施工程师 为临时解决新一代应用节点上线有出向访问需求,配合现有架构的情况,协助组长规划方案,通过搭建dnsmaq + tengine 正向代 理的方式,快速满足了业务上线的网络合规性要求,保障了项目的准时交付。 成功将复杂的正向代理架构平滑落地,保障