一、系统与自动化运维
1. **Linux 系统管理**
- 精通 CentOS/RedHat 的集群管理、内核参数调优及故障诊断,具备系统级性能瓶颈分析能力(如 I/O、内存泄漏排查)。
- 熟练使用 `systemd`/`journalctl` 管理服务,通过 `sar`/`vmstat` 等工具实现资源监控与优化。
2. 自动化运维体系
- 编写高效 Shell 脚本实现日志切割、备份等定时任务,并通过 Ansible Playbook **标准化集群配置**(如用户管理、安全加固)。
- 基于 Ansible Roles 实现中间件一键部署,支持**跨千节点**批量操作。
---
二、数据库管理
1. MySQL
- 掌握主从复制、读写分离(ProxySQL)、GTID 故障切换,精通 XtraBackup 物理备份及 Binlog 时间点恢复。
- 优化慢查询、索引策略,压测集群抗并发能力(Sysbench)。
2. **Redis**
- 部署 Redis Cluster 与哨兵集群,实现**自动故障转移**;通过 Pipeline/AOF 调优保障高吞吐与数据持久化。
---
三、中间件与高可用架构
1. Web 中间件
- 优化 Nginx(动静分离、缓存策略)、Tomcat(线程池/JVM 参数),实施 LVS DR 模式 + Nginx 七层负载**双层级分发**。
- **高可用实践**:基于 Keepalived 部署 Nginx 主备集群,实现 VIP 漂移与毫秒级故障切换 。
2. 云服务集成
- 阿里云 ECS 弹性伸缩、RDS 只读实例扩展,通过 SLB 对接自建集群;使用 NAS 共享存储保障**容器持久化数据** 。
---
四、持续集成与监控
1. CI/CD 流水线
- 设计 Jenkins + GitLab 自动化流水线,集成 SonarQube 代码扫描,实现**版本自动发布/回滚**(Kubernetes RollingUpdate 策略) 。
2. 监控体系
- 构建 **Prometheus + G
### Kubernetes 集群建设与业务迁移项目
#### 项目描述
基于 Kubernetes 重构新业务架构,将 Docker 容器配置标准化迁移至生产环境,实现容器配置的集中化管理与高效运维。
#### 项目职责
1. **高可用集群搭建**
- 部署 **3 Master + 3 Node** 测试集群,采用堆叠式高可用架构
- 通过 `kubeadm` 自动拉取 etcd、kube-proxy、api-server 等核心组件镜像,完成集群初始化
2. **应用编排与发布控制**
- 编写 Deployment 资源清单实现 Pod 副本控制,保障应用可用性
- 配置滚动更新策略,支持零停机发布与版本回滚(`kubectl rollout undo`)
3. **服务暴露与流量治理**
- 创建 Service 暴露集群内服务,部署 **ingress-nginx Controller** 实现七层负载均衡
- 采用 DaemonSet 模式全局部署 ingress-controller 至所有 Node 节点
- 设计 Ingress 路由规则实现多服务域名分流(如 `host: api.example.com`)
4. **验证与标准化**
- 配置 DNS 解析进行端到端访问测试,验证服务连通性
- 编写集群部署规范、故障处理预案等运维文档