2025.03–2025.05 东营职业学院校园高可用运维自动化项目
项目背景:校园机房 12 组老旧服务器集群硬件性能衰减、资源利用率低,年度维保与人工运维成本约 22 万元;核心教务、一卡通、校园门户运行于单实例 MySQL 5.7,无高可用与灾备,存在数据丢失与业务中断风险,需完成非核心服务轻量化迁移并构建高可用与自动化运维体系。
项目职责:
1.构建 XtraBackup 全量 + 增量定时自动化备份平台,实现数据可校验、秒级恢复、全程可追溯。
2.搭建 MySQL 一主两从高可用架构,基于 MHA+GTID + 半同步实现跨网段容灾,结合 Keepalived 实现 VIP 自动漂移,故障切换≤40 秒。
3.搭建 Zabbix+Grafana 统一监控告警平台,对高可用组件、服务状态、资源负载实时监控,配置邮件 + 企业微信双渠道告警;灾备演练将 RTO 控制在 1 小时内。
4.编制运维培训课件,输出 Ansible 自动化部署、云迁移、故障处置 SOP,保障校园业务 7×24h 稳定运行。
2021-2023.05 中国石油大学智慧校园项目
项目背景:中国石油大学原有一卡通系统无法满足疫情防控及校园管理升级需求,需对人员、安防、教学、服务等多系统进行智能化改造,实现云原生部署、业务零停机迭代与全流程监控,提升校园管理智能化水平与服务效率。
项目职责:
1.统筹项目运维工作,负责云原生架构落地、CI/CD 流程搭建、零停机迁移及监控体系建设优化。
2.搭建 GitLab-Jenkins-Harbor-K8s 自动化部署体系,编写发布回滚脚本,实现校园服务高效可控迭代。
3.深度优化系统镜像,配置自动化部署与消息通知机制,提升镜像效率与部署可追溯性。
4.制定零停机迁移方案,完成多系统平滑迁移;编写设备安全控制脚本,实现高温异常自动关阀防护。
5.自定义监控告警规则与三级阈值,优化数据采集策略,实现异常快速告警与设备实时监控。