熟悉 Python 编程、熟悉 Linux 系统命令操作、熟悉 Shell 微代码编程,熟悉 MySql数据库,了解 Redis 存储系统。
技术栈:Python、Flask、Celery、Redis、MySQL、psutil、Bootstrap、ECharts、Docker、Ansible、Kubernetes
服务器资源与物理指标监控告警系统
项目描述:设计并实现了一套企业级运维监控平台,实时采集服务器 CPU、内存、磁盘、网络等指标,提供可
视化仪表盘、历史趋势分析及阈值告警功能。项目采用容器化、自动化部署和容器编排技术,具备生产环境交
付能力。
个人贡献:
基于 psutil 开发多平台指标采集模块,通过 Celery Beat 每 60 秒定时触发异步任务,实现非阻塞采集。
设计 MySQL 表结构(hosts、metrics_history、alert_rules、alert_events),建立联合索引,历史数据查询 ≤200ms;
利用 Redis 缓存最新指标,降低数据库压力。
开发 Flask REST API(实时数据、历史趋势),前端集成 ECharts 展示 24 小时曲线。
实现告警引擎:支持 CPU/内存/磁盘阈值自定义,超阈值记录事件并打印日志,预留邮件扩展。
编写 Dockerfile 及 Docker Compose,一键启动全部服务;通过 Ansible Playbook 实现远程服务器自动化部署;
完成 Kubernetes 资源编排(Deployment、Service、ConfigMap、Secret)。
项目成果:
交付服务器 + 环境监控系统,采集 CPU/内存/磁盘/温湿度/灰尘/UPS 等 15+ 指标,数据查询 ≤200ms,累计
存储 500 万条记录。
实现空调联动控制(温度超 28℃ 自动制冷),支持告警与日志记录。
容器化(Docker Compose 一键启动)+ 自动化部署(Ansible)+ 容器编排(K8s),交付效率提升 30 倍。