1)精通CentOS/Ubuntu等主流Linux系统的运维与故障排查
2)深入理解TCP/IP协议栈,擅长快速定位及解决复杂网络问题
3)具备Nginx/Tomcat/MySQL/Redis/CDH等服务的集群部署、优化及高可用保障能力
4)熟练运用Prometheus+Zabbix+Grafana构建全链路监控告警体系
5)擅长Shell/Python脚本开发,提升运维效率
6)拥有阿里云/腾讯云/华为云等主流云平台实战管理经验
7)精通Docker/K8s容器化技术,具备生产环境落地实践经验
8)熟练部署Superset/Archery/Jumpserver等运维支撑系统
9)掌握Ansible+GitLab+Jenkins自动化运维流水线建设
一、政务云项目
1. 负责省级政务云大数据平台建设,部署管理节点CDH集群,支撑数据处理
2. 构建AI语音系统弹性架构(K8s+Prometheus),实现CPU利用率>80%时自动扩容,资源浪费降低60
3. 主导本地机房迁移上云方案,完成200+虚拟机迁移,核心业务平滑过度
4. 优化Superset数据可视化平台,复杂查询响应时间从12s缩短至3s
二、私有化scrm项目
1. 参与部署公司基于腾讯云搭建的百万级别scrm系统,部署并维护100+节点生产集群,设计自动化告警监控体系,实现系统全年可用性99.97% ;
2. 参与构建SRE服务保障体系,通过全链路日志分析和智能定位脚本,将平均修复时间缩短,客户满意度达到98.5%;
3. 对公司开发、测试部门提供技术支持(如项目测试的环境需求, 环境搭建的技术支持,数据抽取的需求);
1. 负责省级政务云大数据平台建设,部署管理节点CDH集群,支撑数据处理 2. 构建AI语音系统弹性架构(K8s+Prometheus),实现CPU利用率>80%时自动扩容,资源浪费降低60 3. 主导本地机房迁移上云方案,完成200+虚拟机迁移,核心业务平滑过度 4
1. 参与部署公司基于腾讯云搭建的百万级别scrm系统,部署并维护100+节点生产集群,设计自动化告警监控体系,实现系统全年可用性99.97% ; 2. 参与构建SRE服务保障体系,通过全链路日志分析和智能定位脚本,将平均修复时间缩短,客户满意度达到98.5%; 3. 对公司