1、精通阿里云、腾讯云等公有云架构规划和资源交付,独立负责业务上云的各类云服务配置、交付及监控等。有丰富的生产项目运维经验,平均故障响应时长 10 分钟内。
2、独立开发一套告警系统,用于现公司的全生产告警,未出现过问题。
3、精通prometheus、grafana等可观测性监控系统。
4、精通linux、shell、python,有丰富生产项目的脚本开发经验。
5、精通k8s、docker 容器化技术,精通 jenkins,gitlab等 cicd 自动化开发部署运维流程。
6、精通 libvirt,qemu-kvm,ovirt虚拟化架构,有丰富的云桌面开发及运维经验。
7、精通各类中间件,lb负载均衡,消息队列等配置和排障。
8、精通tcp/ip网络协议,熟悉VRRP,BGP等协议。熟练使用抓包分析、熟悉网络安全技术,边界防火墙,waf应用防火墙等。
9、精通各类服务器基础硬件运维,磁盘阵列存储优化等。
1、独立设计、部署自动化招聘基础设施系统及运维告警体系。每个月节省至少100人天的工作量,并在2025年最后一个季度达到自动化招聘门店员工7554人。
2、独立设计、开发、落地公司生产环境的告警系统,打通云上、线下、飞书等告警链路渠道,应用于公司运维生产环境一年之久,未出现过问题。
3、合作完成跨云跨主体的系统迁移,包含但不限于云产品(ecs、vpc、alb、rds、oss、防火墙、waf等)层面及业务层面的迁移,帮助公司解决法务问题。
1、从裸服务器自建k3s集群 2、使用dockur/windows开源项目使用stateful搭建有状态windows集群 3、搭建可视化业务运维平台 4、配置全链路告警 每个月节省至少100人天的工作量,并在2025年最后一个季度达到自动化招聘门店员工7554人。
1、打通阿里云至飞书告警链路 2、全面接入阿里云全产品告警+业务告警 3、飞书卡片通知清晰明了,紧急告警自动电话+短信 4、告警看板展示当前告警状态 5、dify 工作流接收告警,自动进行运维ai agent 分析
1、全生命周期,独立开发 2、非常熟练小程序相关 3、使用ai+cloudbase 云开发 4、小程序已上线,正在推广