猿急送>

北京运维兼职程序员

ID：416738

Carl

devops

公司信息：
xiezhu

工作经验：
10年

兼职日薪：
1000元/8小时

兼职时间：
下班后
周六
周日

所在区域：
北京
海淀

技术能力

操作系统与网络：精通Linux（CentOS/RHEL/Ubuntu）系统性能调优、内核参数优化及故障排查，熟练掌握TCP/IP协议栈、DNS、负载均衡（LVS/Nginx）及路由交换原理，能独立分析网络抓包数据。

容器化与编排：深入掌握Docker镜像构建、仓库管理及资源隔离，具备Kubernetes生产环境运维经验，包括集群部署、服务发现、Ingress配置、资源配额管理及Helm应用打包，能够处理常见的Pod异常与网络插件问题。

自动化与配置管理：熟练运用Ansible编写Playbook实现批量系统配置与应用部署，掌握Terraform进行云资源编排，实现基础设施即代码。同时具备Shell和Python脚本开发能力，用于日常巡检与自动化运维工具开发。

监控与日志系统：能够搭建并维护Prometheus + Grafana监控体系，配置合理的告警规则与可视化大盘；熟悉ELK/EFK日志平台，能够通过日志快速定位故障根因。

CI/CD与高可用：熟悉Jenkins、GitLab CI流水线设计，能够整合代码编译、镜像构建与自动部署。掌握Keepalived、Nginx等高可用方案，以及MySQL主从复制、Redis哨兵集群的运维保障。

项目经验

1. 某机构Kubernetes容器化平台建设（项目负责人）

背景：原有基于VM的部署方式导致资源利用率低（不足30%），应用发布需2小时且回滚困难。

行动：主导设计并落地了基于Kubeadm的生产级K8s集群（3 Master + 10 Worker），引入GitLab CI + Harbor + Helm实现代码提交自动构建镜像并发布至K8s。编写Terraform管理云资源，使用Prometheus + Alertmanager配置30+条精准告警规则。

成果：资源利用率提升至65%，单次发布耗时降至5分钟，支持一键回滚，全年可用性达99.99%。

2. 全国性系统全链路监控与高可用改造（核心运维）

背景：核心订单服务频繁因流量突增导致响应超时，故障定位平均需要40分钟。

行动：部署ELK日志平台收集日均50GB日志，通过Filebeat分片传输，编写Logstash过滤规则提取关键字段。搭建SkyWalking实现全链路追踪，定位到MySQL慢查询为瓶颈。引入ProxySQL实现读写分离，配置Keepalived + Nginx消除单点故障。

成果：故障平均定位时间从40分钟降至5分钟，系统峰值QPS提升3倍，连续两年无重大P1级事故。

3. 百台服务器Ansible自动化运维改造（独立实施）

背景：100+台服务器需逐个手动修改配置、更新内核补丁，每次变更耗时超过8人天且漏配率约15%。

行动：编写Ansible角色（Role）实现主机基线标准化（包括内核参数、安全加固、Zabbix Agent安装），使用AWX提供可视化的作业调度与权限控制。

成果：全量变更耗时降至30分钟，配置一致性达到100%，每月节省20人天运维工作量。