ID:416738

Carl

devops

  • 公司信息:
  • xiezhu
  • 工作经验:
  • 10年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 海淀

技术能力

操作系统与网络:精通Linux(CentOS/RHEL/Ubuntu)系统性能调优、内核参数优化及故障排查,熟练掌握TCP/IP协议栈、DNS、负载均衡(LVS/Nginx)及路由交换原理,能独立分析网络抓包数据。

容器化与编排:深入掌握Docker镜像构建、仓库管理及资源隔离,具备Kubernetes生产环境运维经验,包括集群部署、服务发现、Ingress配置、资源配额管理及Helm应用打包,能够处理常见的Pod异常与网络插件问题。

自动化与配置管理:熟练运用Ansible编写Playbook实现批量系统配置与应用部署,掌握Terraform进行云资源编排,实现基础设施即代码。同时具备Shell和Python脚本开发能力,用于日常巡检与自动化运维工具开发。

监控与日志系统:能够搭建并维护Prometheus + Grafana监控体系,配置合理的告警规则与可视化大盘;熟悉ELK/EFK日志平台,能够通过日志快速定位故障根因。

CI/CD与高可用:熟悉Jenkins、GitLab CI流水线设计,能够整合代码编译、镜像构建与自动部署。掌握Keepalived、Nginx等高可用方案,以及MySQL主从复制、Redis哨兵集群的运维保障。

项目经验

1. 某机构Kubernetes容器化平台建设(项目负责人)

背景:原有基于VM的部署方式导致资源利用率低(不足30%),应用发布需2小时且回滚困难。

行动:主导设计并落地了基于Kubeadm的生产级K8s集群(3 Master + 10 Worker),引入GitLab CI + Harbor + Helm实现代码提交自动构建镜像并发布至K8s。编写Terraform管理云资源,使用Prometheus + Alertmanager配置30+条精准告警规则。

成果:资源利用率提升至65%,单次发布耗时降至5分钟,支持一键回滚,全年可用性达99.99%。

2. 全国性系统全链路监控与高可用改造(核心运维)

背景:核心订单服务频繁因流量突增导致响应超时,故障定位平均需要40分钟。

行动:部署ELK日志平台收集日均50GB日志,通过Filebeat分片传输,编写Logstash过滤规则提取关键字段。搭建SkyWalking实现全链路追踪,定位到MySQL慢查询为瓶颈。引入ProxySQL实现读写分离,配置Keepalived + Nginx消除单点故障。

成果:故障平均定位时间从40分钟降至5分钟,系统峰值QPS提升3倍,连续两年无重大P1级事故。

3. 百台服务器Ansible自动化运维改造(独立实施)

背景:100+台服务器需逐个手动修改配置、更新内核补丁,每次变更耗时超过8人天且漏配率约15%。

行动:编写Ansible角色(Role)实现主机基线标准化(包括内核参数、安全加固、Zabbix Agent安装),使用AWX提供可视化的作业调度与权限控制。

成果:全量变更耗时降至30分钟,配置一致性达到100%,每月节省20人天运维工作量。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服