ID:420501

海底月

运维工程师

  • 公司信息:
  • 华为云计算技术有限公司
  • 工作经验:
  • 6年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 贵阳
  • 全区

技术能力

6年运维经验,曾担任华为外包运维组长,带领8人团队。精通Linux、Shell/Python自动化、Jenkins、Ansible等工具。擅长容器化与编排:Docker、K8s(管理过300+k8s节点集群)。熟练搭建Prometheus+Grafana监控、ELK日志系统。维护2000+台服务器。近期工作负责茅台大型电商云平台(注册用户超千万,日活峰值超百万)的运维保障、成本优化与监控体系建设,有等保3.0通过经历。参与华为昇腾开源社区后端建设。追求高效、稳定的运维解决方案,可远程支持项目上云、容器化改造、自动化脚本开发。

项目经验

项目名称: 茅台大型电商云平台运维保障与优化
担任角色: 运维主管
项目时间: 2023.07 – 至今
项目规模: 用户数超千万,高峰日活超过百万,云服务器资源数百台。
职责与成果:
1、规划云产品规格与容量,从0到1部署整个项目
2、主导性能问题排查与优化,配合阿里云完成人脸识别数据分析,有效拦截AI刷单、黄牛等非法攻击。
3、从0到1建设基于Prometheus+Grafana的监控体系,覆盖核心业务与基础设施。
4、从0到1建立人员账号与权限管理体系,合理安排运维小组值班、重保,定期向管理层汇报运维情况。

项目名称: 3000+ 服务器集群容器化改造与自动化运维体系建设
担任角色: 核心运维工程师 / 项目负责人
项目时间: 2020.03 – 2021.08(驻场华为合作项目)
项目规模: 管理 3000+ 台服务器(云主机 + 裸金属),最终全部切换至容器化环境。
职责与成果:
容器化改造:主导将传统环境(3000+ 服务器)整体迁移至 Docker + Kubernetes 架构,独立打造并维护 300+ 节点规模的 Kubernetes 集群,根据业务需求进行优化及二次开发。
CI/CD 流程建设:独立设计并实施基于 Jenkins + Kubernetes 的 CI/CD 流水线,实现代码自动构建、镜像打包与容器化部署,大幅提升发布效率。
监控与日志体系:从零搭建 Prometheus + Grafana 监控系统,覆盖集群与业务指标;同时部署 EFK(Elasticsearch + Fluentd + Kibana)日志收集系统,实现日志集中检索与告警。
批量管理工具升级:维护原有 Puppet 批量管理工具,并主导平滑切换至 Ansible,提高配置管理与自动化运维效率。
开源社区支持:参与华为昇腾(Ascend)开源社区(gitee.com/ascend)后端环境建设,保障社区基础设施稳定运行。
自动化推进:编写 Python/Shell 脚本,推动日常运维任务自动化,降低人工干预成本。
项目亮点:
独立完成 3000+ 服务器转 Kubernetes 集群 的落地与运维,支撑业务容器化转型。
实现从传统环境到容器化的 零中断切换,保障业务连续性。
建立完整的 监控 + 日志 + CI/CD 技术栈,为后续自动化运维奠定基础。

案例展示

  • 3000+服务器大规模容器化改造

    3000+服务器大规模容器化改造

    项目背景:某大型互联网项目传统环境运行于3000+台服务器,存在资源利用率低(约30%)、业务扩容需2小时、环境不一致等问题。 担任角色:核心运维/项目负责人(独立落地) 技术栈:Docker + Kubernetes(3000+节点)+ Jenkins + Promethe

  • 茅台大型电商云平台运维保障与优化

    茅台大型电商云平台运维保障与优化

    项目名称: 茅台大型电商云平台运维保障与优化 担任角色: 运维主管 项目时间: 2023.07 – 至今 项目规模: 用户数超千万,高峰日活超过百万,云服务器资源数百台。 职责与成果: 负责平台整体运维,完成系统等保3.0建设,保障业务稳定性达到99.99%。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服