ID:413845

一切自然

运维工程师

  • 公司信息:
  • 成都瓦克斯网络科技有限公司
  • 工作经验:
  • 10年
  • 兼职日薪:
  • 700元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 成都
  • 高新

技术能力

云平台与容器编排
熟悉 AWS、阿里云 基础设施与服务配置。
熟练使用 Kubernetes、Rancher、Cilium、Istio 进行容器管理与服务治理。
熟悉 Helmfile 进行多环境配置管理,掌握使用 Velero 实现集群备份与恢复。

监控与日志
具有 Prometheus、Zabbix、EFK、Grafana 等监控与可视化平台部署与优化经验。自动化与中间件
熟悉 Ansible、Jenkins/GitLab CI、LDAP、Jumpserver、CMDB 等自动化与权限管理工具。
熟悉 PostgreSQL、MySQL、Redis、Elasticsearch、MongoDB 运维与调优。
熟悉 Nacos、Kafka、Nginx、Eureka、Apollo 等中间件与消息系统。

高并发架构与脚本开发
参与高并发系统架构设计与性能优化,提升大规模并发处理能力。
熟悉 Shell 脚本,掌握 Go 基础开发,了解 Python 脚本编写。

区块链技术与大数据
具备 BTC、ETH 节点部署与转账操作经验,了解区块链相关系统的运维与优化。
了解 CDH 大数据集群的部署与基础组件调优,具备中间件平台的运维经验。

安全防护与合规治理
负责代码静态扫描,接入 SonarQube、Trivy、Dependency-Track 等工具,定期进行代码质量与安全风险评估。
推动中间件与基础组件的版本升级,修复已知高危漏洞(CVE),保障系统安全性与稳定性。 参与网站安全加固,实施 HTTPS 全站升级、HTTP 安全头配置,防御 GET/POST 型DDoS 攻击等。 配合安全合规检查,跟进漏洞修复与复测,强化系统防护能力。

项目经验

项目一:高可用容器化平台与可视化
项目背景:为提升开发部署效率与系统稳定性,公司实施微服务架构容器化改造。
技术栈: AWS、Kubernetes、Rancher、Prometheus、Grafana、Helmfile
关键工作:
负责 Kubernetes 集群部署与管理,结合 Rancher 实现多集群可视化运维。
引入 Helmfile,将多环境配置“代码化”,消除手动配置差异带来的风险。
部署 Prometheus+Grafana 监控体系,联动自动告警,实现分钟级故障响应。
设计并实施容器资源限额与调度策略,通过 Requests/Limits、优先级与节点亲和性配置,保障核心业务在资源竞争时的稳定性,提升集群整体资源利用率。
成果:
容器化平台部署时间缩短 50%,系统可用性与扩展性显著提升,服务发布更敏捷。 服务故障自动恢复时间由原先 10 分钟缩短至 3 分钟以内,极大增强业务韧性。
项目二:高并发场景下的资源治理与网络性能优化
项目背景:作为交易平台高并发场景下,对系统的弹性扩容能力、网络性能与稳定性提出了更高要求。为支撑业务增长,开展了基于 Kubernetes 的资源治理与网络优化专项工作。
技术栈:Kubernetes、HPA、VPA、Cluster Autoscaler、Cilium(eBPF)
关键工作:
配置核心服务的 HPA 策略,基于 CPU /内存/ QPS 等指标实现自动扩容,秒级应对流量高峰。 针对中间件、风控等资源敏感型服务,引入 VPA 动态调整资源 Requests / Limits,减少资源浪费,避免 OOM 影响业务稳定。
部署 Cluster Autoscaler,根据集群整体负载自动扩缩容节点,提升集群弹性能力。 使用 Cilium 替代 kube-proxy,基于 eBPF 优化服务间通信路径,降低延迟,提升大规模集群下的网络吞吐能力。
项目成果:
核心服务扩容响应时间缩短至 2 分钟以内,保障高并发交易场景下系统稳定运行。 VPA 动态调优后,服务资源利用率提升 30%,稳定性明显增强。
Cilium + eBPF 优化后,服务间通信延迟降低 20%,支撑高频交易与实时推送需求。 通过资源治理与网络优化,平台整体抗压能力与可用性大幅提升。
项目三:EFK 日志平台部署与告警
项目经验
项目背景:公司微服务架构日益复杂,现有日志分散,缺乏统一采集与检索分析能力,运维排障效率低下。为支撑高并发业务场景下的快速故障定位与运维可观测性,决定部署 EFK 日志平台。技术栈:Elasticsearch、Fluentd、Kibana、Kafka、Helm、Loki(对比评估)
关键工作:
规划并部署 EFK 日志平台,设计日志采集、存储、查询、展示全链路方案。
使用 Fluentd DaemonSet 实现容器日志的统一采集与转发,结合 Kubernetes 标签实现多环境隔离。 优化 Elasticsearch 索引模板与存储策略,平衡高并发检索与存储成本。
通过 Kibana 自定义仪表盘,实现按服务、环境、关键字的实时日志查询与分析。 使用 Elasticsearch 自带告警,将关键异常日志转为告警事件,提升故障响应速度。项目成果:  日志收集覆盖率 99.9%,实现分钟级全局检索与定位。
运维人员排查线上故障平均用时从 30 分钟降至 5 分钟。
项目四:基于 Nacos 的集中配置与生产发布流程优化
项目背景:核心业务的快速迭代,配置变更频繁、环境差异导致的发布风险逐渐凸显。为提升配置管理规范性与发布稳定性,提出并推动“配置集中化管理 + 上线流程标准化”方案,保障高并发场景下的业务稳定运行。
关键工作:
提出并落地 Nacos 集中配置管理方案
梳理原有分散配置问题,制定统一规范,将多环境配置集中至 Nacos 统一管理。 推动自动化发布脚本与标准化流程,确保上线操作安全、可追溯。
联动 Nacos 与发布系统,打通“配置 + 代码”一体化上线链路。
项目成果:
配置变更效率提升 60%,环境配置差异导致的问题减少 90%。
生产发布流程规范后,发布出错率大幅降低,保障核心业务稳定上线。
支撑高并发活动场景下,配置与代码发布的高效协同,显著提升平台韧性。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服