ID:384856

静虑离妄念 持珠当心上 阿弥陀佛 有团队

系统运维工程师

  • 公司信息:
  • 上海天正智能数据服务有限公司
  • 工作经验:
  • 15年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 上海
  • 浦东

技术能力

● 熟练操作系统(如Windows、Linux)的安装、配置和维护;
● 熟练掌握Linux操作系统常用命令,掌握Linux环境下系统搭建、日志分析等;
● 熟练掌握VMwhare vSphere,KVM,OpenStack虚拟化技术的安装部署,包括虚拟化克隆,虚拟化快照技术,虚拟机在线迁
移,虚拟化网络设置,虚拟化存储
● 熟练操作Linux系统,如:SSH、DHCP、VSFTP、NFS、DNS、Rsync等各种基本服务的部署、配置和优化;
● 掌握Linux下高可用集群Keepalived、Heartbeat+drdb以及负载均衡集群Keepalive+LVS、Nginx、Haproxy等的原理与安装
配置;
● 熟练掌握Shell脚本,如部署脚本、日志分割备份脚本、监控脚本以及计划性任务等;
● 熟练掌握无人值守安装原理,通过Kickstart,Puppet,Ansible,saltstack等相关技术,实现操作系统自动化安装及初始化配
置等,实现自动化运维管理;
● 熟练掌握MySQL数据库技术,熟练运用sql语句,熟悉集群搭建、主从同步、读写分离等;
● 熟练掌握Redis集群部署、主从复制、哨兵模式;
● 熟悉高可用集群、负载均衡、集群规划与搭建,掌握LVS、Keepalived、Nginx、HAProxy、Ceph等服务;
● 熟悉大规模集群管理工具Ansible,会编写Playbook剧本;
● 熟悉ELK和EFK日志收集平台的搭建,可以收集 k8s、业务组件、容器日志;
● 熟悉Zabbix、Promethes+grafana等监控系统的搭建和额维护,可实现对Kubernetes集群资源指标的自动化监控,并可预设
报警阀值完成报警通知,达到自动化运维监控;
● 熟悉基于Jenkins+Kubernetes构建DevOps流水线,自动发布代码;
● 熟悉Jenkins持续集成工具,熟悉gitlab代码版本控制系统;
● 掌握Jenkins版本升级、离线安装、插件离线安装;
● 熟练Docker容器话部署、使用和优化、掌握dockerfile构建镜像:如nginx、tomcat、apache、httpd等;
● 熟练Kubernetes高可用集群的部署,使用和管理维护,具备线上使用,故障自恢复,认证,鉴权,多租

项目经验

上海人行非税收入收缴电子化管理系统
项目简介:负责国家级金融机构核心业务系统的运维架构搭建与保障,基于 LNMT(Linux+Nginx+MySQL+Tomcat)架构构建高可用平台,整合多层级负载均衡、数据主从同步及全链路监控体系,支撑千万级交易量的 Socket 与 Web 应用稳定运行。
核心职责:
1、高可用架构搭建:主导 MySQL 主从复制集群部署,结合 Keepalived 实现数据库故障 15 秒内自动切换,同步延迟控制在 100 ms 内;搭建 Nginx+Keepalived 负载均衡集群,实现前端请求每秒 5000 + 并发的平稳分发,单点故障切换零感知。
2、中间件与数据层构建:独立完成 RabbitMQ 消息队列(峰值 TPS 3000+)与 Redis 缓存集群(命中率 99.2%)的部署调优,解决分布式系统数据一致性问题;设计 ElasticSearch+Fluentd+Kibana 日志平台,实现每日 10TB 原始报文数据的实时存储与毫秒级检索。
3、全链路监控体系:搭建 Zabbix 监控平台,覆盖 Nginx/Tomcat/Socket 等 12 类组件及 200 + 服务器节点,自定义150 + 监控指标与告警阈值,实现异常 5 分钟内自动告警,故障定位效率提升 60%。
4、自动化运维建设:编写 20+Shell 脚本实现全流程自动化,包括:
● 一键部署脚本:将环境部署时间从 8 小时缩短至 30 分钟
● 智能备份脚本:实现 MySQL 数据每日增量 + 每周全量备份,恢复成功率 100%
● Zabbix 自愈脚本:针对内存溢出、连接数过高等常见故障实现自动修复,减少 80% 人工干预
5、跨团队协作:配合开发团队定位并解决测试环境各类技术问题 30+,制定 7×24 小时运维保障方案,推动项目顺利上线并稳定运行。
业绩:
● 保障系统上线后实现 99.99% 可用性,零重大故障,支撑日均 50 万 + 笔非税收入交易稳定处理
● 通过自动化运维体系将故障恢复时间从平均 40 分钟降至 5 分钟内,年度运维成本降低 30%
项目经历
● 构建的监控与日志平台成为人行系统运维标准化方案

团队情况

  • 整包服务: 运维类开发   DBA开发   其他开发   
角色 职位
负责人 系统运维工程师
队员 后端工程师

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服