ID:232578

allenzhang

高级运维工程师

  • 公司信息:
  • 微鲸科技
  • 工作经验:
  • 15年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 上海
  • 浦东

技术能力

1.云计算与虚拟化技术:熟悉 UCloud 公有云平台的操作与管理,能够高效管理和维护 CentOS 和 Windows 操作系统的云主机。同时,还需具备 IDC 托管大数据物理服务器的管理经验。
2.自动化部署与配置管理工具:精通 Ansible Playbook、Puppet 等自动化部署工具,能够批量同步指令和配置文件,实现多种应用服务(如 keepalived、nginx、tomcat、redis、mysql 等)的自动化部署。
3.持续集成与版本控制:熟悉 Jenkins 和 Git 等持续集成与版本控制工具,能够配置和使用这些系统,实现服务代码的日常发布与版本管理。
4.监控系统与告警通知:具备 Zabbix、Prometheus 等监控系统的部署与优化能力,能够使用 Shell 和 Python 进行监控需求开发,实现手机短信、钉钉、企业微信等渠道的 24 小时实时告警通知。
5.日志管理与分析:掌握 ELFKK(Filebeat、Kafka、Logstash、ES、Kibana)日志分析系统的部署与使用,能够通过分析日志发现服务潜在问题,并进行排查和解决。
6.脚本编程与自动化任务:熟练使用 Shell 和 Python 编程语言,能够编写脚本处理重复、繁琐和易出错的人工操作任务,包括 mysql,redis 定时备份,开机自启,定时探测等。
7.系统性能优化:能够根据服务并发量,不定期优化内核参数和中间件服务(如 Mysql、Redis、nginx 等),确保系统稳定运行并达到最佳性能。
8.网络技术与安全:熟悉 DNS 劫持原理、TCP/IP 协议和 TLS 等网络技术,能够处理相关工单并应用这些技术于实际运维工作中。
9.CDN 加速与防盗链:具备选型和对接多家商用CDN 的能力,能够根据业务类型选择合适的加速方式和防盗链策略,提升网站访问速度和安全性。
10.容器化与容器编排:熟悉 Docker, Kubernetes 容器技术,能够实现高可用集群服务的部署和使用,管理维护相关的容器化服务。
11.IT 基础架构管理:负责公司网络、设备,核心交换机的正常运行,包括硬件、软件、网络等方面的管理与维护。

项目经验

2024.05-2024.07 TV 软终端项目
项目描述:在这个项目中,我服务在甲方提供的 60 台 ubuntu20.04 虚拟机上部署分布式运维架构,以支撑重大节日大规模的高并发流量,和业务系统的可扩展性。
项目职责:
和甲方沟通分析需求,设计出一套高可用的运维架构,并对系统做安全加固。
使用 shell/python 脚本语言和 ansible playbook 实现了所有云主机的初始化,基础软件环境的批量部署。
优化了 Keepalived、Nginx、MySQL 和 Redis 等软件服务,配置出能够应对瞬时大并发流量并具备扩容能力的运维架构
部署开源发布系统 spug,编写 python 脚本实现 CI/CD 流程,方便代码可以快速迭代更新。
部署 Prometheus,Grafana 监控系统和 ELKF 日志分析系统,配置钉钉告警,实时监控项目内所有主机的软硬件资源,存活状态,以及接口状态码。
在上线前配合测试对重要接口进行了 jmeter 压测,确保服务的稳定性。
完成项目交付时,输出了运维部署和安全测试验证的详细文档,方便后续的技术支持。
业绩成果:
在重大节日的高流量期间,成功处理了瞬时流量,保障了业务服务的稳定。
通过监控和日志分析系统,可以预测容量需求,提前扩容,增加主机就可以提升服务的能力。

2020.10-2020.10 Docker 容器构建 gitlab 代码仓库系统
项目描述:将 vmware 虚拟机部署的 gitlab 代码仓库系统迁移至 Docker 容器,实现实时差异备份。
项目职责:
配置 CentOS 7.2 环境,安装 Docker 并设置镜像加速。
下载并管理 GitLab、PostgreSQL、Redis 镜像,构建本地镜像仓库。
编写 docker-compose,快速启动容器集群并测试 GitLab 功能;导入 PostgreSQL 数据,使用 docker- compose 管理容器集群。
监控 Docker 服务状态,编写脚本实现 Git 仓库实时增量备份。
业绩成果:
简化部署流程,通过 Docker 实现高效部署。
优化镜像管理,构建本地与私有仓库提升便捷与安全。
强化服务与数据安全监控,确保稳定运行与数据安全

2017.08-2017.08 抽奖秒杀活动
项目描述:设计运维活动架构,监控和保障活动期间各系统业务高效 、稳定运行。
项目职责:
组织评审会,评估 PRD 可行性,确保产品方案高效安全;制定风险预案,规避潜在风险,保障活动顺利进行。
基于需求,选择合适技术栈,构建高效运维架构;制定上线流程,实现活动自动部署与实时监控。
协调各部门确保活动准备充分,活动期间亲自值守;利用 ELK 监控活动性能,编写脚本提升系统稳定性。
业绩成果:
活动期间系统运行稳定,吸引 105 万用户参与,用户活跃度提升 30%。
成功建立活动保障体系,降低运营风险,提高工作效率。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服