ID:397219

ㅤㅤㅤㅤ

运维工程师

  • 公司信息:
  • 中科驭数北京科技有限公司
  • 工作经验:
  • 4年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

我具备广泛的IT运维和开发技能,能够熟练运用多种工具和技术来优化系统管理和提高工作效率。在系统管理方面,我精通JumpServer堡垒机的部署与维护,确保安全的远程访问和权限控制。对于高性能计算(HPC)环境,我熟悉LSF作业调度系统的配置与管理,能够有效分配计算资源。在身份认证领域,我熟练使用AD/LDAP/NIS进行用户管理和权限分配,确保系统安全。此外,我擅长使用Prometheus和Grafana进行系统监控和可视化,实时掌握系统运行状态。在自动化运维方面,我熟练使用Ansible进行批量配置管理和任务自动化,提升运维效率。对于虚拟化技术,我精通VMware vCenter和ESXi的部署与管理,能够高效管理虚拟机资源。在脚本编写方面,我熟练掌握Shell脚本和Python编程,能够快速开发自动化脚本和工具。在版本控制方面,我熟练使用GitLab进行代码管理和协作开发。对于容器化技术,我熟悉Docker的部署与管理,能够实现应用的快速部署和扩展。最后,我熟悉NFS和FTP等文件共享协议,能够高效管理和共享文件资源。这些技能使我能够全面应对复杂的IT环境,提供高效、安全的解决方案。

项目经验

云化迁移升级项目

项目背景:公司硬件研发集群环境过度依赖单台master服务器,存在硬件过保、单点故障等风险,且随着研发人员和工程数量增加,服务器性能瓶颈日益凸显。为提升集群稳定性、可靠性和可扩展性,我主导并实施了云化迁移升级项目。

一、项目职责:

1、需求分析与方案设计: 深入分析现有集群架构,识别单点故障、性能瓶颈等风险点,设计云化迁移方案,包括双活云主机、多登录节点扩展、存储服务优化等,并制定分批切换和整体切换两种迁移策略,以及详细的回退方案。
2、环境准备与测试验证: 搭建新的云化环境,包括7台登录节点、双活master服务器、专业存储服务等,并完成系统初始化配置。将部分计算节点迁移至新环境进行测试,解决研发人员反馈的问题,确保新环境稳定可靠。
3、迁移实施与风险控制:按照既定方案,组织并实施计算节点迁移工作,包括数据挂载、NIS环境迁移、LSF服务配置等,并密切关注迁移过程中的风险点,及时处理异常情况,确保迁移工作顺利完成。

4、项目总结与经验沉淀: 对项目进行总结,分析项目过程中的经验教训,并形成文档,为后续类似项目提供参考。

二、项目成果:

1、成功将原有集群环境迁移至云化环境,解决了单点故障、性能瓶颈等问题,提升了集群的稳定性、可靠性和可扩展性。
2、优化了NIS、LIC、APP等关键服务的部署架构,实现了故障自动切换,提高了服务可用性。
3、将APP工具迁移至专业存储,提升了工具访问的稳定性和性能。
4、通过云主机的快照机制,提高了数据安全性,并能够在极短的时间内恢复业务。
5、减少了物理服务器的资金投入,降低了运维成本。

三、个人价值体现:

1、具备独立承担复杂项目的能力,能够从需求分析、方案设计、环境搭建、测试验证到最终实施,独立完成项目全生命周期管理。
2、具备较强的风险意识和风险控制能力,能够预见并有效控制项目风险,确保项目顺利实施。
3、具备良好的沟通协调能力和团队合作精神,能够与研发人员、运维团队等各方进行有效沟通,共同推动项目进展。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服