熟练掌握 Kubernetes 容器编排技术 ,如:组件原理 ,应用部署和故障排查 ,资源清单编写等
熟练掌握 Docker 容器虚拟化技术 ,如:操作命令、工作原理、镜像制作、仓库搭建等
熟练掌握 Zabbix 和 Prometheus 监控工具 ,如:工作原理、 自动发现、 自动告警等
熟练掌握 devops 自动化流水线项目部署
熟练掌握 EFK 日志收集平台的部署和维护
熟练掌握 Linux 操作系统的使用 ,如:用户管理、文件处理、系统资源管理、服务管理等命令
熟练掌握 iptables 防火墙规则的编写
熟练掌握 Shell 脚本的编写 ,能满足日常使用需求
熟练掌握 Apache、 Nginx、Tomcat 的工作原理 ,服务部署 ,故障排查
熟练掌握 LVS、 Nginx 负载均衡技术 ,并使用 Keepalived 实现高可用
熟练掌握 DHCP、 DNS、 FTP、 Rsync等网络服务的搭建和基础工作原理
熟练掌握 MySQL 数据库,如:数据库的主从搭建及其原理 ,使用 Amoeba 实现读写分离等
熟练掌握 Redis 数据库,如:数据持久化原理、主从同步、高可用集群构建、哨兵模式构建等
熟练掌握 NFS 网络文件系统、i SCSI 块存储、 MFS 、Ceph分布式存储的原理及部署
熟练掌握 AI大模型和推理框架的部署,如:vllm、sglang、ollama等主流框架的部署
熟练掌握ansible自动化运维工具的部署和使用,同时操作多台服务器
负责各种高可用集群的搭建部署以及维护,保证公司业务服务的稳定运行 如:kubernetes 高可用集群,mysql高可用集群,ceph分布式高可用存储集群等。
负责项目的部署和维护,以及后续版本升级、版本回滚
负责使用监控工具监控业务系统,包括资源使用情况、服务的状态等,以及处理告警信息
负责镜像的制作、管理、维护和升级
负责自动化流水线的部署和维护
负责搭建开发、测试的运行环境,配合开发、测试团队完成相关运维工作
负责数据的备份,按照备份策略进行数据备份以及还原测试,后台稳定性测试
负责规划安排框架,并做部署和测试
负责编写shell脚本供日常需求使用
负责编写运维文档并及时向上级汇报
负责各服务器信息登记表格
负责保证公司各员工使用的设备正常工作
独占完成部署生产环境需要的kubernetes高可用集群+可视化界面+devops自动化部署流水线。
独自完成测试环境预热环境线上环境devops自动化部署,保证业务部署测试上线自动化部署到k8s集群并正常运行