熟练掌握linux操作系统运维相关的技术:dns服务、web服务httpd/nginx/tomcat等、高可用haproxy/keepalive等;私有云虚拟化技术:libvirt/qume/kvm/openstack/vmware等;公有云平台产品:ECS/VPC/S3/RDS/IAM等;容器化相关技术:docker/docker-compose/containerd/k8s/openshift等;持续集成持续发布:Jenkins/gitlab/sonarqube/nexus/harbor/git等;运维自动化:ansible;日志监控体系:filebeat/elasticsearch/kibana/prometheus/grafana等;开发运行环境构建:java/maven/nodejs/golang/python等;熟练使用rhel/centos/ubuntu/debian等操作系统;数据库:mysql/postgresql/redis等;GPU相关技术:NVIDIA系列显卡驱动安装/gpu虚拟化等
业务容器化迁移:使用docker相关技术容器化业务服务,将业务迁移到容器平台部署;涉及到docker/harbor/k8s/nginx/ingress、域名解析以及开发语言相关技术Java/tomcat/eureka/gateway/nacos/nodejs/nginx等;
流水线平台设计搭建及配置:设计持续集成持续发布的环节并选型相关的技术产品,实现代码发布到自动化上线;涉及到的技术产品gitlab/jenkins/docker/sonarqube/nexus/k8s/harbor等;
业务迁移上公有云:迁移服务到公有云平台,涉及使用公有云产品IAM/ECS/S 3/VPC/负载均衡/RDS等;根据业务设计网络流量、配置网络安全策略及用户权限;
GPU项目支持:安装GPU服务器操作系统、根据GPU型号下载驱动软件并安装cuda;安装gpu虚拟化插件并实现容器化调用使用gpu;
系统运维:安装、维护服务器操作系统,修补bug;支持应用服务问题排查等。
某中型电商企业原系统部署于5台物理服务器(单体架构),面临扩容僵化、部署效率低、资源浪费严重问题。为掌握技术自主权、满足定制化运维需求,决定不采用托管容器服务,而是基于移动云云主机(ECS)自主搭建Kubernetes集群,实现应用平滑迁移与云原生转型。
以“单物理机→多虚拟GPU节点→K8s精细化调度”三级架构,破解GPU资源碎片化难题。无需改变现有K8s使用习惯,开发者仅需声明nvidia.com/gpu资源,即可享受企业级GPU调度能力。
以“单物理机→多虚拟GPU节点→K8s精细化调度”三级架构,破解GPU资源碎片化难题。无需改变现有K8s使用习惯,开发者仅需声明nvidia.com/gpu资源,即可享受企业级GPU调度能力。