我是一名专注于云原生全栈生态建设、信创改造与AI工程化落地的资深技术工程师。我的核心能力在于,不仅能构建和维护大规模Kubernetes集群,更能围绕它打造从开发交付到智能应用部署的完整闭环体系,并成功为数十家金融、政务、互联网等行业的客户交付了上百套生产级平台。
在DevOps与可观测性方面,我精通Jenkins与GitLab CI/CD流水线的设计与自动化,能实现从代码提交到多环境发布的全流程无人值守。同时,我主导搭建了基于ELK/Loki的日志中心和Prometheus+Grafana的监控告警体系,确保系统“看得见、管得住”。
在网络架构上,我深入理解Underlay(物理网络)与Overlay(虚拟网络)原理,熟练配置Calico、Cilium等主流CNI插件,解决跨节点通信、网络策略、服务网格集成等复杂问题,保障集群内外部网络的高性能与安全性。
在前沿领域,我拥有丰富的实战经验:
信创改造:主导过多个大型项目从X86到鲲鹏、飞腾等国产芯片的迁移,熟悉麒麟OS、达梦/高斯数据库、东方通中间件等信创组件的容器化适配与性能调优,确保系统在自主可控环境下稳定高效运行。
大模型部署:具备将LLM(如Llama 3, Qwen)部署至K8s的经验,熟悉模型服务化框架(vLLM, TGI),并能通过资源调度、模型量化、推理加速等手段优化成本与性能。
GPU/vGPU管理:精通NVIDIA GPU Operator的部署与管理,能够为AI训练和推理任务分配独占或共享(vGPU)的GPU资源,支持多租户隔离与弹性伸缩,最大化硬件利用率。
我追求的是构建一个高效、安全、智能且面向未来的现代化基础设施平台
xxx证券容器云项目以及 xx 银行容器云项目
从 xx 平台从老平台逐步完成迁移,接入 cicd, 日志,链路追踪等诸多环节。
资深云原生架构师 / 高级Kubernetes平台工程师 您负责构建、维护和优化一个大规模、高可用、生产级的Kubernetes基础设施平台。您的核心职责是确保整个云原生技术栈的稳定、高效与安全。 核心能力体现: 平台运维专家:管理一个拥有3个Master节点和3个Work
基于 k8s 完成 大模型部署平台的安装,配置,对接 gpu 以及 npu ,涉及 hami 虚拟技术。