深耕Linux运维领域多年,具备全栈技术能力与项目管控经验:
一、Linux运维核心能力:精通Linux系统命令、服务配置、权限管理及性能调优,熟练掌握负载均衡、缓存、数据库、中间件、分
布式存储、PHP、JAVA等环境和组件的部署、监控与故障排查;熟悉虚拟化与容器化技术,有openStack、K8s私有云集群搭建经验,能高效运维AWS、
阿里云、华为云等多公有云平台。
二、自动化与工程化能力:掌握Shell、Python编程,可实现自动化运维开发;熟悉CI/CD流程,具备从0到1构建持续集成交付体系
的经验,能通过主流监控工具实现系统全链路监控预警。
三、项目管理进阶:具备良好的客户服务意识与沟通能力,擅长技术文档撰写,责任心强;结合华为项目实践完成PMP的培训并
获得pmi官方认证,兼具技术落地能力与项目全流程管控思维,可高效推动项目落地与团队协作。
一、Linux系统管理与跨境电商业务运维
曾任职于跨境电商行业龙头企业,担任运维负责人一职,全面统筹公司内外网超100个节点服务器、Linux系统及核心业务应用(PHP、JAVA环境)的全生命周期管理与维护工作。针对业务高速增长带来的系统压力,牵头对业务架构进行深度优化,通过负载均衡配置、缓存策略调整等技术手段,大幅提升系统并发访问能力,支撑业务峰值流量平稳运行。同时,构建全方位系统安全防护体系,通过入侵检测系统部署、漏洞定期扫描与修复、访问权限精细化管控等措施,有效防范SQL注入、CC攻击、DDoS攻击等各类网络安全威胁,保障公司业务数据安全与系统稳定运行,全年系统可用性达99.9%以上。
二、混合云架构规划与实施
主导企业混合云架构优化与建设项目,完成OpenStack、K8s私有云集群的部署与调试,将原有的零散Xen单节点业务运行环境迁移至集群化统一资源调度平台。通过资源池化管理与智能调度算法,实现计算、存储、网络资源的动态分配与高效利用,降低硬件资源闲置率超30%。在此基础上,推进私有云与AWS公有云环境的整合,构建统一的分布式系统架构,实现跨云资源的统一管理与业务弹性扩展,满足企业在不同业务场景下的资源需求,提升业务响应速度与整体运营效率。
三、DevOps自动化平台建设与落地
负责DevOps自动化开发体系的搭建,集成GitHub、Jenkins、Nexus等多个核心组件,规划并设计全流程CICD发布体系,实现从代码提交、自动化测试、灰度发布到生产环境部署的全链路自动化管控,将软件交付周期从平均7天缩短至24小时以内。同时,结合JumpServer与CMDB资源统一管理平台,自主开发具备GUI界面的梯度发布功能,通过角色权限精细化控制,实现不同层级人员对发布流程的可视化操作与审批,有效降低人为操作风险,提升发布流程的规范性与可控性,助力企业实现高效、敏捷的软件交付模式。
四、AI硬件集成及软件环境部署
参与多个万卡千卡智算中心机房的建设,从机器上架到初始化、性能测试与故障排查全流程实施交付。熟悉掌握GPU/NPU的CUDA/CANN环境搭建,模型部署以及迁移调优。针对主流的NLP、CV管理与跨境电商业务运维
曾任职于跨境电商行业龙头企业,担任运维负责人一职,全面统筹公司内外网超100个节点服务器、Linux系统及核心业务应用(PHP、JAVA环境)的全生命周期管理与维护工作。针对业务高速增长带来的系统压力,牵头对业务架构进行深度优化,通过负载均衡配置、缓存策略调整等技术手段,大幅提升系统并发访问能力,支撑业务峰值流量平稳运行。同时,构建全方位系统安全防护体系,通过入侵检测系统部署、漏洞定期扫描与修复、访问权限精细化管控等措施,有效防范SQL注入、CC攻击、DDoS攻击等各类网络安全威胁,保障公司业务数据安全与系统稳定运行,全年系统可用性达99.9%以上。
二、混合云架构规划与实施
主导企业混合云架构优化与建设项目,完成OpenStack、K8s私有云集群的部署与调试,将原有的零散Xen单节点业务运行环境迁移至集群化统一资源调度平台。通过资源池化管理与智能调度算法,实现计算、存储、网络资源的动态分配与高效利用,降低硬件资源闲置率超30%。在此基础上,推进私有云与AWS公有云环境的整合,构建统一的分布式系统架构,实现跨云资源的统一管理与业务弹性扩展,满足企业在不同业务场景下的资源需求,提升业务响应速度与整体运营效率。
三、DevOps自动化平台建设与落地
负责DevOps自动化开发体系的搭建,集成GitHub、Jenkins、Nexus等多个核心组件,规划并设计全流程CICD发布体系,实现从代码提交、自动化测试、灰度发布到生产环境部署的全链路自动化管控,将软件交付周期从平均7天缩短至24小时以内。同时,结合JumpServer与CMDB资源统一管理平台,自主开发具备GUI界面的梯度发布功能,通过角色权限精细化控制,实现不同层级人员对发布流程的可视化操作与审批,有效降低人为操作风险,提升发布流程的规范性与可控性,助力企业实现高效、敏捷的软件交付模式。
四、AI硬件集成及软件环境部署
参与多个万卡千卡智算中心机房的建设,从机器上架到初始化、性能测试与故障排查全流程实施交付。熟悉掌握GPU/NPU的CUDA/CANN环境搭建,模型部署以及迁移调优。针对主流的NLP、CV类模型有训练、推理实践经验。
一、在跨境电商行业龙头企业担任运维负责人期间,我主导了公司内外网超100节点服务器、Linux系统及核心业务应用的全生命周期管理与运维工作。针对业务爆发式增长带来的系统压力,通过架构优化、资源调度调优等技术手段,将系统并发承载能力提升40%,成功支撑多次大促峰值流量平稳运行。同时
集成github、jenkins、maven、nexus等多个组件,规划设计并实施CICD发布流程,实现开发、测试、灰度、生产的体系发布流程。并结合jumpserver CMDB的资源统一管理平台,调用API接口,开发基于GUI界面的角色权限控制的梯度发布功能以及SQL执行审计功