具备扎实的IT技术背景和丰富的大型平台项目运维与管理经验。核心技能包括:精通Python和Shell脚本编程,能够高效地开发自动化运维工具,实现系统巡检、资源统计、告警处理等任务的自动化,显著提升运维效率。拥有8年IT行业工作经验,专注于云计算(特别是阿里云专有云、混合云)领域的运维、交付与技术支持,熟悉云平台架构、部署、升级及日常维护流程。具备出色的团队建设与管理能力,能独立组建并带领技术服务团队,完成人员招聘、能力培养和团队协作。擅长构建和优化运维体系,包括制定标准化操作规程、完善变更与资产管理流程、建立知识库以沉淀最佳实践。同时,具备良好的项目管理能力,能够协调多方资源,确保项目按时按质交付。在技术探索方面,具备GPU集群管理、AI模型部署与测试的能力,并成功搭建过GPUStack+Dify等AI相关测试系统。持有ACP阿里云专业工程师认证,持续学习新技术,致力于提供稳定、高效、安全的IT服务。
1. **某大型专有云项目 (2021.04 - 至今)**
* **项目概述**:负责一个涉及11个数据中心、超过1万台服务器的超大规模专有云项目,实现一云多芯,满足海量异构数据处理与业务运行需求。
* **我的职责与成就**:作为项目负责人,全面负责项目的技术服务管理工作。成功组建并管理专门的技术服务团队,统筹硬件采购、集成、交付、运维等全链条工作。与阿里云GTS团队深度合作,共同推进项目实施,获得客户及阿里团队的技术认可,并收到客户表扬信。在疫情期间,带领团队克服困难,高质量完成了型号作战试验和订购测试验收等关键攻坚任务。主导项目交付方案制定、硬件集成、产品部署、联调联试及测试验收等环节,确保项目顺利交付。
2. **某阿里混合云项目 (2017.11 - 至今)**
* **项目概述**:参与基于阿里云公共云原生技术的混合云项目建设,为政企客户提供数字化转型的技术基础设施。
* **我的职责与成就**:作为平台运维工程师,全程参与项目规划、业务改造、容量评估、平台扩容与升级等工作。负责项目一期至三期的技术支持与现场运维,保障客户7x24小时业务连续性,期间无重大人为故障。协助客户建立完善的运维流程体系(含变更、资产、风险、安全等),有效管控项目风险。运维工作获得客户、运维经理、SA、PM等多方高度评价。
3. **阿里专有云技术升级组 (2020.03 - 2020.11)**
* **项目概述**:为整合人力资源并沉淀产品知识而成立的技术支持专项组,聚焦于DTS(数据传输服务)、CSB(云服务总线)、ADB(云原生数据仓库)等核心产品的技术升级与支持。
* **我的职责与成就**:负责上述多个核心产品的技术支持工作,解决客户在使用过程中遇到的技术难题。系统性地沉淀产品运维知识,建立并管理产品知识库。积极参与产品风险问题管理,为产品团队提供宝贵的运维视角和技术支持,例如,我贡献的CSB产品signature Python实现代码示例被采纳并发布至官方GitHub仓库(aliyun/csb-sdk),获得了产品团队的认可。