负责业务的服务架构、部署、配置、维护,保障服务 SLA
负责核心系统的运维架构评估,对资源投入和方案进行设计,优化以及难题的攻关
管理和优化云基础设施(阿里云、智汇云等)资源和成本
负责优化和改进部署、维护流程,支持自动化,提高研发效率
负责持续改进业务架构,完善告警监控、应急预案、容量管理、运维安全,提升全站可靠性
跟踪、研究 IT 新技术、新方案的发展方向,推动新技术、新方案在团队中的落地提升团队业务能力
业务服务器增多,需要统计服务器资源信息,缺少统一的管控平台。各运维工具分散,需要统一的入口,工作流程不规范,无法留痕等问题的出现。
项目职责:
1.规划设计配置管理平台。
2.梳理改进流程规范,工单化,自动化,提高运维效率。
3.对工单系统的数据进行数据分析生成图表为 KPI 考核
项目业绩:
CMDB 整合统计服务器资源,给监控系统提供稳定数据底座,清晰各部门服务器成本来源和分摊,工单系统使人员权限自动开通、工作流、审批流留痕可追溯,建立和维护高效、可靠的运维体系,确保运维工作高效有序开展
监控体系、日志平台建立 负责人 内容: 项目职责: 1.部署、配置 zabbix 监控系统; 2.利用 zabbix 模块实现自动发现; 3.对 CPU 、磁盘等系统资源进行监控,对 mysql、nginx 等应用服务进行监控; 4.在 zabbix 上添加监控关联
主导云盘业务架构的规划与设计,全面负责需求管理、运营优化及日常运维的全过程管理。通过精细化的运营管理与持续优化,确保平台稳定性与性能的最大化。同时,针对云盘系统进行全方位的技术保障,包括bug修复、安全性监控与风险管理,确保平台在数据安全和用户体验方面达到行业领先水平。