头部电商平台用户增长体系重构

基本信息

案例ID:235507

技术顾问:七寻. - 1年经验 - 数

联系沟通

微信扫码,建群沟通

项目名称:头部电商平台用户增长体系重构

所属行业:电子商务 - B2C

->查看更多案例

案例介绍

SaaS企业级监控系统从0到1建设(2021.06-2021.11)
技术挑战:原有监控体系分散在Zabbix/Prometheus/ELK多套系统,告警风暴导致MTTR(平均修复时间)长达2小时
解决方案:

统一监控平台架构设计:采用Prometheus+Grafana作为核心,通过Thanos实现全球多数据中心数据聚合
告警智能降噪:开发基于LSTM的异常检测模型,结合业务规则引擎,将无效告警减少76%
自动化运维闭环:集成Jenkins+Ansible,实现故障自愈脚本库(含30+场景),自愈成功率达82%
量化成果:
系统可用性从99.2%提升至99.95%,满足ISO20000认证要求
运维人力投入减少40%,团队可专注高价值任务
相关方案被纳入集团技术白皮书,在5个业务线复用

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服