SaaS企业级监控系统从0到1建设(2021.06-2021.11) 技术挑战:原有监控体系分散在Zabbix/Prometheus/ELK多套系统,告警风暴导致MTTR(平均修复时间)长达2小时 解决方案: 统一监控平台架构设计:采用Prometheus+Grafana作为核心,通过Thanos实现全球多数据中心数据聚合 告警智能降噪:开发基于LSTM的异常检测模型,结合业务规则引擎,将无效告警减少76% 自动化运维闭环:集成Jenkins+Ansible,实现故障自愈脚本库(含30+场景),自愈成功率达82% 量化成果: 系统可用性从99.2%提升至99.95%,满足IS...
SaaS企业级监控系统从0到1建设(2021.06-2021.11) 技术挑战:原有监控体系分散在Zabbix/Prometheus/ELK多套系统,告警风暴导致MTTR(平均修复时间)长达2小时 解决方案: 统一监控平台架构设计:采用Prometheus+Grafana作为核心,通过Thanos实现全球多数据中心数据聚合 告警智能降噪:开发基于LSTM的异常检测模型,结合业务规则引擎,将无效告警减少76% 自动化运维闭环:集成Jenkins+Ansible,实现故障自愈脚本库(含30+场景),自愈成功率达82% 量化成果: 系统可用性从99.2%提升至99.95%,满足IS...
项目描述:自主开发适用于游戏运营的使用java语言作为后端的论坛及积分商城,功能有发帖(可发布图片、视频、投票、抽奖功能)、帖子详情、帖子列表、个人中心、我的角色(可同步显示游戏中的角色信息)、我的等级、我的形象(使用spine开发)、签到、私信、积分商城和各种其他的营销活动功能。 技能使用:使用redis做缓存将帖子内容和帖子点赞数、浏览数等属性分开在不同键进行缓存,由于点赞数和浏览数的变化很频繁所以做开存储实现每个属性独立更新缓存。并且将“最新发布”“最新评论”“热度”等排序方式的帖子ID列表使用zset做了前20页的缓存,帖子排序发生变动时只需要直接更新这三个zset的数据就能实现更新...