核心功能模块
1. 告警通知:多维度实时触达
- 数据来源
对接 CloudWatch 的指标告警(如 EC2 CPU 利用率、RDS 连接数异常)和日志告警(如应用错误日志高频出现),通过 CloudWatch Events 触发告警规则。
- 微信通知能力
- 消息形式:支持文本通知(含资源名称、指标值、告警等级等字段)、富文本卡片(带图表趋势预览)。
- 通知策略:
- 分级通知:按告警等级(紧急/重要/提示)匹配不同通知频率(如紧急告警每分钟推送,提示级每日汇总)。
- 用户分组:通过微信标签或企业微信部门结构,将告警定向推送给对应团队(如开发组、运维组)或个人(如值班人员)。
- 场景示例:当 CloudWatch 检测到生产环境数据库慢查询率超过阈值时,小程序立即向 DBA 组发送带慢查询日志片段的卡片通知,并@值班人员。
2. 告警处理:移动端闭环操作
- 交互式响应
- 快捷操作:在微信消息内直接触发预设动作,如:
- 确认告警:标记告警为“已处理”,暂停后续通知。 。
- 评论与协作:支持多人在小程序内对告警事件进行评论,上传截图或日志片段,实现轻量化团队协同。
- 状态跟踪
告警状态(未处理/处理中/已解决)实时同步至 CloudWatch 控制台,避免重复通知;历史记录可按时间、资源、处理人过滤查询。
3. 值班人员呼叫(Call 能力):紧急事件强触达
- 多级告警 escalation
- 超时自动转接:若初级值班人员在指定时间(如 5 分钟)未确认紧急告警,小程序自动拨打其手机/企业微信电话,并发送短信备份通知。
- 值班日历集成:对接企业微信/Outlook 日历,根据排班表动态匹配当前值班人员,避免误触达非在岗人员。
- 应急响应入口
在小程序首页提供“紧急呼叫”按钮,支持一键拨打运维团队总机或触发预设应急流程(如切换至灾备环境)。
优势总结
- 轻量化运维:无需登录 AWS 控制台,通过微信即可完成告警全流程处理,提升移动办公效率。
- 精准触达:结合值班日历与分级通知策略,确保紧急事件“找对人、及时办”。