本文主要介绍OSS监控服务控制台中报警规则的概览及配置方法。
在介绍OSS监控服务控制台之前,请先阅读云监控提供的监控服务文档,了解基本概念并进行报警联系人和报警联系组的配置。
因为OSS的报警规则是根据OSS监控项设置的,所以类似于OSS监控项的维度分类,将其分成两个报警维度:用户层级和Bucket层级。
报警规则页
报警规则页是OSS监控报警相关的规则管理页面,您可以查看、修改、启用、禁用和删除对应的报警规则,而且能够查看该报警规则对应的历史报警情况。
- 单击对应报警规则的查看,可以查看该报警规则的内容。
- 单击对应报警规则的修改,就可以对该报警规则进行修改。
- 单击对应报警规则的删除,就可以删除该报警规则。选中多条报警规则,然后单击表格最下方的删除按钮,可以批量删除报警规则。
- 如果报警规则处于已启用状态,单击该报警规则的禁用,可以禁用该报警规则,报警规则失效,用户不能再收到对应的告警信息。选中多条报警规则,然后单击表格最下方的禁用按钮,可以批量禁用报警规则。
- 如果报警规则处于已禁用状态,单击该报警规则的启用,可以启用该报警规则,报警规则重新生效,能检测并发出对应的告警信息。选中多条报警规则,然后单击表格最下方的启用按钮,可以批量启用报警规则。
- 单击对应报警规则的报警历史,可以查看该报警规则历史发生的所有的告警情况。
相关概念:
- 报警历史指的是该报警规则的状态变化历史,例如从正常变成告警状态,是一个状态变化;从告警变成正常也是状态变化;还有一个特殊的状态变化:通道沉默。
- 当通知对象为通道沉默时,表示该报警规则触发告警之后的指定时间内一直满足报警触发状态(即一直在告警,没有恢复到正常状态)。此时,系统不向通知对象发送告警信息,直到通道沉默时间结束,才会有新的报警信息发送到通知对象。
- 报警历史信息能够保存一个月,即一个月之前的告警信息会被自动清理。查询时一次最多只能查询3天的数据,但不支持查询31天前的数据。
单击具体报警规则的通知对象后的查看,可以显示该通知对象(报警联系组)的成员以及每个成员接收告警信息的方式(短信、邮箱或者旺旺),如下图所示:
查看报警规则
根据报警规则页中下面的控件信息能够快速定位到被搜索的报警规则。
- 报警维度下拉框: 全部和Bucket层级。当选项为全部时,显示所有用户层级和Bucket层级的报警规则。
- Bucket下拉框:当报警维度下拉框为Bucket层级时,这里可以罗列该账号下所有的Bucket。选择对应的Bucket,可以展示属于该Bucket的所有报警规则。
- 监控项下拉框:罗列所有的OSS的监控项,包括用户层级和Bucket层级的监控项。当选项为全部时,显示用户层级或者Bucket层级所有监控项的报警规则。
- 状态下拉框:可选择显示处于指定状态的报警规则,如全部、正常状态、报警状态、数据不足、启用、禁用。选择全部时,显示所有状态的报警规则。
- 维度下拉框:可分维度显示报警规则,如全部用户维度、分组维度、实例维度。
添加报警规则
- 进入创建报警规则页面,您可以通过如下方式进入:
- 在用户概况Tab页单击服务监控总览任意图表内的按钮。
- 在Bucket列表Tab页选中指定的Bucket,之后单击创建报警规则按钮。
- 在Bucket列表Tab页选中指定的Bucket,之后单击服务监控总览任意图表内的按钮。
- 根据需求配置报警规则。
- 关联资源
- 产品:选择对象存储OSS。
- 资源范围:根据您的需求选择全部资源或Bucket维度。
- Bucket(针对Bucket维度):选择指定的Bucket,可一次选中多个Bucket。
- 设置报警规则
- 规则名称:自定义。
- 规则描述:根据需要选择监控的内容、时间及数值。
- +添加报警规则:单击可添加多条规则。
- 通道沉默时间:报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
- 连续几次超过阈值后报警:即连续几次报警的探测结果符合您设置的规则描述,才会触发报警。例如:设置的规则描述为“一分钟内公网流出量大于100MBytes,连续3次超过阈值后报警”。则连续出现3次一分钟内公网流出量大于100MBytes的情况,才会触发报警。
- 生效时间:选择报警规则的生效时间。
- 通知方式
- 关联资源
- 单击确认,完成报警规则的设置。
注意事项
目前属于某个Bucket的报警规则存在性并没有与该Bucket的存在性强关联,即如果删除了某个Bucket,属于这个Bucket的报警规则依然存在。建议您在删除Bucket之前先删除对应的报警规则。