告警设置

更新时间:2016/07/11 访问次数:2769

告警设置说明

告警设置中可对应用的一些监控数据设置告警,告警开启后,系统每分钟检测告警项均值,如监控项均值超过系统告警阈值则根据告警项规则设定发送告警通知。服务端监控目前支持**实例告警**和**应用告警**。

应用告警是安装服务端监控探针后可开启的告警,主要包括:
- 应用QPS告警:当应用的QPS均值超过设定的阈值时发送告警。
- 应用响应时间告警:当应用的平均响应时间超过设定的阈值时发送告警。
- 应用4XX错误率告警:当应用服务器的HTTP返回码为4XX的请求占总请求数的百分比超过设定的阈值时发送告警。
- 应用5XX错误率告警:当应用服务器的HTTP返回码为5XX的请求占总请求数的百分比超过设定的阈值时发送告警。
- Uri QPS告警:当应用某指定Uri的QPS均值超过设定的阈值时发送告警。
- Uri响应时间告警:当应用某指定Uri的平均响应时间超过设定的阈值时发送告警。
- Uri 4XX错误率告警:当应用某指定Uri的HTTP返回码为4XX的请求占总请求数的百分比超过设定的阈值时发送告警。
- Uri 5XX错误率告警:当应用某指定UriHTTP返回码为5XX的请求占总请求数的百分比超过设定的阈值时发送告警。

告警列表

image
进入告警设置,告警项以区块的方式进行展示:
- 基本信息:主要包括告警项的**开闭状态**、**告警类型**和**告警项名称**等信息,如图中1所示,铃铛图标亮时表示告警处于开启状态,灰掉时表示告警关闭状态。
- 告警条件:如图中2所示主要包括**阈值**、**重试次数**、**通知间隔**、**检查周期**和**扩展信息**:
- 阈值:触发告警时的临界值,当真实数据超过阈值时触发告警。
- 重试次数:当真实数据连续超过临界值的次数超过重试次数时才会触发告警,重试次数是为了防止应用抖动造成误报。目前支持的取值为1、3、5。
- 通知间隔:触发告警时,当本次告警的时间距上次告警的时间间隔超过通知间隔时才会发送消息给告警接收人。在通知间隔内触发的告警不会发送消息给告警接收人,但会记录告警日志,通知间隔内的这段时间称为**告警疲劳期**。目前通知间隔的取值为“无限制”(只要触发告警就发送消息)、5分钟、15分钟和1小时。
- 检查周期:目前所有告警的检查周期都为1分钟。
- 扩展信息:会展示告警的一些扩展信息,比如Uri类告警项会展示出具体Uri信息。
- 告警接收人:触发告警并满足发送条件时,将发送告警消息通知告警接收人。告警接收人可以是接收人也可以是某类角色分组,如果是角色分组,则该角色下的所有接收人都将收到告警消息。无告警接收人时,会显示“请先编辑并选择告警接收人. 点击编辑”
- 筛选排序:告警项列表可以通过图中4所示的下拉框过滤告警项或进行排序。告警类型筛选包括实例告警和应用告警;告警项筛选包括上节列出的告警;排序支持按开启状态排序和按更新时间逆序排序。

告警设置

image

  • 添加告警项:点击『添加告警』按钮,会弹出编辑框,首先填入告警项名称,选择告警类型和告警项,填入告警条件和告警接收人信息,然后点击『保存』按钮即可添加成功。如果没有合适的告警接收人,在告警接收人栏点击『+』按钮即可添加告警接收人。
  • 修改告警项:点击如图中1所示的修改按钮,弹出编辑框,修改告警项时,除告警类型和告警项不能修改外,其它信息填入同“添加告警项”操作。
  • 删除告警项:点击如图中2所示的删除按钮,点击确认即可删除该告警项。
  • 开启关闭告警项:点击如图中3所示的告警开关按钮,即可开启或关闭该告警项。

需要注意:

  • 同一个应用下告警项名称不能重复。
  • 同一应用下至多只能设置**100**个告警项。
  • 添加或修改告警项时,如果设置了告警接收人信息,则告警项默认会处于开启状态,如果没有设置告警接收人,则告警项默认会处于关闭状态。
  • 只有设置了告警接收人的告警项才能被开启。
  • 如果由于其它操作,如“删除告警接收人”等,导致告警项缺少告警接收人,则该告警项会被自动关闭。

默认告警项

系统会为应用自动生成一些默认告警项,对于安装有服务端监控探针的应用会生成:
- 默认应用QPS告警
- 默认应用响应时间告警
- 默认应用4XX错误率告警
- 默认应用5XX错误率告警

默认告警项的告警接收人为系统根据登陆账号自动生成的**默认联系人**,默认告警项也是可以进行修改、删除和开启关闭操作的。

FAQ

关于此文档暂时还没有FAQ
返回
顶部