prometheus 告警处理 – 运行 Alertmanger
先把mysql 搞定, prometheus监控MySQL环境 :连接
因为下边我们来测试 报警 mysql 的监控。
1-下载
https://prometheus.io/download/#alertmanager
wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz
2. 解压
3-运行
/opt/alertmanager-0.26.0.linux-amd64/alertmanager --config.file /opt/alertmanager-0.26.0.linux-amd64/alertmanager.yml
http://10.0.0.205:9093/#/status

配置邮箱:
cat /opt/alertmanager-0.26.0.linux-amd64/alertmanager.yml
上边对 altermanager的配配置就算完成了。
3.prometheus配置alermanager作为告警媒介
vim prometheus.yml
# Alertmanager configuration
alerting:
  alertmanagers:
    - static_configs:
        - targets: ['10.0.0.205:9093']
       
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
   - "/app/prometheus/rules/*_rules.yml"
2 修改告警规则
建议用 mysql 的做测试:
groups:
- name: baimeidashu-container-runtime
  rules:
  - alert: mysql 挂掉啦
    expr: up{instance="10.0.0.205:9104", job="mysql-exporter"} == 0
    for: 15s
    labels:
      status: 严重告警
    annotations:
      summary: "{{ .instance }} 已停止运行超过 15s!"
  - alert: container-32节点的联邦模式挂掉啦
    expr: up{instance="10.0.0.205:9090", job="prometheus-federate-32"} == 0
    for: 15s
    labels:
      status: 严重告警
    annotations:
      summary: "{{ .instance }} 联邦模式已停止运行超过 15s!"
3 重新加载prometheus的配置
这里要重启。
如果 altermanager 没有报警,
先检查 prometheus 的日志是否有配置对,如果没有错误输出,说明 prometheus 连接 altermanager 没有问题。

欢迎来撩 : 汇总all

 白眉大叔
				白眉大叔			
 
									 
									