1. 白盒监控和黑盒监控
Prometheus Blackbox exporter允许通过HTTP,HTTPS,DNS,TCP和ICMP对端点进行黑盒探测。
更多内容,参考网络探测:Blackbox Exporter 和 prometheus/blackbox_exporter。
本文中,我们会安装blackbox exporter,并且使用http探针对一些接口进行探活。
2. 安装使用blackbox exporter
blackbox exporter的常规安装使用方法有三种:直接使用二进制文件、使用docker image、编译安装。
这里我们选择使用docker image的方式来进行安装,默认已经安装了docker。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
| modules: http_2xx: prober: http http: method: GET preferred_ip_protocol: "ip4" http_post_2xx: prober: http http: method: POST preferred_ip_protocol: "ip4" tcp: prober: tcp ping: prober: icmp timeout: 3s icmp: preferred_ip_protocol: "ip4" dns_baidu: prober: dns timeout: 5s dns: query_name: "baidu.com" query_type: "A" preferred_ip_protocol: "ip4"
探测时默认使用ipv6,探测不支持ipv6的站点都会显示失败,因此在配置时改成了ipv4,更多内容参考UNDERSTANDING AND USING THE MULTI-TARGET EXPORTER PATTERN。
2、启动blackbox exporter
1 2 3 4
| docker run --name blackbox-exporter -d \ -p 9115:9115 \ -v `pwd`:/config \ prom/blackbox-exporter:v0.16.0 --config.file=/config/blackbox.yml
1 2 3 4 5
| curl "" curl "" curl "" curl "" curl ""
3. 与prometheus集成
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| global: scrape_interval: 15s external_labels: monitor: 'my-monitor' scrape_configs: - job_name: prometheus scrape_interval: 5s static_configs: - targets: [''] - targets: [''] labels: group: 'client-node-exporter' - targets: [''] labels: group: 'pushgateway' rule_files: - /etc/prometheus/rules.yml alerting: alertmanagers: - static_configs: - targets: ['']
3.1. 简单配置
修改prometheus.yml,添加blackbox exporter相关字段。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| - job_name: baidu_http2xx_probe params: module: - http_2xx target: - baidu.com metrics_path: /probe static_configs: - targets: - - job_name: prometheus_http2xx_probe params: module: - http_2xx target: - prometheus.io metrics_path: /probe static_configs: - targets: -
3.2. 高级配置
以上配置会有一个问题,假如我们有N个目标站点且都需要M种探测方式,那么Prometheus中将包含N * M 个采集任务,从配置管理的角度来说显然是不可接受的。这里我们利用Prometheus的Relabeling方式对这些配置进行简化,配置方式如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| scrape_configs: - job_name: prometheus scrape_interval: 5s static_configs: - targets: [''] - targets: [''] labels: group: 'client-node-exporter' - targets: [''] labels: group: 'pushgateway' - targets: [''] - job_name: 'blackbox' metrics_path: /probe params: module: [http_2xx] static_configs: - targets: - http://prometheus.io - https://prometheus.io - http://example.com:8080 relabel_configs: - source_labels: [__address__] target_label: __param_target - source_labels: [__param_target] target_label: instance - target_label: __address__ replacement:
1 2 3
| curl "" curl "" curl ""
这个配置实际上是很奇怪的,因为第一个job中 static_configs.targets 代表的是用来exporter对外暴露的接口,第二个job中 static_configs.targets 却代表blackbox要探测的站点。而且第二个job的 relabel_configs.replacement 居然用来指定blackbox的url,我也是服气了,说好的用来替换标签值的呢?
| {job=~"blackbox",__name__!~"^go.*"}