一个计算机技术爱好者与学习者

0%

kube-controller-manager指标收集

1. 前言

大家都知道需要监控k8s指标,但是具体需要监控k8s的哪些组件的哪些指标?
本文,就来学习梳理kube-controller-mananger组件的监控指标。

2. 有哪些指标?

要收集指标,首先要知道有哪些指标可以收集。
方法一:使用curl命令

1
2
3
4
5
k get pods -n kube-system -o wide | grep kube-controller-manager
k get svc -n kube-system -o wide | grep kube-controller-manager

ssh <clusterhost>
curl localhost:<nodeport>/metrics

方法二:在prometheus使用promql

1
2
count({job="kube-controller-manager"}) by (__name__)
count({job="kube-controller-manager",__name__!~"^go_.*"}) by (__name__)

3. 指标含义?

找到了指标,接下来需要知道指标的含义。
访问 Splunk doc - kube-controller-manager,使用指标名称搜索即可。

比如搜索:
rest_client_request_duration_seconds_bucket
得到结果:
rest_client_request_duration_seconds_bucket (cumulative)
Request latency in seconds. Broken down by verb and URL. (bucket)