Ganglia配置Grid架构

Ganglia简介

《Ubuntu14.04安装配置Ganglia》一文中,我们已经学会了安装配置ganglia的方法。但是,我们的配置方法,只适用于一个集群,如果我们有多个集群怎么办?本文就来探讨一下。

Ganglia层级

参考YOUYOU深入学习Ganglia之一(建立Grid),可以得到如下结论:

Ganglia从数据中心的结构上划分了三个层次:Node,Cluster,Grid。一句话概括:多个Node组成一个Cluster,多个Cluster组成一个Grid。

配置Grid

如果只有一个Cluster,没有添加Grid配置,那么这个Cluster默认在名为“Grid”的Grid下。

如上图,假设我们有两个Cluster,名为Cloud Computing和k8s,它们的管理机分别是cluster1-master和cluster2-master。除此之外,还有一台Grid管理机为grid-master。

cluster1-master的IP为192.168.56.101,cluster2-master的IP为192.168.56.201,grid-master的IP为192.168.56.56。

现在,我们想要把Cloud Computing和k8s这两个Cluster合并成一个Grid。

1、cluster1-master和cluster2-master配置允许共享gmated的XML文件,同时把grid-master地址设置为信任的主机IP。
sudo vi /etc/ganglia/gmetad.conf

找到:

1
2
3
4
5
6
7
8
# List of machines this gmetad will share XML with. Localhost
# is always trusted.
# default: There is no default value
# trusted_hosts 127.0.0.1 169.229.50.165 my.gmetad.org
# If you want any host which connects to the gmetad XML to receive
# data, then set this value to "on"
# default: off
# all_trusted on

修改为:

1
2
3
4
5
6
7
8
# List of machines this gmetad will share XML with. Localhost
# is always trusted.
# default: There is no default value
trusted_hosts 192.168.56.56
# If you want any host which connects to the gmetad XML to receive
# data, then set this value to "on"
# default: off
all_trusted on

2、cluster1-master和cluster2-master重启gmetad
sudo /etc/init.d/gmetad restart

3、grid-master的gmetad,要添加数据源。
sudo vi /etc/ganglia/gmetad.conf

找到data_source,添加:

1
2
data_source "Cloud Computing" 10 192.168.56.101:8649 192.168.56.102:8649
data_source "k8s" 10 192.168.56.201:8649 192.168.56.202:8649

4、grid-master重启gmetad
sudo /etc/init.d/gmetad restart

然后,就能在grid-master的gweb上看到一个Grid,包含两个Cluster。

对比最开始时的图可以发现,cluster1-master的gweb标题为“Cloud Computing Cluster Report at…”,而grid-master的gweb标题为“unspecified Grid Report at…”。之所以unspecified,是因为我们在cluster1-master和cluster2-master的gmetad中没有指定Grid的名字。

5、在cluster1-master和cluster2-master上修改gmetad,设置Grid名称为”Center of Cloud Computing”。
sudo vi /etc/ganglia/gmetad.conf

找到gridname,打开注释,修改为:

1
gridname "Center of Cloud Computing"

6、cluster1-master、cluster2-master、grid-master重启gmetad
sudo /etc/init.d/gmetad restart

然后,访问grid-master的gweb,看到Grid有了名字。

0%