1. Ganglia简介
《Ubuntu14.04安装配置Ganglia》一文中,我们已经学会了安装配置ganglia的方法。但是,我们的配置方法,只适用于一个集群,如果我们有多个集群怎么办?本文就来探讨一下。
2. Ganglia层级
参考YOUYOU深入学习Ganglia之一(建立Grid),可以得到如下结论:
Ganglia从数据中心的结构上划分了三个层次:Node,Cluster,Grid。一句话概括:多个Node组成一个Cluster,多个Cluster组成一个Grid。
3. 配置Grid
如果只有一个Cluster,没有添加Grid配置,那么这个Cluster默认在名为“Grid”的Grid下。
如上图,假设我们有两个Cluster,名为Cloud Computing和k8s,它们的管理机分别是cluster1-master和cluster2-master。除此之外,还有一台Grid管理机为grid-master。
cluster1-master的IP为192.168.56.101,cluster2-master的IP为192.168.56.201,grid-master的IP为192.168.56.56。
现在,我们想要把Cloud Computing和k8s这两个Cluster合并成一个Grid。
1、cluster1-master和cluster2-master配置允许共享gmated的XML文件,同时把grid-master地址设置为信任的主机IP。sudo vi /etc/ganglia/gmetad.conf
找到:
1 | # List of machines this gmetad will share XML with. Localhost |
修改为:
1 | # List of machines this gmetad will share XML with. Localhost |
2、cluster1-master和cluster2-master重启gmetadsudo /etc/init.d/gmetad restart
3、grid-master的gmetad,要添加数据源。sudo vi /etc/ganglia/gmetad.conf
找到data_source,添加:
1 | data_source "Cloud Computing" 10 192.168.56.101:8649 192.168.56.102:8649 |
4、grid-master重启gmetadsudo /etc/init.d/gmetad restart
然后,就能在grid-master的gweb上看到一个Grid,包含两个Cluster。
对比最开始时的图可以发现,cluster1-master的gweb标题为“Cloud Computing Cluster Report at…”,而grid-master的gweb标题为“unspecified Grid Report at…”。之所以unspecified,是因为我们在cluster1-master和cluster2-master的gmetad中没有指定Grid的名字。
5、在cluster1-master和cluster2-master上修改gmetad,设置Grid名称为”Center of Cloud Computing”。sudo vi /etc/ganglia/gmetad.conf
找到gridname,打开注释,修改为:
1 | gridname "Center of Cloud Computing" |
6、cluster1-master、cluster2-master、grid-master重启gmetadsudo /etc/init.d/gmetad restart
然后,访问grid-master的gweb,看到Grid有了名字。