<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Martin&#039;s Blog &#187; Ganglia</title>
	<atom:link href="http://martinliu.cn/tag/ganglia/feed" rel="self" type="application/rss+xml" />
	<link>http://martinliu.cn</link>
	<description>如何以服务的视角管理IT？</description>
	<lastBuildDate>Wed, 08 Feb 2012 08:10:04 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>盛夏严防服务器中暑</title>
		<link>http://martinliu.cn/2008/06/monitoring-temperature-and-fan-speed-using-ganglia.html</link>
		<comments>http://martinliu.cn/2008/06/monitoring-temperature-and-fan-speed-using-ganglia.html#comments</comments>
		<pubDate>Sun, 15 Jun 2008 15:50:31 +0000</pubDate>
		<dc:creator>Martin Liu</dc:creator>
				<category><![CDATA[NSM]]></category>
		<category><![CDATA[Ganglia]]></category>

		<guid isPermaLink="false">http://www.martinliu.cn/?p=103</guid>
		<description><![CDATA[哦不是中暑:-)而是发烧；夏天就要到了，监控服务器的主板温度和风扇是否工作正常有变的比较重要起来了。 今天发现一个文档 Monitoring Temperature and Fan Speed Using Ganglia and Winbond Chips 这个是一个不错的文档，值得参考一下。 文章是写如何在Ganglia中实现对主板温度和风扇的监控。以前也有人问过我这个问题“Ganglia的监控图上为什么没有温度也风扇的图”；相信您看后就知道怎么回事了。 下面是我对关于温度和风扇监控的一点想法： 主板的芯片能提供这些数据的访问给操作系统 操作系统上有sensors这个命令工具用来采集这些数据 有合适的脚本分析上面命令的输出数据转换成能被监控工具（ganglia， cacti，nagios， opennms）采集的格式等 往往这两个参数并不是监控工具的默认采集数据，所以需要扩展采集工具的采集集合，收集并保存这些数据。 在监控工具如Ganglia中显示这些数据，当然如果有自动报警功能就好了，可以及时通知管理员给服务器消暑：） Ganglia是最好的网格或者群集的监控软件，不过当你用它的使用也要注意到下面这个问题： What does Ganglia not provide? Ganglia does not attempt to address service monitoring or reporting (unlike Nagios). So far, we have not come across a single monitoring solution that addresses all of<p><a href="http://martinliu.cn/2008/06/monitoring-temperature-and-fan-speed-using-ganglia.html" class="more-link">Continue reading &#187;</a></p>
Related posts:<ol>
<li><a href='http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html' rel='bookmark' title='Using Ganglia for cluster and grid monitoring'>Using Ganglia for cluster and grid monitoring</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft" style="margin: 15px;float: left" src="http://www.hlj.xinhuanet.com/xw/2007-03/24/xin_190304241641921962117.jpg" alt="" width="224" height="347" />哦不是中暑:-)而是发烧；夏天就要到了，监控服务器的主板温度和风扇是否工作正常有变的比较重要起来了。</p>
<p>今天发现一个文档 <a href="http://www.slac.stanford.edu/gen/edu/suli2006/finaltalks_thurs/caitie.ppt">Monitoring Temperature and Fan Speed Using Ganglia and Winbond Chips</a> 这个是一个不错的文档，值得参考一下。</p>
<p>文章是写如何在Ganglia中实现对主板温度和风扇的监控。以前也有人问过我这个问题“Ganglia的监控图上为什么没有温度也风扇的图”；相信您看后就知道怎么回事了。</p>
<p>下面是我对关于温度和风扇监控的一点想法：</p>
<ul>
<li>主板的芯片能提供这些数据的访问给操作系统</li>
<li>操作系统上有sensors这个命令工具用来采集这些数据</li>
<li>有合适的脚本分析上面命令的输出数据转换成能被监控工具（ganglia， cacti，nagios， opennms）采集的格式等</li>
<li>往往这两个参数并不是监控工具的默认采集数据，所以需要扩展采集工具的采集集合，收集并保存这些数据。</li>
<li>在监控工具如Ganglia中显示这些数据，当然如果有自动报警功能就好了，可以及时通知管理员给服务器消暑：）</li>
</ul>
<p>Ganglia是最好的网格或者群集的监控软件，不过当你用它的使用也要注意到下面这个问题：</p>
<p>What does Ganglia not provide?<br />
Ganglia does not attempt to address service monitoring or reporting (unlike Nagios). So far, we have not come across a single monitoring solution that addresses all of our needs effectively.</p>
<p>上面所说的服务监控是说，它的特点不是想Nagios和OpenNMS那样对服务器系统做非常全面细致的监控，它默认的监控指标比较少不过对于监控网格或者群集这种数量巨大的对象来说这些比较经典的指标也够用了，特别是对服务器的可用性，CUP、RAM，网络资源利用率和工作负载等数据的采集也比较够用了。如果你使用它来监控数量不是很多服务器的话，你可以使用它的可扩展性加入任何想监控的KPI。我最喜欢的还是它能把服务做分组，而且垂直的方向上可以加N层的嵌套；这种组织方式能比较好的适用于业务系统众多而复杂的数据中心。</p>
<p>Related posts:<ol>
<li><a href='http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html' rel='bookmark' title='Using Ganglia for cluster and grid monitoring'>Using Ganglia for cluster and grid monitoring</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://martinliu.cn/2008/06/monitoring-temperature-and-fan-speed-using-ganglia.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Ganglia install and configure</title>
		<link>http://martinliu.cn/2008/05/ganglia-install-and-configure.html</link>
		<comments>http://martinliu.cn/2008/05/ganglia-install-and-configure.html#comments</comments>
		<pubDate>Sat, 24 May 2008 02:15:27 +0000</pubDate>
		<dc:creator>Martin Liu</dc:creator>
				<category><![CDATA[NSM]]></category>
		<category><![CDATA[cluster]]></category>
		<category><![CDATA[Ganglia]]></category>
		<category><![CDATA[grid]]></category>

		<guid isPermaLink="false">http://www.martinliu.cn/2008/05/24/ganglia-install-and-configure/</guid>
		<description><![CDATA[我准备安装的版本是ganglia-3.0.7 ， 参考的安装文档是http://www.linuxsir.org/bbs/thread309837.html rpm的安装会比较省事。rpm安装都会很正常，不过在Suse下面需要注意一下两点： gmond和gmated的启动脚本不是rpm包中默认装上的那个，那个脚本适用于redhat linux；下载源码编译之后在gmond/ gmated/的文件夹里有后缀为 .SuSE的哪两个文件才对。 rpm吧gmated的web界面默认安装路径是/var/www/http/ ，SuSE下的apache的路径是 /srv/www/htdoc/；安装完后copy或者连接过来 配置： gmond.conf 更具我参考的安装文档产生这个文件的命令是 gmond -t &#62; /etc/gmond.conf；rpm安装包中有这个文件，如果需要恢复到默认状态可以使用这个命令。 gmated.conf 是服务器端的主要配置文件，详细阅读一下源码包中的那个html文件对这个文件的配置会有帮助 安装过程中出现的问题如下：在启动gmond的时候启动失败，debug一下可以看到下面的错误。 sles:~ # gmond &#8211;debug=9 slurpfile() open() error on file /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq: No such file or directory udp_recv_channel mcast_join=239.2.11.71 mcast_if=NULL port=8649 bind=239.2.11.71 Error creating multicast server mcast_join=239.2.11.71 port=8649 mcast_if=NULL family=&#8217;inet4&#8242;. Exiting. 在所有虚拟机（host-only 网络设置）上都遇到这个错误。一次一个NAT网络的虚机上正常 至今觉得这是一个网络的问题，还没有想出正确的配置和解决方法。如果您有什么好建议请留言。 Related posts:<p><a href="http://martinliu.cn/2008/05/ganglia-install-and-configure.html" class="more-link">Continue reading &#187;</a></p>
Related posts:<ol>
<li><a href='http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html' rel='bookmark' title='Using Ganglia for cluster and grid monitoring'>Using Ganglia for cluster and grid monitoring</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>我准备安装的版本是ganglia-3.0.7 ， 参考的安装文档是<a title="http://www.linuxsir.org/bbs/thread309837.html" href="http://www.linuxsir.org/bbs/thread309837.html">http://www.linuxsir.org/bbs/thread309837.html</a></p>
<p>rpm的安装会比较省事。rpm安装都会很正常，不过在Suse下面需要注意一下两点：</p>
<ul>
<li>gmond和gmated的启动脚本不是rpm包中默认装上的那个，那个脚本适用于redhat linux；下载源码编译之后在gmond/ gmated/的文件夹里有后缀为 .SuSE的哪两个文件才对。</li>
<li>rpm吧gmated的web界面默认安装路径是/var/www/http/ ，SuSE下的apache的路径是 /srv/www/htdoc/；安装完后copy或者连接过来</li>
</ul>
<p>配置：</p>
<ul>
<li>gmond.conf 更具我参考的安装文档产生这个文件的命令是 gmond -t &gt; /etc/gmond.conf；rpm安装包中有这个文件，如果需要恢复到默认状态可以使用这个命令。</li>
<li>gmated.conf 是服务器端的主要配置文件，详细阅读一下源码包中的那个html文件对这个文件的配置会有帮助</li>
</ul>
<p>安装过程中出现的问题如下：在启动gmond的时候启动失败，debug一下可以看到下面的错误。</p>
<p>sles:~ # gmond &#8211;debug=9<br />
slurpfile() open() error on file /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq: No such file or directory<br />
udp_recv_channel mcast_join=239.2.11.71 mcast_if=NULL port=8649 bind=239.2.11.71<br />
Error creating multicast server mcast_join=239.2.11.71 port=8649 mcast_if=NULL family=&#8217;inet4&#8242;. Exiting.</p>
<p>在所有虚拟机（host-only 网络设置）上都遇到这个错误。一次一个NAT网络的虚机上正常</p>
<p>至今觉得这是一个网络的问题，还没有想出正确的配置和解决方法。如果您有什么好建议请留言。</p>
<p>Related posts:<ol>
<li><a href='http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html' rel='bookmark' title='Using Ganglia for cluster and grid monitoring'>Using Ganglia for cluster and grid monitoring</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://martinliu.cn/2008/05/ganglia-install-and-configure.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Using Ganglia for cluster and grid monitoring</title>
		<link>http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html</link>
		<comments>http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html#comments</comments>
		<pubDate>Wed, 16 Apr 2008 09:41:06 +0000</pubDate>
		<dc:creator>Martin Liu</dc:creator>
				<category><![CDATA[NSM]]></category>
		<category><![CDATA[cluster]]></category>
		<category><![CDATA[Ganglia]]></category>
		<category><![CDATA[grid]]></category>

		<guid isPermaLink="false">http://www.martinliu.cn/2008/04/16/using-ganglia-for-cluster-and-grid-monitoring/</guid>
		<description><![CDATA[Ganglia是一个用来监控群集和网格计算环境的软件。它是可以扩展的分布式监控系统，它基于多播协议，数据存储和传输的格式都是基于开源的标准：XML/XDR/RRDTool/APR/Apache/php等。 应用Ganglia的几个理由： 在一个点上监控包含很多服务器的群集，单个cluster内服务器的数量比较多，需要从整体看某个cluster的可用性和性能，也要能看到单独某个机器的运行情况。 监控分布式的cluster环境，例如跨网段和地域的灾备的环境。 需要监控系统能分N级的查看方式，以银行为例：北数据中心&#8211;&#62;网络银行业务&#8211;&#62;个人网银系统&#8211;&#62;web server 群集&#8211;&#62; WebSvr001；可以按业务逻辑和系统架构逻辑。 需要7*24*365的监控整个系统，能得到可用性、性能和容量等方面的报表。 应用Ganglia的几个好处： 监控能力的无限扩展，被管理服务器数量达数千个甚至根多。 纯web前端，apache和php的应用页面方便定制 强壮的系统结构，并且具备可以任意扩展采集数据KPI的特点 适合高性能计算或者网格计算环境。 Ganglia应用需要注意的方面： 在每一个节点上需要部署一个代理程序，考虑到对代理配置的变更的工作量，在部署代理之前，需要彻底的分析需求，尽量减少部署过程中配置变更带来的多于调试的工作量。 部署后期的变更工作，如果比较频繁的话将导致后台维护工作量增大，可以考虑使用一些开源的软件分发和自动化配置管理的工具。这些配置的初始化工作可以与OS的安装部署工作一起考虑。 它被很多大学和专业机构研究并使用，所以有非常多的专业文档可以参考，哪行文档多分析了Ganglia的系统架构和特点，多系统的原理介绍的非常细致。下面是我收集的几个关于这个软件的文档请参考。并且在它们的网站上也可以看到很多相关的资源连接，都是非常好的实施方面的详细文档。 If you need more detail please take look those documents below. Related posts: Ganglia install and configure
Related posts:<ol>
<li><a href='http://martinliu.cn/2008/05/ganglia-install-and-configure.html' rel='bookmark' title='Ganglia install and configure'>Ganglia install and configure</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p><a href="http://ganglia.info/" target="_blank"><img style="margin: 4px" src="http://www.nowmicro.com/NM_Images/hpc-ganglia-logo.jpg" align="left"></a> Ganglia是一个用来监控群集和网格计算环境的软件。它是可以扩展的分布式监控系统，它基于多播协议，数据存储和传输的格式都是基于开源的标准：XML/XDR/RRDTool/APR/Apache/php等。</p>
<p>应用Ganglia的几个理由：</p>
<ul>
<li>在一个点上监控包含很多服务器的群集，单个cluster内服务器的数量比较多，需要从整体看某个cluster的可用性和性能，也要能看到单独某个机器的运行情况。</li>
<li>监控分布式的cluster环境，例如跨网段和地域的灾备的环境。</li>
<li>需要监控系统能分N级的查看方式，以银行为例：北数据中心&#8211;&gt;网络银行业务&#8211;&gt;个人网银系统&#8211;&gt;web server 群集&#8211;&gt; WebSvr001；可以按业务逻辑和系统架构逻辑。</li>
<li>需要7*24*365的监控整个系统，能得到可用性、性能和容量等方面的报表。</li>
</ul>
<p>应用Ganglia的几个好处：</p>
<ul>
<li>监控能力的无限扩展，被管理服务器数量达数千个甚至根多。</li>
<li>纯web前端，apache和php的应用页面方便定制</li>
<li>强壮的系统结构，并且具备可以任意扩展采集数据KPI的特点</li>
<li>适合高性能计算或者网格计算环境。</li>
</ul>
<p>Ganglia应用需要注意的方面：</p>
<ul>
<li>在每一个节点上需要部署一个代理程序，考虑到对代理配置的变更的工作量，在部署代理之前，需要彻底的分析需求，尽量减少部署过程中配置变更带来的多于调试的工作量。</li>
<li>部署后期的变更工作，如果比较频繁的话将导致后台维护工作量增大，可以考虑使用一些开源的软件分发和自动化配置管理的工具。这些配置的初始化工作可以与OS的安装部署工作一起考虑。</li>
</ul>
<p>它被很多大学和专业机构研究并使用，所以有非常多的专业文档可以参考，哪行文档多分析了Ganglia的系统架构和特点，多系统的原理介绍的非常细致。下面是我收集的几个关于这个软件的文档请参考。并且在它们的网站上也可以看到很多相关的资源连接，都是非常好的实施方面的详细文档。</p>
<p>If you need more detail please take look those documents below.</p>
<p><embed src="http://www.box.net/static/flash/box_explorer.swf?widgetHash=rb2sx5msk8&amp;cl=0" width="460" height="345" type="application/x-shockwave-flash" wmode="transparent"></embed></p>
<p>Related posts:<ol>
<li><a href='http://martinliu.cn/2008/05/ganglia-install-and-configure.html' rel='bookmark' title='Ganglia install and configure'>Ganglia install and configure</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://martinliu.cn/2008/04/using-ganglia-for-cluster-and-grid-monitoring.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

