Monthly Archives: June 2008
What is Google Infrastructure?
If you have no idea, you should read this post “Google spotlights data center inner workings“. There are some notes I took as blowing. Google Infrastructure: clusters of 1,800 servers are pretty routine. an ordinary Google search query that involves 700 to 1,000 servers puts 40 servers in each rack Google has 36 data centers
盛夏严防服务器中暑
哦不是中暑:-)而是发烧;夏天就要到了,监控服务器的主板温度和风扇是否工作正常有变的比较重要起来了。 今天发现一个文档 Monitoring Temperature and Fan Speed Using Ganglia and Winbond Chips 这个是一个不错的文档,值得参考一下。 文章是写如何在Ganglia中实现对主板温度和风扇的监控。以前也有人问过我这个问题“Ganglia的监控图上为什么没有温度也风扇的图”;相信您看后就知道怎么回事了。 下面是我对关于温度和风扇监控的一点想法: 主板的芯片能提供这些数据的访问给操作系统 操作系统上有sensors这个命令工具用来采集这些数据 有合适的脚本分析上面命令的输出数据转换成能被监控工具(ganglia, cacti,nagios, opennms)采集的格式等 往往这两个参数并不是监控工具的默认采集数据,所以需要扩展采集工具的采集集合,收集并保存这些数据。 在监控工具如Ganglia中显示这些数据,当然如果有自动报警功能就好了,可以及时通知管理员给服务器消暑:) Ganglia是最好的网格或者群集的监控软件,不过当你用它的使用也要注意到下面这个问题: What does Ganglia not provide? Ganglia does not attempt to address service monitoring or reporting (unlike Nagios). So far, we have not come across a single monitoring solution that addresses all of
相逢一笑告乃翁
感謝劉征邀請我來這兒。我叫段逸時(Austin Tuan),網路上常用的暱稱是 PowerOp。 我爺爺在湖南衡陽生長,後來從軍,跟著國民政府軍隊征戰。爸爸是蘇州生的,在台灣台中長大。媽媽則是泰國曼谷生長的華僑。 我在台灣台中生長,現在跟老婆、兩個女兒在台北生活。 我的工作是在電信業做網路管理,主要是 Fault and Performance Management。之前在台灣安捷倫做了快七年,現在則是在 OSI 做了快一年。 興趣是 自由軟體 / 開放原始碼軟體 。 == 標題是兩首詩詞湊出來的,應該不難猜吧 :p
A follow-up post
I’d like to know about this. [poll id="2"]