可汗学院如何在一周内成功处理2.5倍的流量?疫情导致的居家学习办公,造成了可汗学院在一周内2.5倍的流量暴增March 25, 2021Martin Liu1 分钟可汗学员处理流量突然暴增的过程离不开 SRE 的设计和工作。他们的应对策略包括使用云和CDN。
战斗机飞行员如何进行事故管理(译文)高风险、极度压力、失败的后果惨重:战斗机飞行员和事故管理比你想象的更加相似March 23, 2021Martin Liu1 分钟你的事故管理与战斗机飞行员的有什么共同点?经验丰富的战斗机飞行员,Transposit 的 Anthony “AB " Bourke 说,他最近在DevOps企业峰会的快乐时光上做了这个演讲。
《2020 年 SRE 报告》by Catchpoint这是 Catchpoint 连续第二年出品的 SRE 专题行业调查报告March 1, 2021Martin Liu4 分钟2020 年是不寻常的疫情年,所有行业都受到了巨大的影响, SRE 纯分布式工作方式的转型也是本报告的亮点之一。报告从 4 个方面详细介绍了疫情年中 SRE 的众生相。
Elastic 可观测性工作坊从 Elastic Stack 搭建开始直至云原生应用的运维和管理February 6, 2021Martin Liu1 分钟本工作坊包括本地虚拟机版本、AWS 和腾讯云共三个版本,目标是用实践的方式理解 Elastic 可观测性解决方案。可观测性是解决运维云原生应用的复杂性和分布式式难点的关键所在。