今年过年特别早,离春节只剩下二十多天了。
为期 7 天的春节里,工程师们不上班,那万一线上业务出现了故障怎么办?
大公司的朋友们会安排专门的人进行值班(此处心疼一下那些需要大年三十还要值班保证高峰的工程师们),
而作为创业团队人少,难做到在线值守,就需要对线上进行一些整理盘点,找出潜在问题,为春节长假做一些准备。我们称之为年前大扫除。大扫除需要做些什么呢,且听我一一道来。PS: 冷知识,大扫除英文是 spring cleaning,所以春节大扫除是 Spring Festival spring cleaning。大扫除的内容大扫除其实是一个查漏补缺+囤积粮草的事情。查漏补缺,即找出潜在的问题。这些问题平时可能不会特意去查看,
借助大扫除这个运动,恰好进行盘点。
计算机的世界里,有一个方法论非常好使,在极多场景可以见到其身影:分层。
TCP 的七层模型,架构设计的 N 层 模型,都是对分层思想的使用。
查漏补缺也不例外,我们可以按照业务访问流程,将需要排查的问题拆分为:业务、应用、中间件、网络、物理、存储 etc。通过分层,不仅仅完成了自上而下地遍历整个技术栈,也同时将不同模块的内容交给不同的责任方,
确保任务的分割。分完模块,还要告知大家如何具体查找问题。
这里我介绍一个通用的方法:USE1:For every resource, check Utilization, Satura
...
继续阅读
(62)