文章 链接到标题 技术 链接到标题 一些 System Design 面试的建议
明确需求;定义系统接口和业务 Entity;画一个架构图;讨论具体细节。
A Checklist Manifetsy
维护自己的检查清单可以对所做内容更有掌控感。
Alerts, what are they good for?
如何设置报警规则?在我司通常是依靠经验拍脑袋。作者提出了一个可以量化的规则来 评估规则:
影响:越严重则数值越大
频率:发生频率越高,则数值越大
可恢复性:如果涉及到的问题所需要手动工作量越大,则数值越大
最终计算方式为(i+f)*r ,作者给出了数值建议:
1–19 ignore
20–49 alert
50–79 evaluate the event. is it rated properly and if yes, what improvements can be made if any. The below example of US East 1 going down is a worse case scenario that relies on DR however, with good monitoring, can be detected and actioned