文章 链接到标题 技术 链接到标题 聊聊 Docker 的存储驱动 Overlay2 | MoeLove [[overlayfs]] 介绍。
Ask HN: Azure has run out of compute – anyone else affected? | Hacker News [[azure]] 德国无法扩容更多容量,看评论(各家)都已经遇到很多次了。
Linux RT 进程引发内核频繁卡死的优化方案
经过查看内核 RT 实现,发现 RT 进程是有相关的占用时间设置的 /proc/sys/kernel/sched_rt_runtime_us ,sched_rt_runtime_us 的默认值为 950000,代表 RT 进程可以占用 95% 的 CPU 时间片,剩余 5% 用于响应其他请求,而这里比较诡异的是为什么 sched_rt_runtime_us 明明设置了 950000 这个值,surfaceflinger 这个程序为什么还能将 CPU 使用到 100% 呢?
经过代码分析和社区 issues 查找,**发现引发该问题的罪魁祸首是 RT_RUNTIME_SHARE 这个特性,该特性可以使 RT 任务长期占用 100% CPU, 从而使诸如 kworkers 等相关的内核任务无法获取到 CPU 资源,造成内核卡死。**而客户使用的内核版本恰好是 5.