IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    硬件故障坑死人(持续更新)

    Yiran\'s Blog发表于 2018-09-27 09:35:44
    love 0
    背景 链接到标题 因为公司提供的产品不单单是软件形式提供,还对应的提供一体机形式(服务器 & 相应软件)。正式工作2年多也接触到了一些硬件的坑,特此总结。 磁盘 链接到标题 因为公司主要提供的产品是分布式存储和虚拟化相关产品,最直接的影响也是产生范围最大的影响就是磁盘了,会直接导致存储出现单副本等问题,从而产生数据恢复,影响集群稳定性。 固件版本 链接到标题 数据中心级别磁盘,相比于性能的要求,稳定性才是重中之重。大部分厂商的磁盘均支持 S.M.A.R.T. 规范,也就是“Self-Monitoring Analysis and Reporting Technology”,即“自我监测、分析及报告技术”,是一种自动的硬盘状态检测与预警系统和规范。我们可以通过相应命令比如 smartctl 直接获取磁盘相应信息,或者对磁盘进行检测。 S.M.A.R.T. 存在两个问题: 大部分厂商支持,意味着一部分厂商不支持 不同厂商对于自家磁盘的关键字定义不同 针对上述两个问题,我们只能说做到尽量多的测试踩坑,防止出现意外情况。 介绍了 S.M.A.R.T. ,我们来看看这节标题,固件。磁盘固件版本可以通过 smartctl 或者 sg_utils 工具获取: [root@node 07:47:14 ~]$smartctl -i /dev/sdc smartctl 6.5 2016-05-07 r4318 [x86_64-linux-3.10.0-693.11.6.el7.smartx.1.x86_64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Intel 730 and DC S35x0/3610/3700 Series SSDs Device Model: INTEL SSDSC2BA400G4 Serial Number: BTHV518009D3400NGN LU WWN Device Id: 5 5cd2e4 04c00728c Firmware Version: G2010160 User Capacity: 400,088,457,216 bytes [400 GB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: Solid State Device Form Factor: 2.


沪ICP备19023445号-2号
友情链接