作者所在的实验室有自己的服务器,而不是使用“射光所”的十年前售价100k RMB的老机子还是很良心的。自从4307搬到9436,4307的服务器就主要用于给做毕设的本科生还有实习的本科生用。4307里的服务器,或者说是工作站使用的是Xeon E5520,8G内存,1TB的希捷硬盘,配置说不上高,但也还可以,使用CentOS 5.9没什么大问题。
服务器的硬盘是新的,按理来说没什么问题才对,但是却常常用着用着就X11服务崩溃了,使用Xmanager登陆时显示不出界面来。强制重启后会服filesystem有问题,使用fsck检查一下,从输出的日志信息来看就是usr(LVM下的一个单独分区)有坏道。查询了一下屏蔽硬盘坏道的方法,说白了就是分区的时候不要给坏道分区就可以了。知道了这个问题,还得到了博士的可以乱搞授权,心想就是把usr换一下就可以了,usr原来是挂载的,现在我就换个位置好了,直接放在根目录下,copy一下。话说我在Virual Box虚拟机中复制并生命名usr没什么问题,但是在服务器上搞就行不通了,一开始也没有使用LiveCD或是安装DVD盘进入Linux rescue模式,强制删除了usr文件夹,心想这也就只会使桌面服务崩溃而已,结果删除usr的过程中,服务器就挂掉了(删除usr,话说真是低级错误,都是虚拟机的经验导致的)。
服务器启动时就会报no inittab,即使后面把copy来的usr改为usr,并把原来挂载在usr下的挂载到usr.old文件夹也启动不了,那我就把CentOS 5.9的/etc/inittab文件夹的内容抄来试试,这下确实是可以启动了,不过后面又报GDM的错误,并解决不了。在single模式下还没办法改密码,找不到原来的用户,连root都认为是不识别的,没有办法就决定重装系统喽,刻了两张CentOS 5.9 DVD盘去装(现在笔记本都带可记录的DVD真良心)。
把usr不挂载,跳过有坏道的分区,损失20G,对于1TB,不痛不痒的说。装好后测试了一下一切OK,Cadence、Synopsys、ADS一切正常,需要也会有几个rpm包要安装,用笔记本下载好,使用U盘复制过去rpm -ivh一下就OK。这里做得最糟糕的一件事就是忘了记下来用户的ID,并按ID重建用户和组,导致了home下的文件权限混乱掉了,一个一个改好麻烦,直接chmod 777,这样简单。
此外也会有一些其他问题,比如说Xmanager登陆后看Message显示X11连接后就关闭了,就把原来home中用户文件夹下的Xmanager连接时生成的文件删除了,比如什么.Xauthrity等(后面猜测文件权限原因可能导致此问题),Xmanager连接时重新创建这些文件就可以了。还有就是网卡启动问题,这个网上有教程,好搜索,说是Linux的BUG,不懂,不过要真是BUG就真的好汗颜,这和WordPress的注册邮件链接索取密码BUG一样令人无语。把网卡启动,设置好静态IP地址,一切就OK了。从前天搞好到现在,一切正常。
未经允许不得转载:TacuLee » CentOS服务器维护小记