ubuntu14.04使用NFS做主存储的问题

版本4.9,部署了10台物理机,使用ubuntu14.04.5,kenel4.4.38,发现只要主存储上的NFS服务停掉后,所有的agent服务器全部在10分钟内会自动重启,此问题太奇怪了,不是个别现象,100%重现,难道是agent程序发现主存储无法访问后强制服务器重启?
已邀请:

ak_qq

赞同来自: terryhux

对的,如果使用NFS做主存储,当nfs挂掉后,CS出于可靠性的保证,也会认为host挂了(因为host连不到nfs),而在 kvm主机中,有一个kvmheartbeat.sh脚本,就是做这个事情的,会持续在nfs中写ha信息,以确保自己与nfs之间链路正常。
如果因为网络抖动或nfs异常,没法持续写ha信息,重试几次后就会触发reboot操作。
具体可查看:
/usr/share/cloudstack-common/scripts/vm/hypervisor/kvm/kvmheartbeat.sh
但在实际情况中,网络抖动或nfs间歇性异常(或许要维护)情况时常发生,为了避免该问题,可对该文件进行重写。加入一个判断,判断多次,都失败,再重启主机。或可参照附件。
 

要回复问题请先登录注册