您现在的位置是:首页 > IT基础架构 > 计算存储 >

Linux实战攻略:NFS服务器故障排除

2008-10-16 21:42:00作者:曹江华来源:

摘要在Red Hat Enterprise Linux 5.0服务器中,如果NFS出现了故障,可以从以下几个方面着手检查。...

在Red Hat Enterprise Linux 5.0服务器中,如果NFS出现了故障,可以从以下几个方面着手检查。

1.1  故障排除思路

(1)NFS客户机和服务器的负荷是否太高,服务器和客户端之间的网络是否正常。

(2)/etc/exports文件的正确性。

(3)必要时重新启动NFS或portmap服务。

运行下列命令重新启动portmap和NFS:

service portmap restart

service nfs start

(4)检查客户端中的mount命令或/etc/fstab的语法是否正确。

(5)查看内核是否支持NFS和RPC服务。

普通的内核应有的选项为CONFIG_NFS_FS=m、CONFIG_NFS_V3=y、CONFIG_ NFSD=m、CONFIG_NFSD_V3=y和CONFIG_SUNRPC=m。

我们可以使用常见的网络连接和测试工具ping及tracerroute来测试网络连接及速度是否正常,网络连接正常是NFS作用的基础。rpcinfo命令用于显示系统的RPC信息,一般使用-p参数列出某台主机的RPC服务。用rpcinfo-p命令检查服务器时,应该能看到portmapper、status、mountd nfs和nlockmgr。用该命令检查客户端时,应该至少能看到portmapper服务。

1.2  NFS错误信息

NFS错误信息如下表所示。

 

1.3  使用nfsstat命令查看NFS服务器状态

nfsstat命令显示关于NFS和到内核的远程过程调用(RPC)接口的统计信息,也可以使用该命令重新初始化该信息。如果未给定标志,默认是nfsstat -csnr命令。使用该命令显示每条信息,但不能重新初始化任何信息。

nfsstat命令的主要参数如下。

(1)-b:显示NFS V4服务器的其他统计信息。

(2)c:只显示客户机端的NFS和RPC信息,允许用户仅查看客户机数据的报告。nfsstat命令提供关于被客户机发送和拒绝的RPC和NFS调用数目的信息。

要只显示客户机NFS或者RPC信息,将该参数与-n或者-r参数结合。

(3)-d:显示与NFS V4授权相关的信息。

(4)-g:显示RPCSEC_GSS信息。

(5)-m:显示每个NFS文件系统的统计信息,该文件系统和服务器名称、地址、安装标志、当前读和写大小,以及重新传输计数

(6)-n:为客户机和服务器显示NFS信息。要只显示NFS客户机或服务器信息,将该参数与-c和-s参数结合。

(7)-r:显示RPC信息。

(8)-s:显示服务器信息。

(9)-t:显示与NFS标识映射子系统的转换请求相关的统计信息,要只显示NFS客户机或服务器信息,将-c和-s<br />选项结合。

(10)-4:当与-c、-n、-s或-z参数组合使用时,将包含NFS V4客户机或服务器的信息,以及现有的NFS V2和V3数据<br />。

(11)-z:重新初始化统计信息。该参数仅供root用户使用,并且在显示上面的标志后可以和那些标志中的任何一个组合到<br />统计信息的零特殊集合。

要显示关于客户机发送和拒绝的RPC和NFS调用数目的信息,输入:

nfsstat -c

要显示和打印与客户机NFS调用相关的信息,输入如下命令:

nfsstat -cn

要显示和打印客户机和服务器的与RPC调用相关的信息,输入如下命令:

nfsstat -r

要显示关于服务器接收和拒绝的RPC和NFS调用数目的信息,输入如下命令:

nfsstat -s

 

1.4  NFS典型故障排除步骤

1.个别客户端无法从一个或多个服务器导入

(1)在客户端中检查下列内容。

验证在客户端中是否有该本地目录,如果不存在,使用mkdir创建。例如,如下命令:

# mkdir /opt/adobe

检查局域网电缆是否没有损坏并已连接上,所有的连接是否有效。

/etc/hosts是否存在并且有"相关信息"。

/etc/fstab是否存在并且有"相关信息",同时所有条目是否仍然指向服务器中的有效目录。

/etc/resolv.conf是否存在并且有"相关信息"(仅适于DNS)。

(2)在服务器中检查下列内容。

客户端尝试挂接的目录是否已存在并在配置文件中列出。

客户端是否具有挂接文件系统的权限。

相关信息说明如下。

/etc/hosts、/etc/fstab和/etc/resolv.conf中必须包含下列条目:

- /etc/hosts:系统主机名和IP地址,例如:

12.0.14.123 fredsys fredsys.mysite.myco.com

类似以下的条目:

127.0.0.1   localhost    loopback #[no SMTP]

- /etc/fstab:对于标准挂接,每个导入的文件系统对应一个条目。

- /etc/resolv.conf(仅域名服务[DNS]需要使用):系统所在域的名称,例如:

domain mysite.myco.com

至少一个名称服务器,例如:

nameserver 12.0.14.165

2.所有客户端都无法从指定的服务器导入

在服务器上执行下列步骤。

(1)确保服务器已启动且正在运行,并且服务器和客户端之间的局域网连接有效(是否可以从服务器ping通连接客户端,并且反之也可)。

(2)确保客户端要挂接的文件系统已在/etc/fstab中列出。

(3)重新启动NFS服务器。

如果这些补救方法都失败,而配置也正确(执行了上述所有测试),则服务器可能没有正确引导,应重新引导服务器。

 

3.其他NFS常见故障排除

(1)当mount NFS文件系统时,如果错误信息是"Permission denied",则表示NFS服务器不允许客户机挂接。一般可以用更改服务端上的/etc/exports文件来解决问题,使用exportfs-rv命令重新导出文件系统。

(2)如果出现的错误是"Program not registed",则是NFS服务可能没有启动或者运行不正常,最常用的解决方法是重新启动NFS服务。

(3)如果出现"RPC:Unable to receive",则可能是服务端没有启动portmap服务;如果已经启动,则可能是被防火墙所屏蔽。

(4)挂载文件系统的时候,客户端没有任何反应,则可能为客户端没有启动portmap服务。

(5)在NFS服务器中共享目录输出失败。

如果使用图形化窗口对共享目录进行配置,设置后必须测试共享目录的输出,以验证配置是否正确,通常图形化窗口不会报告配置错误。

使用"exportfs  -v  -a"命令检查/etc/exports文件中设置的共享目录是否能够正常输出,其中选项"-v"表示以冗余模式显示,即显示每一步的细节。

(6)显示"设备正忙"无法卸载。

在使用umount命令卸载远程NFS共享目录时,出现"设备正忙"等卸载失败消息。通常可能的原因是有一个进程仍然在使用这个目录,可以使用lsof命令来查看是否有进程正在使用该共享目录。

(7)挂载失败。

如果在挂载NFS共享目录时,客户端提示"RPC(Remote Procedure Call)failed",即远程过程调用失败消息,则很可能是因为服务器上带有约束性质的防火墙错误地阻止了NFS客户端挂载NFS共享,即防火墙封锁了NFS或者RPC端口。为了解决这个问题,可以使用iptable命令打开服务器上的111(RPC)和2049(NFS)端口,允许NFS客户端访问服务器。

(8)NFS请求挂起。

如果客户端正在执行写操作,而服务器无法响应或者在网络上变得不可访问,那么在默认情况下(使用hard选项进行挂载)客户端进程将挂起直到写操作完成。如果不中止写操作,进程就不能从请求中退出。为了避免NFS请求挂起,在网络状况不稳定情况下可以在挂载目录时指定soft选项以允许操作因超时而退出,或者指定intr选项以允许用户在命令行上通过按下Ctrl+C组合键退出挂起的操作。

(9)NFS挂载在引导时挂起。

如果在/etc/fstab文件中设置了自动挂载NFS,但在系统引导时NFS共享目录暂时不可用,那么默认情况下引导进程将进入等待状态,直到NFS目录变得可用为止。如果所需等待的NFS目录是系统必须的,那么这种等待可能还可以接受。然而在很多情况下,用户只想让系统把挂载请求放在后台并继续引导系统。可以把bg选项添加到/etc/fstab文件中,这样在首次挂载请求超时之后,挂载请求会转入后台,系统继续引导。当需要在前台挂载NFS共享目录时可以将fg选项添加到/etc/fstab文件的挂载选项中。

本文节选自《Red Hat Enterprise Linux 5.0服务器构建与故障排除》一书,作者曹江华。本文仅提供读者试读,如需全部内容请购买原书。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们