HICOM程控交换机常用故障解析及处理

| 收藏本文 下载本文 作者:keeper

下面就是小编给大家整理的HICOM程控交换机常用故障解析及处理(共含6篇),希望您能喜欢!同时,但愿您也能像本文投稿人“keeper”一样,积极向本站投稿分享好文章。

HICOM程控交换机常用故障解析及处理

篇1:HICOM程控交换机常用故障解析及处理(一)

HICOM 390设备采用分级处理、功能分担工作方式,分为三级处理:中央控制系统、群处理系统、用户中继单元,其中央控制系统和时分交换网络均为双套热备份,整机性能较稳定,下面对其运行中发生的故障进行分类,分析每一类故障的原因,总结处理方法。

1 软件故障

HICOM系统内有处理故障的软件包,如果软件或数据发生故障,严重到一定程度,系统会在发生故障的部分内软启动,更新部分软件及数据,使系统又能正常工作。

(1)主备CPU倒换

HICOM系统含有双套CPU,当主CPU工作时,备用CPU同时接收有关信息,保持与CPU数据一致。当软件故障严重到一定程度时,主CPU不能正常运行,备用CPU自动或通过人工切换(按DPLM板上RES键)为主机工作。原主CPU从ADS重新装载数据,成为备用CPU。切换过程中数据不会丢失,通话用户也不会掉话。

(2)用户机柜发生啸叫

某一机柜全部用户发生啸叫,其他机柜用户拨号直正常。拨号音是由每个外围机柜群处理单元的信号单元板SIU提供的,通常通过软件数据定义。用户发生啸叫原因有两方面,一是该机柜SIU板故障;二是软件数据故障。检查SIU板正常,说明为软件故障,按群处理DPLM板上RES键,该外围机从中央机柜重新装载数据,装载完成后用户恢复正常拨号音。

2 维护终端故障

维护终端F500通过V.24接口与交换机进行通信,它与管理服务器ADS相连,主要用于系统管理及用户数据的输入、输出,是维护的主要工具。

(1)与交换机通信中断

遇此故障,查看链路控制板LCU上端口指示灯,指示灯灭,此故障多为端口自保护关掉,不能联机,引起通倍中断。依次进行以下几步:

①先用AMO命令开关:ACT-LSSM:AI,8;

②在键路总线控制板LBC上按LT链两下,重新装载LCU板数据。

③按数据处理器板DPLM上REST键,重新装载ADS数据。

④关掉ADS电源,重新启动。

V.24端口自保护关闭故障,可能在以上4步任一步恢复。若仍未恢复,说明V.24端口损坏,需要更换LCU板。

(2)键盘不起作用

检查键盘正常,V.24接口正常,按键盘无任何反应。F500终端设有内部某单,可以设置两个口令:一个是设置口令,一个是键 令。若维护人员设置了键盘密码后,选择KEYBD LOK键将键盘锁定,后来将密码忘记,会造成此故障。处理方法是:关掉维护终端电源,打开底座,将用于信息存储的电池两端短路,释放掉存储的信息,键盘可恢复正常。

(3)命令输入正常,按RUTURN 键不执行

AMO命令输入完后,按RUTURN键不执行,改按 CTRL+C键,命令执行。在 F500终端中,RUTURN不是执行键,CTRL+C才是执行键。若维护人员在查看菜单时,选择了 DEFAULT KEY项,原RUTURN键定义为 CTRL+C消失,会出现此故障。处理方法:选择 EDIT KEY菜单,重新定义 RUTURN健为CTRL+C,恢复正常。

若按CTRL+F9,屏幕显示W1 BLK或 W1LOK,各类操作键不起作用。再按CTRL+F9键,显示出W1状态,操作键恢复正常,

3 话务台故障

话务台AC用于系统内部和外部用户间的通信,它具有转发来话、强插、保持、监听等功能,是话务员的工具。常见故障有:

(1)话务台显示不正常

此故障多由软件或数据错误引起,话务台自保护将端口关闭,重新开启端口即可。方法:执行命令ACT-DSSU:ONTYPEDAUL,PEN=(话务台端口号);话务台重新装载数据,恢复正常。

(2)话务台无显示

话务台无显示原因有两方面,一是电源及连接电缆故障;二是话务台本身发生故障。

检查发现话务台掉电。话务台使用的48V直流电,该电源取自配线架,对应的保险弹出。查出连接电缆话务台无故障,重新上好保险,话务台开始装载,恢复正常。

4 用户故障

HICOM采用SLMA模拟用户板,每板16个用户。用户故障是最常见的故障。首先在配线架用隔片隔开内外端,测试判断故障是内城故障,还是外线故障。若是外城故障,则进行外线处理,具体方法这里不再介绍。内线故障大体可分为以下几类:

(1)由外线故障引起用户端口关闭。

此类故障是由外线故障引起的。当外线带电或短路时,用户检测单元检测到用户状态异常,在维护终端输出故障信息,若故障仍未得到处理,一段时间后为保护用户端口,系统启动软件将端口自动关闭。遇这种情况,处理完外线故障后,使用命令将端口打开即可。

例:号码分机关闭,其端口为1-1-3-7。输入AMO命令:

ACT-DSSU:ONTYPE=AUL,PEN=1-1-3-7;

或 ACT-DSSU:ONTTYPE= AUL,STNO= 2000;

有时端口不能顺利开启,可结合板子开启命令使用:

ACT-BSSU:ONTYPE=AUL,LTG=1,LTU=1,SLOT=3;

端口将恢复正常,状态显示为 READE。

(2)用户板端口电路损坏

当开关、插拔用户板后,对应端口仍未恢复,可怀疑为此类故障。将两块用户板对调,若故障随板子走,说明用户板上对应的端口已损坏,调换用户板后端日恢复正常。

(3)用户板底座或背板故障

判断用户板正常后,取下机柜背板上对应的电缆插件,用方用表测试背板上的插座,若输出电压远远低于48V,说明故障发生在用户板底座或背板上。处理方法为将此端口长期关闭,暂不使用。

DEL-DSSU:OFFTYPE=L,STNO=2000;

(4)电缆连线或插接件损坏

用户机柜和配线架之间是用16芯的铜线电缆连接的。检查时,取下机柜背板上对应的电缆插件,用万用表测试背板上的插座,若输出电压为48V,听拨号直正常,可判断为电缆连接或插接件故障。插接件中每一用户对应一电路,其线圈容易损坏。若插接件正常,即为连接电缆故障。我局曾发生由于电缆拉得太紧,造成插接件接触不良,引起几块用户板的第一个端口无拨号音的情况。

5 电源故障

电源故障分为一次电源故障和二次电源故障。一次电源故障这里不再介绍,重点介绍二次电源故障。二次电源分为3种:PSUF、PSUC、PSUB。输出不同的电压,提供给不同的电路板。

(1)一个机框用户无拨号音

一个机柜用户无拨号音,同一机柜的其他用户正常。检查发现该机框对应二次电源PSUB指示灯灭,关掉PSUB电源开关,检查连接电缆等均正常,重新开启PSUB电源,恢复正常。

(2)一个机柜不停地重新装载

一个机拒不能正常工作,运行几分钟后又重新装载,且时间间隔越来越短。检查该机柜与主机连接电、接口,判断故障出在外围机柜。检查外围机柜群处理单元,4个用户机笼均正常。检查分电源PSUF,发现该电源螺丝松动,造成接触不好,接地不良,引起故障。处理后重新安装该电源,故障消失。

篇2:程控交换机故障解析和解决方案

程控交换机故障分析和解决方案,JSQ-4000型程控交换机维修经验,JSQ-4000是一种全数字时分程控交换机,采用全分散控制方式,其端口的用户与中继数可按用户需求任意选配,可作为用户交换机、专用网交换机和C5端局交换机使用,

分机用户程控交换机故障

用户接口板是交换机中直接与分机用户相连接的唯一接口,每一个用户都有一个相互独立的用户电路,用户电路采用SLIC(厚膜电路)+COMDEC(编译码电路)。如摘机无拨号音,首先在配线架上找到该分机端口(将外线断开后)测试判断。

对于外线侧:用户外线短路或开路、用户话机坏了,都可能造成摘机无拨号音;对于设备侧:该分机端口参数设置出错(分机设置只许接听时)也会无拨号音。如话机上不振铃而通话正常,首先在配线架上找到该分机端口(将外线断开后)测试判断。

对于外线侧:用户外线开路、混线或地气大都能造成话机不振铃或只振一次铃;用户话机振铃电路坏,应更换话机。设备侧:用户板上该端口的振铃继电器或振铃有关的电路坏了,应更换用户板。

如果是整个模块用户均不振铃,则可能PSU板的0.75A保险熔丝断,须更换相同规格的熔丝或产生铃流的模块电源,或者更换PSU板。同一模块有几个分机端口取机拨号切不断拨号音(双音频分机),但脉冲分机可以切断拨号音,可能是MCPU板上的U29(29EE010)芯片坏了。

另外,观察电路板上的指示灯或听声音也能判断故障,如呼叫该用户时,继电器有“吱吱”的颤动声,多半是用户外线间电容太大、线路绝缘不好、话机并机太多、话机不好等造成。

中继程控交换机故障

中继接口是用户交换机与上级局连接的端口,用户与外线电话的联系必须通过中继接口。经常听到用户反映拨“0”后打不出去(无声)或呼叫总机无人应答及无语音提示(总机有人值班),首先在配线架上判断市话出、入中继接入交换机是否正常,如个别出中继端口无拨号音,请向电信局112故障台反映。

在配线架上将所有入中继短路,然后拨打入中继引示号或单个入中继号码,如仍可听到回铃音,请与电信局联系解决,

在市话局正常的情况下,上述故障的出现有可能是:

◆中继板个别端口不好,更换3845芯片或整块中继板。

◆交换机侧数据不对,如中继数据丢失或该出入中继设置不对。

◆加载了错误的中继数据。

值得一提的是对使用环路中继的用户交换机出局通话约1min就断线(中继释放)现象,一般为出中继无反极信号,但出中继参数设置为“识别”所致。因本机软件对识别反极性信号的出中继,如占上出中继程控交换机故障1min内未收到反极性信号就认为该中继有问题,不能接通电话而将中继释放,因此如中继线无反极性信号,千万不要将反极性信号项设置为“识别”。

程控交换机故障:计费系统不接收话单

计费系统不接受话单,可能是以下原因中的一种。

◆计费系统中一些与话单接收有关的参数(通信速率、通信串口、话务记录选择)设置有关。一般通信串口选择串口一;话务记录选择对长市农作话务记录;对于有NCPU板的通信速率应选择9600baud,无NCPU板的通信速率应选择2400baud。

◆计费系统的延时计费时限设定得过长(如999s)。

◆交换机与电脑连不上机,而没有送出话单,一般为NCPU板上的96FS174或96FS175有问题。

◆电脑上所插的422卡有问题与交换机连不上机,此问题一般为交换机遭受雷击或因电脑终端没与交换机共地,还有是交换机与电脑终端相连的电缆线有高电压或大电流通过,造成422卡上96FS174,96FS175坏。

◆与所用的汉字系统所进行的功能切换有冲突,如UCDOS汉字的拼音、五笔输入等输入后按ALT+F6切换回英文状态时,计费系统的时钟不走。此时按一下空格键或ESC键,计费系统时钟就会走,也可正常接收交换机送来的话单,这是一种假死机。

◆所有汉字系统或操作系统有问题,比如软件感染病毒或使用盗版软件。

◆所有计费系统软件与交换机软件不配套。

◆电脑终端与交换机相连的电缆线断线,从422卡到串口的扁平电缆断线,一般是被老鼠咬断或被压断。

◆维护台中的相应出局号码的计费功能设置为关闭,将其改为开启即可。

篇3:NFS故障的解析和处理

日常的工作和学习中,我们使用的一些系统以及相应的操作中,难免会遇到一些故障问题,那么对于NFS故障的分析和解决我们在下文中为大家做了具体的分析和处理,希望本文的总结对您处理问题能够有所帮助。

NFS故障1、NFSD没有启动起来

首先要确认 NFS 输出列表存在,否则 nfsd 不会启动.可用 exportfs 命令来检查,如果 exportfs 命令没有结果返回或返回不正确,则需要检查 /etc/exports 文件.

NFS故障2、mountd 进程没有启动

mountd 进程是一个远程过程调用 (RPC) ,其作用是对客户端要求安装(mount)文件系统的申请作出响应.mountd进程通过查找 /etc/xtab文件来获知哪些文件系统可以被远程客户端使用.另外,通过mountd进程,用户可以知道目前有哪些文件系统已被远程文件系统装配,并得知远程客户端的列表.查看mountd是否正常启动起来可以使用命令rpcinfo进行查看,在正常情况下在输出的列表中应该象这样的行:

1000051udp1039mountd 1000051tcp1113mountd 1000052udp1039mountd 1000052tcp1113mountd 1000053udp1039mountd 1000053tcp1113mountd

如果没有起来的话可以检查是否安装了PORTMAP组件.

rpm -qa|grep portmap

NFS故障3、fs type nfs no supported by kernel

kernel不支持nfs文件系统,重新编译一下 KERNEL就可以解决.

NFS故障4、can't contact portmapper: RPC: Remote system error - Connection refused

出现这个错误信息是由于SEVER端的PORTMAP没有启动.

NFS故障5、mount clntudp_create: RPC: Program not registered

NFS没有启动起来,可以用 showmout -e host命令来检查NFS SERVER是否正常启动起来.

NFS故障6、mount: localhost:/home /test failed, reason given by server: Permission denied

这个提示是当 client要mount nfs server时可能出现的提示,意思是说本机没有权限去mount nfs server上的目录.解决方法当然是去修改NFS SERVER咯.

NFS故障7、被防火墙阻挡

这个原因很多人都忽视了,在有严格要求的网络环境中,我们一般会关闭linux上的所有端口,当需要使用哪个端口的时候才会去打开.而NFS默认是使用111端口,所以我们先要检测是否打开了这个端口,另外也要检查 TCP_Wrappers的设定.

篇4:针对DHCP故障的解析和处理

网络的概念很广泛,对于协议的学习也有很多方面,今天我们介绍的则是DHCP协议相关的一些故障处理。众所周知每台计算机要想正常上网需要有一个地址,这个地址就是我们常说的IP地址。在实际工作中身为网络管理员的我们如何有效的管理这些IP地址呢?为每台计算机设置对应的IP地址,子网掩码,网关地址,DNS地址等网络参数的话固然是可以的,但是非常的烦琐,工作量大不说,在实际应用中很可能经常会出现冲突的现象。

我们如何有效的分配这些网络参数呢?DHCP服务可以帮我们大忙,通过将DHCP服务配置在专业的服务器上,然后为网络中所有普通客户机分配IP等信息是件效率非常高的工作。不过DHCP在为我们网络管理提供便利的同时也带来了一些问题。例如网络带宽受影响,客户机经常无法获得正确的地址信息,甚至是无法获得任何信息。其实这些故障我们都可以按照一定的规律去解决的,今天就由笔者为各位读者全面介绍排查DHCP故障的方法。

一、概念篇:

在介绍排查DHCP故障之前首先为大家阐明几个概念性的东西,只有理论上充实了,才能更好的理解下面介绍的故障排除的思路。

第一:DHCP服务能够提供什么数据?DHCP服务不是万能的,他只能提供网络层相关的参数,例如IP地址,MASK地址,网关地址,WINS与DNS服务器地址等。对于更低层的地址,诸如MAC地址等信息是无法提供的。MAC地址是烧录在计算机网卡中的。

第二:多台DHCP服务器是否可以同时运行?DHCP服务器是通过广播包向客户机发送网络信息的,因此如果同一个网络中确切的说是同一个广播域中存在多台 DHCP服务器的话,就会出现各个服务器提供各自的网络信息,这样就造成网络中广播数据包的冲突。客户机不知道该接受哪台DHCP服务器发来的信息。因此微软公司设置默认情况下同一个广播域网络中只能存在一台DHCP服务器,后设置建立或启用的DHCP将无法工作。

第三:租约是什么?在配置DHCP服务器过程中会设置租约的天数,那么什么是租约呢?在DHCP服务器将网络信息分配数据包发给客户机后会收到客户机发回的答复数据包,接着DHCP服务器会将已经分配出去的IP地址与从客户机接收到的该计算机MAC地址建立一个对应关系,并把这个对应关系保存在DHCP服务器的租约池中。为什么需要这个租约池呢?一方面为下次分配网络参数信息提高了速度。不过如果该MAC地址对应条目的客户计算机被移到其他地方或者MAC 地址发生了改变的话,如果上面建立的对应关系一直保存在DHCP服务器的租约池中就会造成可用的IP地址数量越来越少,很多有效的地址被无效的MAC占用,因此微软引入了租约这个概念。通过租约我们可以强制每隔一段时间将DHCP服务器的租约池中保存的对应条目全部清空,从而防止了非法MAC地址霸占合法IP的现象。

第四:我的客户机可以从DHCP服务器获得169.254.*.*形式的IP信息,这句话是错误的。为什么呢?微软公司在windows系统中提供了这样的功能,即如果网络中不存在任何DHCP服务器,客户机本地网络信息又被设置为自动获得IP方式的话,那么windows2000及其以上操作系统将自动为自己分配一个诸如169.254.*.*形式的IP信息。因此如果你发现自己的客户机只能获得169.254.*.*这样的IP地址的话,说明你的DHCP服务器没有正常工作,

二、客户端排障:

DHCP故障主要有两个方面,客户机存在问题以及服务器自身问题。首先我们来介绍下在客户端进行的排除故障方法。

第一步:通过任务栏的“开始->运行->输入CMD”进入命令行模式。

第二步:在命令行模式中输入ipconfig后回车,看是否可以自动获得IP地址。

小提示:在进行前两步操作前首先要保证客户机的IP地址分配方式被设置为自动获得IP地址。

第三步:如果可以获得正确的IP地址说明DHCP正常,如果发现获得错误的地址,其中包括169.254.*.*这样的形式,则执行ipconfig /release命令,该命令是将当前获得的网络参数信息释放。

第四步:释放网络参数后再次执行ipconfig我们会看到当前得到的网络参数已经为空,所有信息变成0.0.0.0。

第五步:释放得到的错误信息后执行ipconfig /renew将自动获得新的信息。

小提示:如果我们不执行释放IP信息的命令直接运行ipconfig /renew的话将无法重新获得IP信息。因此第三步必不可少。

第六步:重新获得IP信息后我们查看当前的地址参数,如果无法获得任何信息的话还是要从本机入手解决问题,如果获得的是错误信息的话则需要找到DHCP服务器,对其进行检查。

第七步:将本地网卡禁用然后再次启用,按照上面介绍的步骤重新做一次。

第八步:如果我们知道DHCP服务器的IP地址的话,可以在客户机上使用ping命令“ping 服务器ip”查看网络连通情况。

第九步:在系统的“事件查看器”中寻找有无关于DHCP服务相关的故障记录。方法是“开始->控制面板->管理工具->事件查看器”。

第十步:通过“开始->控制面板->管理工具->服务”打开服务设置窗口,在服务列表中找到dhcp client service。在其上双击,然后点停止按钮,接着再点启动按钮将其重新启动。如果发现该服务本身没有启用则更说明了故障的根源所在,直接启动并设置启动方式为“自动”即可。

第十一步:打开网络的本地连接进行修复,方法是“网上邻居->属性->本地连接->修复”。系统将自动清除ARP缓存与NETBS信息,接着更新DNS与DHCP服务组件与相关信息。

第十二步:如果上面十一步仍然不能解决问题的话,我们只能先使用静态IP地址与DNS等网络信息配置本机来进行检测了。如果配置了静态IP信息后可以正常上网,连接LAN的话,则说明问题的出在客户机与DHCP服务器的连接或者DHCP服务器自身上。我们就要将问题的起因放到DHCP服务器上。

小提示:有的时候为客户端设置一个其他用户,然后使用该用户登录也可以解决部分DHCP故障,另外用 lspfix.exe或winsockxpfix.exe,修复tcpip的栈区错误,结合“开始->运行->输入sfc /scannow”扫描一遍系统文件也能得到意想不到的结果。

三、服务器排障:

DHCP 服务器的排障方法我们已经介绍过很多了,感兴趣的读者可以查阅以前服务器频道相关文章。主要的手段就是查询服务器上的dhcp server的设置是否正常,如果没有启用将其开启。另外还要时不时的将DHCP服务器关闭查看是否网络中还存在其他DHCP服务器从而产生冲突。另外在网络建立域的情况下,要想开启DHCP服务器是需要由域控制对该DHCP服务器授权的,所以授权工作不要遗忘。

篇5:路由器中ICMP故障的解析和处理

在一些设置中,我们常会遇到ICMP故障,那么对于路由器中的这类故障我们如何解决呢?下面我们就例举了一些情况,来帮助大家进行一下分析,以及给出了一些解决方法,

这是个什么问题呢?首先给大家描述一下。虽然路由器在运行时没有出现明显的异常现象,但是却经常看到这样的日志:其中“209.24.79.200”是路由器的上联接口地址,我不知道为什么会出现这么多从路由器发到这些没有规律的IP的ICMP故障。

ICMP故障

一切准备就绪后,接着就是开始端口镜像。使用计算机B登录到路由器,进入配置模式,输入以下命令:SSR(config)# port mirroring dst-ports et.1.3 src-ports gi.4.1上面的命令把上联端口(gi.4.1)镜像到目标端口(et.1.3),目标端口就是计算机A连接的端口。在计算机A上,进入DOS提示符,转到WINDUMP所在的目录,输入命令:

(上面的记录已做过筛选。第一句的参数“-N”表示IP地址或者端口号转换为主机名或端口名,第二句表示windump开始在所选网卡上监听,第三句开始就是WINDUMP记录的信息。)同样在计算机B上也运行WINDUMP:查看路由器上的日志,我任意找到其中一条关于ICMP的记录:

查,在计算机A上采集的数据中,有几条记录(最后两条)包含“218.79.246.212”的IP和此记录匹配。从这两句的记录来看,第一行表明从218.79.246.212的tcp端口64627向222.222.222.191的16881端口发送报文。

S标志表明设置了SYN标志,报文的流序号是2898301189,没有数据,有效的接收窗口是4096字节,最大段大小(max-segment-size)的选项,请求设置mss为1452字节。很明显,这是一个请求报文。而第二句表明路由器给218.79.246.212返回了一个“unreachable(主机不可达)”ICMP 信息。这说明在这个网段中没有找到IP地址为“222.222.222.191”的计算机。

原来,当路由器接收到一个不知道IP地址(也就是说,路由器不知道目标路由)的数据包时,它会尝试发送ARP广播来解析,如果有目标主机回应这个ARP广播,则路由器会把数据包转发给目标主机。

如果路由器没有接收到回应,它将会为接下来的4个数据包发送ARP请求,如果当第6个数据包到达时,还没有解析出目标主机的MAC地址,默认情况下,路由器将会在接下来的20秒钟内丢弃第6个以及后续的数据包,并且返回“主机不可达”的ICMP信息给源主机,

从计算机B的记录中的第一句也可以得到证明,路由器向该网段中发出一个ARP查询,查找IP为“222.222.222.191”的计算机,结果没有计算机相应,路由器则认为该网段中没有目标主机,所以返回一个ICMP信息给源计算机说明目标主机不可到达,以通知源主机这里存在问题,同时丢弃原始数据包。

至此问题已经明朗,原来路由器记录的ICMP都是路由器发送给源地址的“Destination Unreachable”信息。那么为什么这些外面的IP地址会找校内的计算机呢?从采集的数据分析不难发现,这些外部主机主要是找内部的固定的三个计算机。经过历史日志的检查,可以发现这三台计算机的主要相同的记录:

这三台主机连接目标主机的端口固定在6881到6889之间,而这些端口正是现在比较流行的BT下载的常用端口。难怪以前没有出现过此类日志,直到最近BT流行时,才出现的。主要原因是,这些主机使用BT下载时,在BT服务器上留下了记录,以便其他的主机到这些主机上下载资源,而当这些主机关机后,路由器就告诉它们找不到这些主机了。

由于日志服务所记录的是第三层以上的信息,而路由器接收到的数据包在第二层上就被丢弃了,所以没有在日志中记录这些输入的异常数据包。为了减少路由器的日志量,在配置模式下使用“ip disable icmp-messages destination-unreachables”来禁止此类信息的转发。

这个ICMP故障均由ICMP引发,而且从某种角度上讲都不是系统配置上的问题,而是由于外部因素引起的。此类ICMP故障需要我们经过一定的分析才能查出原因,再作相应的配置才能排除ICMP故障。

编辑推荐TCP/IP协议专题

TCP/IP(传输入控制地议/网际协议)是一种网络通信协议,它规范了网络上的所有通信设备,尤其是一个主机与..

NFS Server故障分析和解决路由器常见故障解决方法集锦检测排除TP-LINK路由器故障四类ADSL故障的剖析和处理ICMP协议工作流程详解

篇6:NFS协议的故障处理和安全解析

在之前的文章中,我们介绍了NFS协议的有关内容,想必大家对于它的基础概念,以及配置等有关内容已经有了了解了。这里我们主要讲解一下有关于NFS协议的故障解决以及相关安全的问题。

NFS协议故障解决

1?NFSD没有启动起来

首先要确认 NFS 输出列表存在,否则 nfsd 不会启动.可用 exportfs 命令来检查,如果 exportfs 命令没有结果返回或返回不正确,则需要检查 /etc/exports 文件.

2? mountd 进程没有启动

mountd 进程是一个远程过程调用 (RPC) ,其作用是对客户端要求安装(mount)文件系统的申请作出响应.mountd进程通过查找 /etc/xtab文件来获知哪些文件系统可以被远程客户端使用.另外,通过mountd进程,用户可以知道目前有哪些文件系统已被远程文件系统装配,并得知远程客户端的列表.查看mountd是否正常启动起来可以使用命令rpcinfo进行查看,在正常情况下在输出的列表中应该象这样的行:

100005 1 udp 1039 mountd

100005 1 tcp 1113 mountd

100005 2 udp 1039 mountd

100005 2 tcp 1113 mountd

100005 3 udp 1039 mountd

100005 3 tcp 1113 mountd

如果没有起来的话可以检查是否安装了PORTMAP组件.

rpm -qa|grep portmap

3?fs type nfs no supported by kernel

kernel不支持nfs文件系统,重新编译一下 KERNEL就可以解决.

4? can't contact portmapper: RPC: Remote system error - Connection refused

出现这个错误信息是由于SEVER端的PORTMAP没有启动.

5? mount clntudp_create: RPC: Program not registered

NFS协议没有启动起来,可以用 showmout -e host命令来检查NFS SERVER是否正常启动起来.

6?mount: localhost:/home /test failed, reason given by server: Permission denied

这个提示是当 client要mount nfs server时可能出现的提示,意思是说本机没有权限去mount nfs server上的目录.解决方法当然是去修改NFS SERVER咯.

7?被防火墙阻挡

这个原因很多人都忽视了,在有严格要求的网络环境中,我们一般会关闭linux上的所有端口,当需要使用哪个端口的时候才会去打开.而NFS默认是使用111端口,所以我们先要检测是否打开了这个端口,另外也要检查 TCP_Wrappers的设定.

NFS安全

NFS的不安全性主要体现于以下4个方面:

1?新手对NFS的访问控制机制难于做到得心应手,控制目标的精确性难以实现

2?NFS没有真正的用户验证机制,而只有对RPC/Mount请求的过程验证机制

3?较早的NFS可以使未授权用户获得有效的文件句柄

4?在RPC远程调用中,一个SUID的程序就具有超级用户权限.

加强NFS协议安全的方法:

1?合理的设定/etc/exports**享出去的目录,最好能使用 anonuid,anongid以使MOUNT到NFS SERVER的CLIENT仅仅有最小的权限,最好不要使用root_squash.

2?使用IPTABLE防火墙限制能够连接到NFS SERVER的机器范围

iptables -A INPUT -i eth0 -p TCP -s 192.168.0.0/24 --dport 111 -j ACCEPT

iptables -A INPUT -i eth0 -p UDP -s 192.168.0.0/24 --dport 111 -j ACCEPT

iptables -A INPUT -i eth0 -p TCP -s 140.0.0.0/8 --dport 111 -j ACCEPT

iptables -A INPUT -i eth0 -p UDP -s 140.0.0.0/8 --dport 111 -j ACCEPT

3?为了防止可能的Dos攻击,需要合理设定NFSD 的COPY数目.

4?修改/etc/hosts.allow和/etc /hosts.deny达到限制CLIENT的目的

/etc/hosts.allow

portmap: 192.168.0.0/255.255.255.0 : allow

portmap: 140.116.44.125 : allow

/etc/hosts.deny

portmap: ALL : deny

5?改变默认的NFS协议的端口

NFS默认使用的是111端口,但同时你也可以使用port参数来改变这个端口,这样就可以在一定程度上增强安全性.

6?使用Kerberos V5作为登陆验证系统

修改/etc/hosts.allow和/etc/hosts.deny达到限制CLIENT的目的

/etc/hosts.allow

portmap: 192.168.0.0/255.255.255.0 : allow

portmap: 140.116.44.125 : allow

这个得多注意!!

/tmp *(rw,no_root_squash)

no_root_squash:登入到NFS主机的用户如果是ROOT用户,他就拥有ROOT的权限,此参数很不安全,建议不要使用.

有时需要执行umont卸载nfs盘阵时,会遇见device is busy的情况,字面意思理解为设备忙,有其他进程正在使用此设备.

此时需要用到命令fuser

其格式为: $ fuser -m -v (nfs挂载点) 回车执行后得到的结果依次是:用户 进程号 权限 命令

此命令可以查看到访问此设备的所有进程,停止进程后umount.

如果添加参数 -k则可以一次性将所有当前访问nfs协议共享盘阵的进程停止 也可以加-i 打开交互显示,以便用户确认

或者用fuser命令:

#fuser -v -m 挂载点

即可查处 用户 PID等,KILL掉该进程后再umount.

或者

#umount -l 挂载点

选项 Cl 并不是马上umount,而是在该目录空闲后再umount.还可以先用命令 ps aux 来查看占用设备的程序PID,然后用命令kill来杀死占用设备的进程,这样就umount的非常放心了.

鼠标、键盘故障及处理

路由器中ICMP故障的解析和处理

无线网络连接故障的处理方法

无线网络技巧:WiFi故障处理心得

浅谈程控交换机维护

程控交换机维修保养合同

电线接头故障与处理分析论文

发电厂变压器油故障的处理方法论文

无线网络连接故障的现象与处理技巧

计算机网络通讯技术故障分析与处理论文

HICOM程控交换机常用故障解析及处理(锦集6篇)

欢迎下载DOC格式的HICOM程控交换机常用故障解析及处理,但愿能给您带来参考作用!
推荐度: 推荐 推荐 推荐 推荐 推荐
点击下载文档 文档为doc格式
点击下载本文文档