您的位置广东网盟 > 文章资讯 > 常见故障 > 网络故障 > 文章内容

网络丢包现象分析处理指导书五

作者:佚名  来源:本站整理  发布时间:2008-6-19 9:55:53
人为攻击/广播泛滥
 


 
问题描述:如上图所示,交换机端口1:1-1:12、2:1-2:8在同一个VLAN中,网关指向CISCO7206的下行端口FA0/0的IP。另外1:13下接一个大客户,1:14下接一个大客户,他们的网关指向BIG400上本VLAN的IP,也就是说这两个大客户是在BIG400上作三层转发,所以他们的ARP广播是不会影响CISCO7206的。铁通运维工程师向我们反映一下问题:
 
问题一:在用户侧PC执行ping指令到BIG400上的VLAN的IP,出现ping几个包就会出现一个延时比较大的ICMP REPLY的报文。改ping上端CISCO路由器的IP有时也如此。
 
问题二:如图所示,在港湾BIG400上端连接的是CISCO7206路由器。一段时间以来先后两次发现下面的用户上网时出现丢包的情况,此时查看CISCO7206的ARP表发现ARP表满,他们清空ARP表后用户上网出现正常。
 
问题解释:问题的排障及详细分析过程见附录。在排障中我们发现大量的扫描报文在攻击网络,而该网络没有任何防范措施,对整个本地网段的扫描必然使得路由器不断地解析大量不存在地MAC地址,从而占用了router的cpu资源及arp表出现溢出而无法正常解析。
 
问题解决:对该网络进行重新规划,将网络进行层次化的规划并增强网络的安全性,使得网络具有良好的扩展性和抗攻击能力。
 
备注:像恶意攻击、病毒等对网络性能的影响甚至导致网络瘫痪的案例已屡有发生,需要引起我们的高度重视。在做故障处理时注意数据的收集,给局方提供确凿的证据,避免我司产品蒙冤。
 
 
 
网络环境因素 高温
 
问题描述:两台u2叠放在小区楼道的小机柜,作为小区用户的接入。用户反映上网速度慢,有时甚至上不了网。
 
问题解释:查看现场情况,楼道机柜通风不好,而且经常设备叠放在一块,产生的热量散发不出去。出现问题时,用手感觉设备外表温度,发现比较烫手。显然,设备的所在环境温度过高,导致交换机工作异常,出现丢包,用户侧上网速度慢。严重情况下,交换机无法工作。
 
问题解决:一开始做更换设备处理无效。由于目前使用的交换机端口数比较少,将机柜的设备抽减一台。设备运行稳定,故障不再重现。
 
备注网络设备要特别注意其工作温度,一般正常的工作温度为0℃-55℃,该温度指的是机壳内部的温度。如果机壳外表温度达到40℃以上,那么内部的温度就可能太高了,需要采取降温措施。
 
网络环境因素 电源系统
 


 
问题描述:该网络为电信营业点,通过hub接入营业终端,上行链路采用以太口接入到机房的cisco2513路由器上。营业终端在每天晚上7:00点钟左右,出现业务终端,ping网关时断时通。在其他的营业时间则很正常。
 
问题解释:该案例的详细分析见附录。问题的定位通过在HUB上接协议分析仪,出现故障时对网络报文进行捕获并分析。终端ping网关进行测试,发现有时候sniffer不能捕获到终端发出的报文,有时候未能收到路由器的相应。显然HUB出现问题的可能性比较大,更换HUB无效。进一步分析,该故障比较有规律,每天均出现在同一时段(跟时段的相关性较大),因此应该是网络环境的影响大些。查看hub供电,采用稳压电源,考虑到出故障时段刚好是用电高峰,大量电器的开启,使电源存在大量尖峰脉冲,会对逻辑门电路造成影响,最终导致线路信号崎变,而出现丢包。
 
问题解决:将稳压电源更换成具有过滤电源与浪涌吸收的能力UPS,故障不再复现。
 
备注:该案例提示我们要特别留意网络的周边环境,电磁干扰、超高温/低温、不纯净电源均影响到网络的正常运行。
 
网络丢包问题剖析总结
 
从上一章节我们看到,网络丢包的成因确实是复杂多样的,不过,纷繁复杂的事务背后均有一定的规律性,丢包问题也不例外。我们可以从报文本身、承载链路、负责中转的设备等方面去考察,丢包不外乎属于下列几种情况:报文比特位畸变、报文的格式被篡改、链路时通时断、链路拥塞、设备负载过重、报文被转发到不当接口、报文超时。
 
报文比特位畸变的情况往往由于网络周围环境的干扰、设备使用器件品质差等造成,比如电磁、高温、电流浪涌使得传输链路不可靠和设备产生信号不正常。
 
报文格式被篡改只能是设备异常所为,比如在某种条件下,网络设备修改报文的VID或去除VID,那么该报文则不能到达预定目的地。
 
链路时通时断的情况最常见的有链路两端设备的端口自协商不匹配、一端设备PHY芯片寄存器不稳定引起。
链路拥塞、设备负载过重的情况则一般是网络的设计、配置不合理,人为恶意攻击所造成,链路的拥塞也经常伴随着设备过载。
 
报文被转发到不当接口一般的现象是网络不通,在特殊情况下,比如网络存在环路、设备硬件结构原因使得交换机FDB表发生振荡、摆动也引发丢包。
 
报文超时属于“特殊的丢包”,报文并未真正被丢弃,而是报文从信源到信宿所花的时间太多,已失去时效性,不被信宿所认可。
 
应该说丢包问题的处理最难之处在于问题的定位,在我们了解丢包的各种成因之后,丢包问题的定位也有规律可寻。下面将进一步阐述丢包的处理步骤。
Tags:广东网盟  
  •         用户名: 验证码: 验证码,看不清楚请点击刷新验证码 (注“”为必填内容。)


    文章评论: [ 查看全部 ] 网友评论
    关于网盟 | 网站帮助 | 广告合作 | 下载声明 | 友情连接 | 联系方式

    Copyright © 2003-2008 Gdwg.Net. All Rights Reserved .
    中国广东网管联盟设计维护.网站备案:粤ICP备08020875号