人为攻击/广播泛滥


问题描述:如上图所示,交换机端口1:1-1:12、2:1-2:8在同一个VLAN中,网关指向CISCO7206的下行端口FA0/0的IP。另外1:13下接一个大客户,1:14下接一个大客户,他们的网关指向BIG400上本VLAN的IP,也就是说这两个大客户是在BIG400上作三层转发,所以他们的ARP广播是不会影响CISCO7206的。铁通运维工程师向我们反映一下问题:
问题一:在用户侧PC执行ping指令到BIG400上的VLAN的IP,出现ping几个包就会出现一个延时比较大的ICMP REPLY的报文。改ping上端CISCO路由器的IP有时也如此。
问题二:如图所示,在港湾BIG400上端连接的是CISCO7206路由器。一段时间以来先后两次发现下面的用户上网时出现丢包的情况,此时查看CISCO7206的ARP表发现ARP表满,他们清空ARP表后用户上网出现正常。
问题解释:问题的排障及详细分析过程见附录。在排障中我们发现大量的扫描报文在攻击网络,而该网络没有任何防范措施,对整个本地网段的扫描必然使得路由器不断地解析大量不存在地MAC地址,从而占用了router的cpu资源及arp表出现溢出而无法正常解析。
问题解决:对该网络进行重新规划,将网络进行层次化的规划并增强网络的安全性,使得网络具有良好的扩展性和抗攻击能力。
备注:像恶意攻击、病毒等对网络性能的影响甚至导致网络瘫痪的案例已屡有发生,需要引起我们的高度重视。在做故障处理时注意数据的收集,给局方提供确凿的证据,避免我司产品蒙冤。
网络环境因素 高温
问题描述:两台u2叠放在小区楼道的小机柜,作为小区用户的接入。用户反映上网速度慢,有时甚至上不了网。
问题解释:查看现场情况,楼道机柜通风不好,而且经常设备叠放在一块,产生的热量散发不出去。出现问题时,用手感觉设备外表温度,发现比较烫手。显然,设备的所在环境温度过高,导致交换机工作异常,出现丢包,用户侧上网速度慢。严重情况下,交换机无法工作。
问题解决:一开始做更换设备处理无效。由于目前使用的交换机端口数比较少,将机柜的设备抽减一台。设备运行稳定,故障不再重现。
备注:网络设备要特别注意其工作温度,一般正常的工作温度为0℃-55℃,该温度指的是机壳内部的温度。如果机壳外表温度达到40℃以上,那么内部的温度就可能太高了,需要采取降温措施。
网络环境因素 电源系统


问题描述:该网络为电信营业点,通过hub接入营业终端,上行链路采用以太口接入到机房的cisco2513路由器上。营业终端在每天晚上7:00点钟左右,出现业务终端,ping网关时断时通。在其他的营业时间则很正常。
问题解释:该案例的详细分析见附录。问题的定位通过在HUB上接协议分析仪,出现故障时对网络报文进行捕获并分析。终端ping网关进行测试,发现有时候sniffer不能捕获到终端发出的报文,有时候未能收到路由器的相应。显然HUB出现问题的可能性比较大,更换HUB无效。进一步分析,该故障比较有规律,每天均出现在同一时段(跟时段的相关性较大),因此应该是网络环境的影响大些。查看hub供电,采用稳压电源,考虑到出故障时段刚好是用电高峰,大量电器的开启,使电源存在大量尖峰脉冲,会对逻辑门电路造成影响,最终导致线路信号崎变,而出现丢包。
问题解决:将稳压电源更换成具有过滤电源与浪涌吸收的能力UPS,故障不再复现。
备注:该案例提示我们要特别留意网络的周边环境,电磁干扰、超高温/低温、不纯净电源均影响到网络的正常运行。
