在某网络环境中,DeviceA与DeviceB两台某W设备通过100GE接口直连,建立了OSPF邻居关系。近期网络中出现OSPF邻居频繁震荡的情况,导致路由反复收敛,业务流量转发受到严重影响。
本期分享的案例聚焦于弱电安防相关的网络问题。
背景介绍
在某网络架构下,DeviceA与DeviceB两台某W设备通过100GE端口直接互联,并成功建立了OSPF邻居关系。近期由于OSPF邻居状态频繁波动,引发路由信息不断收敛,直接影响了核心业务的正常通信。
组网结构示意如下:

基础检查发现:
网络中存在与业务故障时段高度吻合的OSPF邻居状态变化记录,且未发现其他相关告警信息处理思路
针对OSPF邻居震荡问题,通常需要从链路状态、协议配置、设备硬件三个维度进行排查,具体处理思路如下:
检查设备日志中OSPF邻居状态变化记录及原因分析排查物理链路的UP/DOWN情况检测光模块、光纤等硬件是否存在异常排查分析
第一步:查看DeviceA的OSPF日志
执行display logbuffer命令后,发现故障时间段存在大量OSPF邻居DOWN的记录:

所有记录均显示邻居DOWN的原因为收到单向Hello报文。
第二步:同步核查DeviceB的日志
在相同时间点,DeviceB同样存在OSPF邻居DOWN的记录:

其中明确提到主要原因为“物理接口状态变化”。
第三步:验证物理接口状态
进一步查看DeviceB的物理接口日志,发现存在频繁的UP/DOWN记录:

由此确认,接口状态的不稳定直接导致了OSPF邻居的反复震荡:接口DOWN时邻居关系中断,接口UP后重新协商建立,进而引发对端设备的邻居状态也随之变化。
原理及解决方案
故障根源:光纤或光模块异常导致链路频繁UP/DOWN,致使OSPF邻居状态反复变化。当接口DOWN时,OSPF邻居关系随即中断;接口恢复UP后,设备重新发送Hello报文进行协商,对端收到报文后会重置邻居状态,从而形成震荡循环。
解决方案:更换异常的光纤或光模块,恢复链路稳定性。
