某实验室采购了一批交换机用于部署局域网,为自主研发的PLC、触摸屏等有线终端接入网络开发调试,结果发现存在两处问题。
本期分享的案例涉及有线网络相关故障排查。

1. 问题背景
实验室通过新购的交换机搭建局域网,用于部署自主研发的PLC设备、触摸屏等有线终端的网络连接与调试工作。整体网络拓扑如下:
PC主机—交换网络—PLC、触摸屏等多台终端设备
实际测试过程中遇到以下两个问题:
问题1:PC对部分PLC1、PLC2等设备执行ping测试时丢包严重,但直连对应PLC则通讯正常无丢包。问题2:PC无法ping通部分触摸屏设备,而直接连接该触摸屏时网络连通正常。2. 排查思路
面对这类看似无规律的故障,需要有步骤地进行针对性排查。连基本的ping测试都无法通过时,需要深入了解相关通信原理与数据流转过程,才能进一步准确定位问题根源。
(1)问题1
排查思路:
当出现部分设备通、部分不通的情况时,需重点排查IP地址冲突的可能性;检查物理链路连接状态;确认ARP表项学习是否准确。(2)问题2
排查思路:确认通过交换机PC无法ping通触摸屏时的链路状态与端口工作模式,排除物理链路异常或设备兼容性问题。
3. 排查分析
(1)问题1:排查分析
① 现场测试发现,当PLC1与PLC2两台设备同时接入网络后,对这两台设备执行ping操作丢包严重:

② 将PC直连到该PLC设备则无丢包现象:

③ 进一步查看ARP表项,发现这两台PLC设备对应的MAC地址完全相同:

④ 基本可以确定问题根源:PLC1与PLC2由于烧录网卡MAC地址冲突,导致交换机在转发数据包时出现端口学习混乱,数据包在一个端口与另一个端口之间反复跳转,从而引发严重丢包。
(2)问题2:排查分析
① 现场测试发现部分触摸屏无法ping通,同时检测到未学习到对应触摸屏的MAC地址:

② 与用户沟通后发现,相关触摸屏设备的MAC地址均以F1、F2、F3、F4...开头

③ 进一步测试证实,以F1、F3等开头的触摸屏确实无法连通,而这些MAC地址正好对应组播MAC地址范围,并非正常的主机MAC地址:

④ 为避免影响后续网络通信,指导用户将终端MAC地址修改为标准的主机MAC地址后,设备恢复正常通信。
4. 原理及解决方案
问题1:PC ping PLC1、PLC2等设备丢包严重,直连则正常无丢包。
原因1:PLC1与PLC2由于网卡MAC地址冲突,同时接入网络后会造成数据包转发异常。修改MAC地址确保唯一性即可解决。
问题2:PC无法ping通部分触摸屏,直连该触摸屏则正常连通。
原因2:触摸屏烧录的MAC地址属于组播MAC范围,导致通信异常。建议修改为正常主机MAC地址后即可正常使用。
