一、PPE 的核心原理与医疗场景适配性
-
位置编码的本质需求
在CT、MRI、病理切片这类医疗影像处理中,Transformer模型需要先将图像拆解为若干Patch,再按顺序输入。然而,这里存在一个核心问题——若不注入空间信息,模型便无法区分同一病灶在不同坐标位置上的差异。传统绝对位置编码(如Sinusoidal PE)在处理规则网格时表现尚可,但面对病灶尺寸多变、分辨率参差不齐的医学场景,其效果往往受限。PPE(Patch Position Embedding)的思路更为灵活:通过学习每个Patch的二维坐标嵌入,显式保留局部邻接关系与全局拓扑信息,从而显著提升病灶边界定位精度及跨切面一致性。
