首页 > 最新动态 > 时空信息学报丨“时空智能遥感”专题——北京建筑大学刘飞等：基于GWVE-YOLO的北京砖石长城植被侵蚀检测模型

最新动态

时空信息学报丨“时空智能遥感”专题——北京建筑大学刘飞等：基于GWVE-YOLO的北京砖石长城植被侵蚀检测模型

2026-04-3042

《时空信息学报》是由自然资源部主管，国家基础地理信息中心、中国地理信息产业协会、黑龙江测绘地理信息局共同主办的中文学术期刊，双月刊。为分享最新研究成果，搭建学术交流平台，中国地理信息产业协会公众号开设“时空信息学报”专栏，独家刊载《时空信息学报》论文，供广大读者研阅。欢迎产学研用各界关注、分享！

“时空智能遥感”专题编委会：

张继贤国家基础地理信息中心、莫干山地信实验室

闫利武汉大学

顾海燕中国测绘科学研究院

专题其他文章：

1.地表异常遥感监测与预警研究进展

2.基于多模态特征自适应融合与空间关系图网络表达的城市土地利用精细分类方法

基于GWVE-YOLO 的北京砖石长城植被侵蚀检测模型

刘飞¹，赵雨²，张泽宇^3,4，王志通¹，顾海燕⁵，

汤羽扬⁶，张燕林⁶，吉楠⁷

1. 北京建筑大学测绘与城市空间信息学院，北京 102616；
2. 北京建筑大学理学院，北京 102616；
3. 香港理工大学建设与环境学院，香港 999077；
4. 深圳大学建筑与城市规划学院，深圳 518060；
5. 中国测绘科学研究院，北京 100036；
6. 北京建筑大学北京长城文化研究院，北京 100044；
7. 北京华为数字技术有限公司，北京 100089

摘要：植被侵蚀是导致长城结构坍塌的重要潜在因素，相关检测研究主要包括人工巡检与自动化模型。前者现场勘查效率低下；后者受限于小目标漏检与计算冗余，难以实现精准高效的监测。因此，提出一种基于YOLOv11网络架构改进的长城植被侵蚀智能检测算法GWVE-YOLO（the Great Wall vegetation erosion，you only look once）。通过新增P2尺度小目标检测层，增强高分辨率浅层特征提取能力，显著降低微小病害目标的漏检率；在主干与颈部浅层引入RCS-OSA（reparameterized convolution based on channel shuffle of one-shot aggregation）模块，通过通道重排与结构重参数化技术优化特征融合效率，在维持精度的同时降低计算冗余；采用动态非单调聚焦机制的W-IoU（wise intersection over union）v3损失函数，自适应调整低质量样本梯度权重，以提升复杂背景下小目标定位精度。在自建无人机长城病害数据集，经实验表明，所提方法的mAP50达到78.8%、精确率达到79.8%，每秒帧数114，综合性能优于YOLO系列及其已有改进等主流检测模型。

关键词：长城保护；植被侵蚀；YOLOv11；目标检测；RCS-OSA；W-IoU v3

引用格式：刘飞, 赵雨, 张泽宇, 王志通, 顾海燕, 汤羽扬, 张燕林, 吉楠. 2026. 基于GWVE-YOLO的北京砖石长城植被侵蚀检测模型. 时空信息学报, 33(1): 68-77
Liu F, Zhao Y, Zhang Z Y, Wang Z T, Gu H Y, Tang Y Y, Zhang Y L, Ji N. 2026. A vegetation erosion detection model for Beijing’s masonry Great Wall based on GWVE-YOLO. Journal of Spatio-temporal Information, 33(1): 68-77, doi: 10.20117/j.jsti.202601007

1 引言

万里长城是我国首批入选的“世界文化遗产”，是人类历史上的建筑奇迹和历史文化景观，保护长城及其所承载的历史文化价值具有重要意义（张智等，2024；朱小凡等，2024）。北京市域内分布的500多千米明代砖石长城历经数百年自然营力作用，多数存在结构性劣化。实地调查表明，北京及周边地区长城墙体大面积出现开裂与局部垮塌，年久失修的砌体结构因内部应力变化导致坍塌风险持续累积。长城多建于山脊等险峻地形，所遭受的风力、水文、冻融循环等自然营力远比城市环境中的墙体更为剧烈和复杂，使得其病害特征更具挑战性，保护工作的难度远非普通砖石墙体可比。其中，植被侵蚀是导致北京境内长城结构坍塌的风险之一，攀附墙体的木本植物通过生物–水文耦合侵蚀机制引发连锁破坏（程美景等，2022；蓝婧雯和潘剑彬，2024）；根系沿砖缝延伸形成导水通道，显著加剧冻融循环对砌体的破坏效应；同时根系扩张所产生的机械应力诱发砌体位移，监测证实该过程可大幅削弱墙体结构稳定性（潘剑彬等，2024）。因此，及时实施保护性干预可有效延缓植被侵蚀对长城本体造成的结构性损伤进程，降低遗产失稳风险。

随着无人机变化检测技术在文化遗产监测领域的快速发展，基于无人机遥感影像与深度学习方法的历史建筑植被侵蚀精细监测研究水平显著提升，逐步实现了从传统人工巡检向智能化分析的根本性转变（易波，2022；王涛等，2022）。一方面，如传统植被侵蚀检测方法多依赖效率低下的人工巡检（Mesa等，2023；Mishra 和 Louren?o，2024）。在文化遗产监测领域，航空遥感技术已广泛应用于监测植被生长动态及其对历史建筑所造成的侵蚀影响（Saravanan 和Bhaskar，2024）；但其对形态多样、离散分布的侵蚀植被仍存在小目标漏检率高与计算冗余大的双重局限。另一方面，基于深度学习的目标检测算法通过端到端的网络训练，实现了从影像到目标位置和类别的直接回归，其中，以YOLO（you look only once）系列为代表的目标检测算法，实时性和工程适配性已在植被侵蚀病害识别等研究中得以广泛应用（Lawrence 和 de Lemmus，2024；郑文轩和杨瑛，2024；白凯等，2025；陈金荣等，2025）。然而，长城植被侵蚀检测对模型可靠性与精确性的要求远高于一般场景。

此外，部分研究还通过引入动态上采样（刘世夫等，2025）、融合方向滤波器（Rong等，2025）、构建轻量化模型（孙基源等，2025）、结合异构卷积与注意力机制（彭哲轩等，2025）、优化特征权重（赫英策等，2024）等方式对YOLO系列模型进行了不同程度的改进。如Wu等（2024）通过在YOLOv8主网络框架中增加了一个额外的小目标检测层，并将RCS-OSA（reparameterized convolution based on channel shuffle of one-shot aggregation）模块集成至主干和颈部浅层，显著提高了基线模型的检测精度和推理速度；Gong等（2025）通过在YOLOv11网络中引入W-IoU（wise intersection over union）损失函数，提升了对低质量样本的检测性能。总之，上述研究的优化方向主要集中于小目标和网络架构的轻量化，如小目标检测增强、网络轻量化设计及损失函数优化等，并取得了良好效果。这在一定程度上可为长城文化遗产保护领域的相关研究提供技术参考。然而，其主要围绕电力巡检、农业检测等场景，针对长城这类砖石纹理复杂、微小植被目标高度混杂的文化遗产场景，仍有待研究。

因此，以长城植被侵蚀病害检测为研究对象，以YOLOv11网络为基线，提出一种植被侵蚀检测模型GWVE-YOLO（the Great Wall vegetation erosion，you only look once），以应对植被、苔藓与砖石纹理混杂所构成的复杂背景，从而提升对边界模糊目标的定位精度与稳健性。利用高分辨率小目标检测层增强浅层特征捕获能力，以解决微尺度目标漏检问题和小目标特征捕捉能力不足的问题；设计融合通道重排与结构重参数化RCS-OSA模块（Kang等，2023），压缩特征融合路径计算开销；引入动态非单调聚焦机制的W-IoU v3损失函数，以提升模型对边界模糊病害的定位精度。

2 研究方法

GWVE-YOLO模型网络架构如图1所示。以YOLOv11网络为基线模型，新增小目标检测层，利用更高分辨率的浅层特征提升对小病害目标的检测能力；为同步优化特征融合效率并降低计算冗余，在主干与颈部浅层引入基于通道重排与结构重参数化RCS-OSA模块（Kang等，2023），在保持精度的同时显著提升模型推理速度；为优化低质量标注样本的权重分配并进一步提升小目标精度，采用W-IoU v3损失函数自适应调整困难样本的梯度贡献。

2.1 小目标检测层

针对长城植被侵蚀病害检测中存在的微小病害目标，如早期侵蚀点、细小根系等易漏检的问题，将基线模型中的P3、P4、P5三尺度架构，通过新增P2尺度检测层，改进为P2、P3、P4、P5四尺度检测架构。对于640个像素×640个像素的输入影像，模型额外输出一个高分辨率的160个像素×160个像素特征图。

P2层的构建过程为，对颈部网络中80个像素× 80个像素的特征图，进行两倍最近邻上采样；进一步地，将其与主干网络经两次卷积所提取的富含空间细节的浅层特征图，进行拼接融合。这专用于捕捉微小病害目标，并经后续RCS-OSA模块处理后，形成新增的浅层检测头。该检测头采用通过k-means++算法在长城植被侵蚀病害数据集上重新计算得到的锚框尺寸，其尺度为所有检测层中最小，以更好匹配微小病害目标。

2.2 重新参数化卷积模块

针对无人机巡检长城植被侵蚀病害时面临的实时性挑战，上述P2尺度检测层虽可提升小目标识别能力，却显著增加模型复杂度，制约在大尺度场景的实时检测效率。因此，在主干及颈部浅层引入RCS-OSA模块（Kang等，2023），替代C3K2。通过结构化通道操作优化计算，对输入张量沿通道维度均分为双路。一路经多分支卷积处理，如训练阶段包括1×1卷积、3×3卷积及恒等分支的并行结构；另一路保留原始特征。双路特征经拼接与通道重排后输出。其特点在于动态结构转换：训练时，多分支结构充分学习长城病害的弱纹理特征；推理时，通过结构重参数化技术将多分支融合为单一3×3卷积层。

在RCS-OSA模块中，输入特征一部分通过直接传播，另一部分则通过RCS（reparameterized convolution based on channel shuffle）模块的重复堆叠以增强特征的复用，两部分最终通过级联得到输出，如图2所示。OSA（one-shot aggregation）模块的一次聚合策略通过使用多个感受野表示多样化的特征，并只在最后一次性聚合前面所有的特征，显著提升模型的特征提取能力并减轻网络计算负担。因此，训练阶段，多分支设计增强了特征提取能力，恒等分支则有助于稳定训练；推理阶段，通过将多分支融合为单分支，在保持精度的同时显著提升推理速度。

2.3 损失函数

边界框损失函数是目标检测模型的关键损失组件，其更精确定义有助于显著提升检测性能（He等，2019）。然而，低质量样本的边界框回归进行过度优化会影响模型的整体检测性能。具体而言，涉及边界框纵横比的计算会对低质量样本施加过强的惩罚效应，从而削弱模型的泛化能力。

记锚框、边界框、交并比（intersection over union，IoU）用于衡量锚框与真实边界框的重叠程度，如图3所示，边界框回归损失函数为

式中，分别为重叠区域的宽、高。其中，并集区域：

W-IoU v3通过引入动态焦点系数动态调节边界框回归的梯度增益，引导模型更加聚焦于锚定中等质量的边界框，有效提升了模型的定位精度，并优化了针对小目标检测的权重分配策略（Tong等，2023）。因此，在基线模型中采用基于动态非单调聚焦机制的W-IoU v3损失函数，作为IoU损失的有效替代方案。采用经过验证的最佳配置，以期在特定任务中获得同样优异的性能。有

式中，为梯度增益；分别为用于调整的超参数，；为离群值；为单调聚焦系数；为具有动量参数m的指数移动平均值。在训练过程中，当批量大小为n且模型性能提升速度在第个周期显著放缓时，有

3 实验与结果分析

实验环境Windows操作系统，配备NVIDIA A100-SXM-80GB GPU，并利用CUDA 11.7实现GPU加速。编程环境基于Python 3.10.18，深度学习框架选用PyTorch 2.0.1。经过多次调整，实验超参数中epoch设置200，以保证模型训练收敛。优化过程采用随机梯度下降，批量大小设置32。学习率通过余弦衰减函数进行动态调整，起始学习率为0.01。此外，还配置0.0005的权重衰减系数。

3.1 实验数据与评价指标

1）实验数据

实验自制长城植被侵蚀无人机数据集，如图4所示。对北京境内长城开展实地航拍，完成数据采集与专业标注。数据集经人工筛选及分类，分辨率512个像素×512个像素的图像，共包括1264幅；使用Labelimg对所有图像进行标注后共生成3462个标签，按照8︰2随机分配至训练集和验证集。

开展两组实验。一组，与当前主流目标检测算法进行比较分析，以验证方法性能表现；另一组，采用消融实验，系统分析各模块的有效性及其贡献度。所有实验训练过程均在相同的参数配置下进行，以确保结果的公正性和可比性。

2）评价指标

在目标检测领域，评价指标的核心作用在于量化评估算法的性能。采用精确率（precision，Pr）、召回率（recall，Re）、平均精度均值（mean average precision，mAP）、模型参数量（Params）、计算复杂度（GFLOPs），以及每秒帧数（frames per second，FPS）作为评估算法性能的关键指标。

精确率定义为TP占所有被模型预测为阳性样本的比例，直接衡量模型区分负样本的能力。召回率定义为被模型正确检测出的正样本数量占所有真实存在的正样本数量的比例，衡量模型识别所有正样本的能力。mAP是所有类别平均精度（average precision，AP）的平均值，综合考量模型在所有类别上的精确率和召回率表现，是评估模型在整个数据集上综合检测性能的核心指标。有

式中，TP为被算法正确识别出的标注目标数量；FP为被算法错误识别为目标的标注样本数量；FN为实际存在但未被算法识别到的标注目标数量；为总类别数目。

3.2 结果分析

为系统验证GWVE-YOLO模型在长城植被侵蚀检测任务中的综合性能，选取YOLOv8、YOLOv10n、YOLOv10m、YOLOv11、RCS-YOLO（Kang等，2023），以及RDA-YOLO（Guo等，2024）六种目标检测算法。通过综合比较其在Pr、Re、mAP三类指标的表现，全面评估模型的可靠性与先进性。

不同目标检测模型实验结果如表1所示。与YOLO系列其他版本模型相比，GWVE-YOLO在检测能力上优势突出，其79.8%的精确率显著高于YOLOv8的，也优于YOLOv10m的75.7%和YOLOv10n的74%，较基线模型的76.4%提升了3.4%；此外，还优于RCS-YOLO的77.8%和RDA-YOLO的77.6%。与此同时，其mAP50值达到78.8%，同样领先于YOLOv8的73.8%、YOLOv10m的72.6% 和YOLOv10n的73.6%，并比基线模型的略有提升；且优于RCS-YOLO的76.6%、RDA-YOLO的72.2%。模型复杂度分析显示，基线模型的结果中Params 值2.4 MB和61亿次的GFLOPs为最低，而本文所提模型GWVE-YOLO的分别为4.2 MB、145 亿次，且其FPS值最高。这说明上文所述模块设计实现了高效的推理流程，因此在可接受的复杂度增幅下实现了精度的有效提升，从而充分证实了GWVE-YOLO模型的优越性能。

此外，为直观比较不同模型在长城病害数据集的检测性能，选取不同病害区域共八组航拍影像进行可视化对比。如图5所示，GWVE-YOLO模型有效降低了漏检率，性能得以显著提升。

在图5（a）（c）中，YOLOv10n对微小植被侵蚀目标存在明显的漏检，存在对过小尺寸的物体特征无法准确提取的问题；（d）（h）中，YOLOv8和基线模型的检测结果较低且边界框欠准，提取效果明显不如GWVE-YOLO模型。究其原因，得益于RCS-OSA模块的效率优化和整体网络设计，通过强化浅层特征表达显著提升微小侵蚀目标的检出率，能够高效处理长城连续图像，满足自动化巡检的实时性要求。图5（b）（e）中，在微小目标和光线不足的复杂区间，相较于本文方法，YOLO系列表现为多误检或精确率不稳定。这是因为GWVE- YOLO通过新增的高分辨率P2层保留浅层细节，RCS-OSA模块提升浅层特征判别并增强对弱纹理信号的稳健性，误检明显减少，且在暗区和纹理噪声处表现稳健。图5（f）（g）中，针对细长条带状侵蚀，GWVE-YOLO使得目标连贯性和定位精度获得提升。这说明借助W-IoU v3可提升边界回归精度，并保持面向工程应用的实时推理性能。整体来看，GWVE-YOLO的预测框与目标贴合更为紧密，反映了动态非单调聚焦机制的W-IoU v3损失函数通过合理分配梯度权重，有效提升了模型精度，尤其是对低质量样本的定位精度。因此，得益于对高分辨率浅层特征与深层语义信息的高效融合，模型能够增强对微小病害的鉴别能力。

3.3 消融实验

为量化分析所引入的各项改进，即小目标检测层、RCS-OSA 模块、W-IoU v3损失函数，对模型性能的影响，设计消融实验。由表2可知，消融实验结果揭示了新增小目标检测层和RCS-OSA模块对基线模型的性能提升作用。

根据表1～2可知，当仅添加P2小目标检测层时，模型的精确率、mAP50值分别提升了0.3%、0.4%。当RCS-OSA模块被整合进主干及颈部浅层后，提升效果显著，模型召回率、mAP50、精确率值分别提升了0.1%、0.4%、0.6%，且FPS值达到最高，表明RCS-OSA模块具备有力提升模型检测效率的作用。此外，采用W-IoU v3损失函数还带来了0.9%的召回率提升。而分别融合P2+RCS-OSA、P2+W-IoU v3、RCS-OSA+WIoU v3三种模块不同的组合，各项指标结果均优于基线模型。鉴于长城植被侵蚀检测任务对精确率的更高要求，融合了上述三种模块改进的本文方法，充分验证了各模块的独立增益价值，具备平衡各项指标的相对较优的能力，因此，综合性能表现最优。

4 结论

针对北京境内长城植被侵蚀病害智能化巡检中微小目标漏检、模型效率不足及锚框定位精度有限等关键问题，本文在YOLOv11基础上构建了针对长城植被侵蚀的GWVE-YOLO模型。首先为克服基线模型对微小尺度目标检测能力不足的问题，在YOLOv11网络架构新增P2尺度小目标检测层；其次为降低模型参数量冗余并提升推理速度，采用一次聚合策略的RCS-OSA模块，替换主干网络和颈部浅层原有的C3K2卷积块；最后为提升目标定位精度及降低惩罚效应，引入基于动态非单调聚焦机制的W-IoU v3损失函数。在长城植被侵蚀数据集，经与主流方法的对比实验的结果表明：①新增的 P2小目标检测层显著增强了浅层高分辨率特征的保留，降低了微小侵蚀目标的漏检率；②RCS-OSA模块通过通道重排与结构重参数化提升了浅层特征的判别性与融合效率，减少计算冗余且增强了对复杂背景的区分能力；③引入的W-IoU v3损失函数优化了低质量样本的梯度分配，改善了微小目标的边界回归精度。所提出的模型保持了工程可用的实时推理能力，验证了方法在实际巡检场景中的有效性。本研究通过系统性重构检测架构特征处理流程，可为长城保护工程提供精准决策支持，亦可为大型文化遗产的自动化植被侵蚀巡检提供高精度、高效率的解决方案。

受限于长城严格的文物保护政策与实地数据采集的安全规范，使得构建高质量公共数据集面临巨大挑战。未来，在获得相关文物保护单位的必要授权后，将通过扩大数据采集规模，以进一步验证和提升方法在更广泛场景下的稳健性与泛化能力。此外，针对长城植被侵蚀检测中的难点，隧道裂缝等工业检测方法提供了直接参考。未来工作将融合这些跨领域策略，以提升特征感知与定位精度，实现检测性能的突破。

↓↓ 了解更多产业要闻↓↓

请将我设为星标★