首页 > 最新动态 > 时空信息学报丨基于频率感知特征融合的YOLOv8道路裂缝检测方法

最新动态

时空信息学报丨基于频率感知特征融合的YOLOv8道路裂缝检测方法

2026-03-1762

《时空信息学报》是由自然资源部主管，国家基础地理信息中心、中国地理信息产业协会、黑龙江测绘地理信息局共同主办的中文学术期刊，双月刊。为分享最新研究成果，搭建学术交流平台，中国地理信息产业协会公众号开设“时空信息学报”专栏，独家刊载《时空信息学报》论文，供广大读者研阅。欢迎产学研用各界关注、分享！

基于频率感知特征融合的YOLOv8道路裂缝检测方法

刘党党¹，薛君君¹，赵向凯¹，林云浩²，

刘畅³，孙超²，江昊²，许志华²

1. 陕西德源府谷能源有限公司三道沟煤矿，榆林 719000；
2. 中国矿业大学（北京）地球科学与测绘工程学院，北京100083；
3. 中国矿业大学（北京）力学与土木工程学院，北京100083

摘要：道路裂缝是基础设施中的典型病害，及时准确地检测道路裂缝对于保障交通安全运维具有重要意义。尽管现有YOLO模型在检测精度与特征提取方面取得了一定进展，但在多尺度特征融合与边缘细节保持方面仍存在不足之处，尤其当面对形态不规则、边界模糊、尺度差异显著的裂缝目标时，仍易出现漏检或误检，影响了模型在道路裂缝智能检测中的进一步推广与应用。本文提出一种基于频率感知特征融合（frequency-aware feature fusion，FreqFusion）的YOLOv8轻量化改进模型，具体地，以稳定且轻量化的YOLOv8n为基线，采用FreqFusion模块，改进其自上而下的多尺度特征融合模块，以增强高低层语义信息间的协同表达能力；并在公开数据集RDD2022进行验证。结果表明，在不增加模型复杂度的前提下，mAP50、mAP50-95结果分别提升了1.4%、1.3%；在纵向裂缝、坑洞等细粒度裂缝中的检测精度，显著优于已有YOLO、R-CNN等常用模型。研究成果兼具精度与效率优势，可为道路裂缝智能检测提供高效、实用的技术参考。

关键词：无人机影像；道路裂缝；特征融合；目标检测；YOLOv8

引用格式：刘党党, 薛君君, 赵向凯, 林云浩, 刘畅, 孙超, 江昊, 许志华. 2025. 基于频率感知特征融合的YOLOv8道路裂缝检测方法. 时空信息学报, 32(6): 675-684
Liu D D, Xue J J, Zhao X K, Lin Y H, Liu C, Sun C, Jiang H, Xu Z H. 2025. YOLOv8-based road crack detection with frequency-aware feature fusion. Journal of Spatio-temporal Information, 32(6): 675-684, doi: 10.20117/j.jsti.202506014

1 引言

道路是交通运输体系的重要组成部分，在城市规划和应急响应等领域具有重要的应用价值（徐子阳等，2025）。受交通荷载、材料老化、环境变化等因素影响，道路裂缝病害频繁出现，严重影响运输安全。及时准确地检测道路裂缝的时空分布，对提升道路养护效率具有重要意义。传统人工巡检方式效率低、危险性大（李朝勇等，2023）。近年来，随着车载移动测绘平台、无人机遥感系统的快速发展，所获取待识别目标的高分辨率影像集，为城市道路病害的自动识别提供了可靠支撑（Nappo等，2019；Arya等，2022；刘世夫等，2025；朱小凡等，2024）。

常用的道路裂缝智能识别方法主要分为两类，即基于像素级的图像分割方法和目标检测方法。前者具有较高的裂缝空间定位精度，关注裂缝的轮廓提取，典型的算法有全卷积网络（fully convolutional network，FCN）（Zhang等，2019）、U-Net（李朝勇等，2023）、DeepLab（陈宇平和范高，2023）及其衍生模型。后者主要输出裂缝区域的定位框，在效率和模型部署方面具有更大优势，成为近年来的研究热点，常用的方法有区域卷积神经网络（region- based convolutional neural networks，R-CNN）、Faster R-CNN（肖创柏等，2021）、DETR（detection Transformer；李思宏等，2024）、YOLO（you only look once）（赫英策等，2024）模型等，其中，YOLO系列模型因其端到端的结构、较高的检测效率和良好的可部署性，已逐步成为道路裂缝检测中的主流技术手段。目前，国内外已有许多研究将YOLO模型应用于道路裂缝检测任务，取得了良好的检测性能。例如，Manjusha和Sunitha（2025）在道路裂缝数据集上对多种YOLO模型进行了对比分析，验证了该系列模型在道路病害检测中的实时性与智能化优势；Sami等（2023）通过融合通道注意力、标签平滑、k均值聚类（k-means）及焦点损失等策略改进YOLOv5，实现了路面病害的高效、低成本实时检测；Hu等（2024）针对小型裂缝特征模糊的问题，在改进YOLOv5的基础上提出了轻量化实时检测算法，有效提升了沥青路面裂缝的检测效率与准确性；Ye等（2023）针对不同尺度裂缝识别精度不足的现象，通过在YOLOv7网络中引入自注意力机制以增强特征表达能力，从而改善了复杂背景下的裂缝检测效果；付景泽和吕伏（2024）针对路面缺陷检测算法在精度与效率之间难以均衡的问题，基于YOLOv8n设计了双分支多尺度特征融合结构。上述研究表明，YOLO系列模型在复杂道路场景中具备较强的特征学习能力和工程实用性，且在检测精度与特征提取方面均取得了一定进展。然而，YOLO结构在多尺度特征融合与边缘细节保持方面仍存在不足之处，如当面对形态不规则、边界模糊、尺度差异显著的裂缝目标时，仍易出现漏检或误检，通常会导致在结构连续性与边缘清晰度上存在不足。这在一定程度上限制了YOLO模型在道路裂缝智能检测中的进一步推广与应用。

近年来，特征融合作为提升深度网络跨层级信息表达的关键技术，主要围绕内核动态化与采样自适应两条路径发展。在内核动态化方面，研究从固定核插值转向数据驱动的可学习上采样机制。早期方法，如反卷积（Zeiler和Fergus，2014）、像素洗牌（Shi等，2016）的核参数固定，缺乏输入自适应能力。因此，Wang等（2022）提出了CARAFE（content-aware reassembly of features），首次引入上下文感知的动态核预测，根据局部语义生成空间可变上采样核。在采样自适应方面，侧重于空间几何对齐，通过学习偏移量调整采样坐标。如Dai等（2017）利用可变形卷积通过偏移生成器自适应调整了感受野；SFNet（Li等，2024）、FaPN（Huang等，2022）采用渐进式特征对齐策略，以解决多尺度融合中的类别不一致问题。然而，上述方法未充分顾及频率维度差异，导致易过度依赖低频而丢失高频细节，从而使得边界模糊和类别内的不一致。因此，Chen等（2023）提出了自适应低通滤波器（adaptive low-pass filter，ALPF），结合频域注意力，抑制噪声高频并增强全局上下文；Magid等（2021）指出了边界模糊源于高频缺失，并借助自适应高通滤波器（adaptive high-pass filter，AHPF）来锐化边界。进一步地，Chen等（2024）提出了频率感知特征融合（frequency-aware feature fusion，FreqFusion）模块，通过融合CARAFE上采样、偏移生成器，以及ALPF、AHPF，实现了频率感知的特征融合，取得了良好的效果。

因此，本文提出一种基于FreqFusion的YOLOv8轻量化改进模型。以稳定且轻量化的YOLOv8n为基线，对其自上而下的多尺度特征融合模块，采用FreqFusion模块（Chen等，2024），进行改进，以增强高低层语义信息之间的协同表达能力。此外，还在公开数据集RDD2022进行验证。

2 基于频率感知特征融合的YOLOv8

以YOLOv8n为基线，在特征融合阶段，通过引入FreqFusion模块（Chen等，2024），以提升多尺度裂缝特征的协同表达能力。

2.1 改进的模型构建

基于FreqFusion的YOLOv8轻量化改进模型整体架构如图1所示。YOLOv8在颈部结构部分采用自上而下与自下而上的双路径特征融合结构，其中，自上而下路径通过Concat特征拼接模块与C2f模块组合整合多尺度特征（Terven等，2023）。但长细目标、密集裂缝等场景，易使其出现类别内特征不一致、边界模糊等问题，结构感知能力不足，从而细粒度特征保留效果有限。因此，本文在保持检测分辨率与主干结构不变的前提下，利用FreqFusion模块（Chen等，2024），替换自上而下路径中的Concat模块，分别融合维度对齐的高–中层、中–低层特征，见图1中的第10~15层，以提升特征一致性与边界清晰度。

自下而上的路径结构仍保留Concat模块与C2f模块的组合以增强特征再利用；检测头仍采用基线模型的三层多尺度预测，对低、中、高层特征图分别检测目标。这在保持原有模型结构轻量、高效的基础上，可有效改善颈部结构在复杂裂缝检测中的细节保持与结构感知性能，提升对小尺度、低对比度及复杂背景下裂缝目标的检测精度。

2.2 频率感知特征融合模块

为克服传统特征融合中类别内特征不一致和边界模糊的问题，引入FreqFusion模块（Chen等，2024），在上采样过程中增强特征一致性与边界清晰度，从而提升道路裂缝等细粒度纹理目标的检测能力。该模块输入一组通道数相同、空间分辨率不同的特征图，通过ALPF、偏移生成器、AHPF三个核心组件实现高低频互补，原理示意图如图2所示。

1）自适应低通滤波器

针对高层特征引入ALPF（Chen等，2023），以缓解上采样过程中的类别内不一致现象。其原理为，先通过3×3卷积和Softmax生成结构引导权重，随后输入CARAFE框架（Wang等，2022），利用该权重对输入特征局部邻域进行加权重组和上采样，实现语义一致性引导的特征重构（图3（a））。

2）偏移生成器

ALPF在平滑特征、增强类别内一致性方面表现良好（Chen等，2023）。但在处理大范围类别不一致区域、细长目标及复杂边界时仍存在局限。其中，较大的滤波核有助于统一大尺度特征，却易导致边缘细节丢失；较小的滤波核虽能保留边界与细结构，却难以有效解决大尺度特征不一致问题。因此，引入偏移生成器（Dai等，2017），以进一步提升融合特征的结构一致性与边界清晰度。该模块首先计算每个像素与其邻域像素间的局部余弦相似性，并以此作为采样方向的引导依据，促使特征向类别内相似度更高的区域聚合，实现局部范围的特征重定位与细化（图3（b））。

3）自适应高通滤波器

尽管上述方法能够有效提升高层特征的语义一致性和边界清晰度，但深层特征在多次下采样过程中不可避免地丢失了原始分辨率下的高频细节。因此，引入AHPF（Magid等，2021），用于在融合阶段对边缘区域进行高频补偿与细节恢复。该模块以初步融合后的特征图为输入，通过3×3卷积和Softmax生成空间可变的高通滤波核，随后利用滤波器反转机制，即以单位卷积核减Softmax输出的低通核，实现高通特征的提取（图3（c））。最终，将高通引导掩码作用于原始高层特征，以实现残差信息提取与边缘强化，有效补偿下采样过程中丢失的细节纹理。

三个核心组件协同作用，使FreqFusion（Chen等，2024），在多尺度特征融合中同时具备语义一致性保持、大范围结构感知和细节边缘增强的能力。这为改进后的YOLOv8在高噪声背景下的小目标裂缝检测提供了更强的特征表达力与稳健性。

3 实验与结果分析

采用深度学习框架PyTorch进行实验，实验环境为Intel（R） CoreTM i9-14900K、NVIDIA GeForce RTX 4080。训练轮次设为1000，若连续100轮评价指标未提升则提前停止训练；批量大小为4，初始学习率设为0.01，优化器采用带动量的随机梯度下降（stochastic gradient descent，SGD），动量系数为0.937。其中，R-CNN系列模型的训练轮次统一设置为96，其余超参数与YOLO系列保持一致，以保证在模型规模、训练流程及评估标准上的可比性，从而公平地评估本文方法在检测精度与推理效率方面的综合表现。

3.1 数据集构建

公开数据集道路损伤检测2022（road damage detection 2022，RDD2022），涵盖了来自中国、日本、捷克、挪威、美国和印度共六个国家的城市道路图像，包括纵向裂缝、横向裂缝、龟裂和坑洞四种常见的病害类型（Arya等，2021）。实验利用公开数据集RDD2022，构建RDD2022中国子集（RDD2022_ China）作为主要数据集，并与常用主流模型进行比较与分析各模块的贡献作用，来验证方法的有效性。

对RDD2022_China数据集，经过数据清洗与筛选后，共得到3853幅图像，均采集自车载摄像系统与无人机拍摄设备，具有视角多样、场景丰富、目标尺度差异大等特点，能够较好地模拟真实道路巡检场景中的复杂条件，对模型的稳健性评估具有代表性。以7︰2︰1将图像随机分为训练集、验证集与测试集，确保数据分布均衡、标注规范。RDD2022_China数据集道路裂缝样本示例如图4所示，其中，不同拍摄条件下样本中包含至少一种病害类型：（a）展示了无人机拍摄的坑洞类型的病害，（b）展示了纵向和横向交错分布的两种类型的裂缝；（c）主要展示车载拍摄条件下的龟裂类型的病害，（d）中分布多种类型的病害目标。

3.2 评价指标

选用精确率（precison，Pr）、召回率（recall，Re）、浮点数、模型参数量Params、mAP50及mAP50-95等度量指标，来评估模型性能。其中，浮点数和Params用于衡量模型的复杂度，其他指标则用于评价模型对地裂缝的检测性能。具体地，平均精度（average precision，AP）是通过计算精确率和召回率曲线的内插曲线下面积来确定的，该内插曲线在不同的召回率下对精度进行内插。mAP50表示交并比（intersection over union，IoU）阈值为0.5时的平均精度均值（mean average precision，mAP），而mAP50-95则表示IoU阈值为0.5~0.95以0.05为步长递增时的mAP。有

式中，TP为被正确检测的裂缝数量；FP为被误检或漏检的裂缝数量；FN为误把裂缝检测为其他类别的数量；n为检测的结果中被用于计算指标的裂缝的数量；i为某裂缝。

3.3 道路裂缝检测模型测试与评估

为验证方法有效性，设计系统的对比实验，选取当前主流的两类代表性检测方法作为对照。一类为YOLO系列的轻量化版本，包括YOLOv8n、YOLOv9t和YOLOv10n；另一类为基于R-CNN框架的检测方法，包括Faster R-CNN（Girshick，2016）、Cascade R-CNN（Cai和Vasconcelos，2021），以及Sparse R-CNN（Sun等，2021）。为确保公平性，YOLO系列模型统一选取参数规模相近的轻量化变体n/t版本，且训练参数保持一致。所有模型均不加载预训练权重，并采用相同的训练参数与数据增强策略，在相同的训练集、验证集与测试集划分下训练至收敛。

3.3.1 比较评价

对各模型进行多轮训练与验证。YOLO系列模型自动保存验证集性能最优的权重文件，经多次验证集评估后选取结果最优的模型；R-CNN系列模型在训练末期保存多组权重，并选取验证性能最佳的结果作为最终模型。经多次测试表明，各模型在不同随机划分下的性能差异均小于1%，验证了稳健性与可重复性。

表1给出了不同的目标检测模型在RDD2022_ China数据集上的裂缝检测性能。本文方法在各项指标上均优于其他模型。与YOLOv8n相比，Pr值提高了0.9%， Re值由82%提升至84.3%， mAP50、mAP50-95值分别提升了1.4%、1.3%。相比之下，R-CNN系列模型的检测效果较差，不仅模型复杂度高，检测精度也普遍低于YOLO系列，说明其在实时检测任务中的适用性不足。

表2进一步给出了YOLO系列模型在RDD2022_ China数据集中四类裂缝的AP50指标表现，可知，本文方法在所有裂缝类型上均取得较优性能，尤其在纵向裂缝、坑洞两类上，相较于YOLOv8n，AP50值分别提升了2.4%、3.6%，表明其在多样本类与小样本类目标上均具有更强的检测能力。此外，上述模型构建中以 FreqFusion模块替代Concat模块的融合结构，增加了融合策略复杂度，但因采用了单位卷积实现通道降维，整体参数量反而较YOLOv8n略有下降，仅为2.92M（表1），所以，在保持轻量化的同时实现了性能的全面提升。

3.3.2 结果分析

图5展示了不同检测模型在RDD2022_China数据集的裂缝检测结果。在裂缝目标密集、背景复杂或边缘模糊的场景下，本文方法能够更加完整、准确地识别不同类裂缝目标，边界定位更加清晰，漏检和误检情况显著减少（图5（h））。R-CNN系列模型的检测置信度普遍偏高，多集中于0.99以上（图5（b）至（d））；而YOLO系列模型分布较分散为0.4~0.9（（e）至（h））。究其原因，两类模型在结构与置信度计算机制方面不同：R-CNN采用Softmax输出类别概率，易产生过高置信度；YOLO通过目标存在概率与类别概率联合计算，更接近真实概率分布。因此，置信度高并不等同于检测更可靠，综合漏检、误检与置信度表现可知，本文方法在整体检测性能上更具稳定性与可信度。

进一步对比本文方法与YOLOv8n在典型样本中的裂缝检测表现（图6）。图6（a）的检测对比结果中，YOLOv8n未能对明显裂缝进行完整检测，且检测框置信度较低；（b）中，遗漏了图像边缘处不完整坑洞的识别；（c）中，在纵向裂缝与横向裂缝连续分布场景下，对较隐蔽的横向裂缝检测不全；（d）中，对龟裂类型病害的浅显区域，同样存在框选不完整现象。因此，验证了本文方法在裂缝目标完整性、边缘识别及置信度稳定性方面均优于YOLOv8n模型，检测结果更为精确可靠。

上述性能提升得益于FreqFusion模块在特征融合过程中的改进，其采用频率感知机制引导特征整合，有效抑制了上采样过程中类别内不一致现象，并通过高频补偿策略增强了边缘与细节特征，从而提升了模型在细粒度裂缝检测中的稳健性与精度。尤其是对小样本类（如坑洞）、形态复杂且较难细分类（如龟裂和纵向裂缝）的目标，本文方法表现出了相对更优的识别能力。

3.4 消融实验

为评估不同频域建模方式的有效性，验证FreqFusion模块对模型性能的具体贡献，基于YOLOv8n，设置如下三种配置组件的实验：+ALPF；+ALPF+AHPF；+偏移生成器形成完整FreqFusion，即本文方法（表3）。其中，FreqFusion模块仅在自上向下的特征融合阶段替换Concat模块操作，结构轻量且位置固定，因此，未设置模块在其他网络位置的对比实验，仅通过组件消融及完整模型性能提升来综合验证模块设计的合理性。

由表3可知，单独引入ALPF后，模型的检测Re值由82%提升至82.9%，mAP50值由86.8%提升至87.4%，表明低频特征增强有助于改善模型的检测召回性能；进一步地，叠加AHPF，Pr、Re值分别达到了85.6%、84%，mAP50值提升至87.8%，说明高频特征在边缘及细小裂缝目标检测中具有补充作用；最终，加入偏移生成器后，所有评价指标结果继续小幅提升。由此可见，FreqFusion模块中的各子结构均对性能提升具有积极贡献，且低频增强与高频保持互为补充，完整模块能够实现最优检测效果。

4 结论

针对道路裂缝检测任务中所存在的边界模糊、结构不连续和小目标漏检等问题，影响了模型在道路裂缝智能检测中的进一步推广与应用。本文提出了一种基于频率感知特征融合（frequency-aware feature fusion，FreqFusion）的YOLOv8轻量化改进模型。该模型以YOLOv8n为基线，通过引入频域特征增强机制FreqFusion模块（Chen等，2024），实现了多尺度特征间的高效交互与细节补偿，显著提升了裂缝目标的边缘识别与结构完整性。结果表明，在RDD2022_China数据集中，相较于基线模型，本文方法在检测精度与稳健性方面均取得明显提升，尤其在复杂背景与微小裂缝场景下表现出更优的泛化能力与边界细化效果。研究成果为复杂道路裂缝的高精度、轻量化智能检测提供了一种有效解决方案，可为道路病害监测、基础设施安全评估及城市道路养护提供高精度、强稳健的技术支撑。

未来研究将进一步结合高频特征增强与注意力机制的协同作用，优化FreqFusion模块的动态权重分配与频域响应机制，以提升模型的结构创新性与特征表达能力。同时，将在多源、多场景道路病害数据集上开展扩展实验，引入更多检测与分割框架进行系统对比，以验证模型的跨场景泛化性能。此外，还将探索模型轻量化与实时化部署策略，推动算法在无人机与车载终端等道路监测平台中的应用落地。

参考文献（References）

陈宇平, 范高. 2023. 基于改进DeepLabV3+在复杂环境下的道路裂缝检测. 广州大学学报(自然科学版), 22(2): 43-51[Chen Y P, Fan G. 2023. Road crack detection based on improved DeepLabV3+ in complex environments. Journal of Guangzhou University (Natural Science Edition), 22(2): 43-51 (in Chinese)]

付景泽, 吕伏. 2024. 基干部分可变形卷积的多尺度路面缺陷检测算法. 测绘科学, 49(10): 36-49[Fu J Z, Lyu F. 2024. Multi-scale road defect detection algorithm based on partially deformable convolution. Science of Surveying and Mapping, 49(10): 36-49 (in Chinese)]

赫英策, 李禹萱, 孙尚宇, 宋伟东. 2024. 基于改进YOLOv8的前视影像的路面病害检测方法. 时空信息学报, 31(5): 605-617[He Y C, Li Y X, Sun S Y, Song W D. 2024. A method for detection of pavement defects in front-view images based on improved YOLOv8. Journal of Spatio-temporal Information, 31(5): 605-617 (in Chinese)]

李朝勇, 张成, 韦海丹. 2023. 基于多尺度特征融合网络的路面裂缝分割方法研究. 时空信息学报, 30(3): 425-430[Li C Y, Zhang C, Wei H D. 2023. Research on road crack segmentation method based on multi-scale feature fusion network. Journal of Spatio-temporal Information, 30(3): 425-430 (in Chinese)]

李思宏, 姬书得, 任赵旭. 2024. 改进DETR的无人机航拍图像沥青路面破损检测算法. 郑州航空工业管理学院学报, (5): 50-57[Li S H, Ji S D, Ren Z X. 2024. Improved DETR algorithm for asphalt pavement damage detection in UAV aerial images. Journal of Zhengzhou University of Aeronautics, (5): 50-57 (in Chinese)]

刘世夫, 王金鑫, 李盼乐. 2025. 改进YOLOv5的遥感图像交通小目标检测. 时空信息学报, 32(4): 364-375[Liu S F, Wang J X, Li P L. 2025. Improved YOLOv5 for small traffic target detection in remote sensing image. Journal of Spatio-temporal Information, 32(4): 364-375 (in Chinese)]

肖创柏, 柏鳗晏, 禹晶. 2021. 基于Faster R-CNN的缝隙检测与提取算法. 北京工业大学学报, 47(2): 135-146[Xiao C B, Bai M Y, Yu J. 2021. Crack detection and extraction based on faster R-CNN. Journal of Beijing University of Technology, 47(2): 135-146 (in Chinese)]

徐子阳, 周绍光, 葛莹, 万子豪. 2025. 基于模型蒸馏的无标签城市道路遥感自动提取. 时空信息学报, 32(2): 113-126[Xu Z Y, Zhou S G, Ge Y, Wan Z H. 2025. Automatic extraction of unlabeled urban roads from remote sensing images based on model distillation. Journal of Spatio-temporal Information, 32(2): 113-126 (in Chinese)]

朱小凡, 胡璐锦, 王恺, 王坚. 2024. 基于SE-Mask-RCNN建筑遗产识别与空间可视化分析. 时空信息学报, 31(1): 50-56[Zhu X F, Hu L J, Wang K, Wang J. 2024. Architectural heritage recognition and spatial visualization analysis based on SE-Mask-RCNN. Journal of Spatio-temporal Information, 31(1): 50-56 (in Chinese)]

Arya D, Ghosh S K, Toshniwal D. 2022. AI-driven road condition monitoring across multiple nations// Proceedings of the AAAI Conference on Artificial Intelligence, 36(11): 12868-12869

Arya D, Maeda H, Ghosh S K, Toshniwal D, Mraz A, Kashiyama T, Sekimoto Y. 2021. Deep learning-based road damage detection and classification for multiple countries. Automation in Construction, 132: 103935

Cai Z W, Vasconcelos N. 2021. Cascade R-CNN: High quality object detection and instance segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 43(5): 1483-1498

Chen L W, Fu Y, Wei K X, Zheng D Z, Heide F. 2023. Instance segmentation in the dark. International Journal of Computer Vision, 131(8): 2198-2218

Chen L W, Fu Y, Gu L, Yan C G, Harada T, Huang G. 2024. Frequency-aware feature fusion for dense image prediction. IEEE Transactions on Pattern Analysis and Machine Intelligence, 46(12): 10763-10780

Dai J F, Qi H Z, Xiong Y W, Li Y, Zhang G D, Hu H, Wei Y C. 2017. Deformable convolutional networks. 2017 IEEE International Conference on Computer Vision (ICCV). 764-773

Girshick R. 2016. Fast R-CNN//2015 IEEE International Conference on Computer Vision (ICCV). 1440-1448

Hu H W, Li Z R, He Z Y, Wang L, Cao S, Du W H. 2024. Road surface crack detection method based on improved YOLOv5 and vehicle-mounted images. Measurement, 229: 114443

Huang S H, Lu Z C, Cheng R, He C. 2022. FaPN: Feature-aligned pyramid network for dense image prediction//2021 IEEE/CVF International Conference on Computer Vision (ICCV). 844-853

Li X T, Zhang J N, Yang Y B, Cheng G L, Yang K Y, Tong Y H, Tao D C. 2024. SFNET: Faster and accurate semantic segmentation via semantic flow. International Journal of Computer Vision, 132(2): 466-489

Magid S A, Zhang Y L, Wei D L, Jang W D, Lin Z D, Fu Y, Pfister H. 2021. Dynamic high-pass filtering and multi-spectral attention for image super-resolution//2021 IEEE/CVF International Conference on Computer Vision (ICCV). 4268-4277

Manjusha M, Sunitha V. 2025. Optimizing YOLO models for high-accuracy automated detection and classification of road surface distresses. Innovative Infrastructure Solutions, 10(8): 381

Nappo N, Peduto D, Mavrouli O, van Westen C J, Gullà G. 2019. Slow-moving landslides interacting with the road network: Analysis of damage using ancillary data, in situ surveys and multi-source monitoring data. Engineering Geology, 260: 105244

Sami A A, Sakib S, Deb K, Sarker I H. 2023. Improved YOLOv5-based real-time road pavement damage detection in road infrastructure management. Algorithms, 16(9): 452

Shi W Z, Caballero J, Huszár F, Totz J, Aitken A P, Bishop R, Rueckert D, Wang Z H. 2016. Real-time single image and video super-resolution using an efficient sub-pixel convolutional neural network// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 1874-1883

Sun P Z, Zhang R F, Jiang Y, Kong T, Xu C F, Zhan W, Tomizuka M, Li L, Yuan Z H, Wang C H, Luo P. 2021. Sparse R-CNN: End-to-end object detection with learnable proposals//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 14449-14458

Terven J, Córdova-Esparza D M, Romero-González J A. 2023. A comprehensive review of YOLO architectures in computer vision: From YOLOv1 to YOLOv8 and YOLO-NAS. Machine Learning and Knowledge Extraction, 5(4): 1680-1716

Wang J Q, Chen K, Xu R, Liu Z W, Loy C C, Lin D H. 2022. CARAFE: Unified content-aware reassembly of features. IEEE Transactions on Pattern Analysis and Machine Intelligence, 44(9): 4674-4687

Ye G T, Qu J S, Tao J T, Dai W, Mao Y F, Jin Q. 2023. Autonomous surface crack identification of concrete structures based on the YOLOv7 algorithm. Journal of Building Engineering, 73: 106688

Zeiler M D, Fergus R. 2014. Visualizing and understanding convolutional networks. Computer Vision – ECCV 2014. Cham: Springer International Publishing. 818-833

Zhang J M, Lu C Q, Wang J, Wang L, Yue X G. 2019. Concrete cracks detection based on FCN with dilated convolution. Applied Sciences, 9(13): 2686

↓↓ 了解更多产业要闻↓↓

请将我设为星标★