首页 > 最新动态 > 时空信息学报丨中国测绘科学研究院李洪霖等：面向高分遥感影像的城市裸露推填土轻量化提取方法

最新动态

时空信息学报丨中国测绘科学研究院李洪霖等：面向高分遥感影像的城市裸露推填土轻量化提取方法

2026-05-0935

《时空信息学报》是由自然资源部主管，国家基础地理信息中心、中国地理信息产业协会、黑龙江测绘地理信息局共同主办的中文学术期刊，双月刊。为分享最新研究成果，搭建学术交流平台，中国地理信息产业协会公众号开设“时空信息学报”专栏，独家刊载《时空信息学报》论文，供广大读者研阅。欢迎产学研用各界关注、分享！

“时空智能遥感”专题编委会：

张继贤国家基础地理信息中心、莫干山地信实验室

闫利武汉大学

顾海燕中国测绘科学研究院

专题其他文章：

1.地表异常遥感监测与预警研究进展

2.基于多模态特征自适应融合与空间关系图网络表达的城市土地利用精细分类方法

3.基于GWVE-YOLO的北京砖石长城植被侵蚀检测模型

4.融合空间感知与多尺度特征的城市点云语义分割方法

面向高分遥感影像的城市裸露推填土轻量化提取方法

李洪霖¹，刘晖²，李海涛¹，杨懿¹，王洋¹

1. 中国测绘科学研究院自然资源调查监测研究中心，北京 100036；
2. 武汉市测绘研究院，武汉 430022

摘要：推填土是指人类活动堆填所形成的特殊土体，在遥感监测图斑中占比较高，因其特征复杂无规律导致提取精度低。现有研究多侧重识别城市场景中防尘网覆盖的推填土，较少关注裸露推填土，因此，提出一种面向高分遥感影像的城市裸露推填土轻量化提取方法LHENet（lightweight hybrid-feature network with edge-calibration）。首先基于卫星遥感数据，构建融合影像特征与场景信息的推填土分类体系、高分辨率城市裸露推填土数据集；其次，编码器阶段采用轻量设计策略；解码器阶段嵌入混合特征优化模块，利用通道、空间注意力机制优化多尺度特征，缓解纹理突变所导致的漏提现象；随后引入边缘校准模块，通过多尺度边界信息融合显著提升复杂边界的提取精度；最后，与已有常用方法进行比较分析。结果表明：①本文方法的总体精度、F1分数和交并比结果，均优于已有常用方法；与HRNet相比，在精度略低的情况下，参数量、计算量分别降低了88%、72.4%。②跨域泛化测试中，本文方法在F1分数上表现最佳，能够在精确率与召回率之间取得较好平衡。

关键词：计算机视觉；语义分割；推填土提取；轻量化；高分遥感影像

引用格式：李洪霖, 刘晖, 李海涛, 杨懿, 王洋. 2026. 面向高分遥感影像的城市裸露推填土轻量化提取方法. 时空信息学报, 33(1): 90-99
Li H L, Liu H, Li H T, Yang Y, Wang Y. 2026. Lightweight extraction method for urban anthropogenic-fill soil in high-resolution remote sensing images. Journal of Spatio-temporal Information, 33(1): 90-99, doi: 10.20117/j.jsti. 202601006

1 引言

随着高分辨率遥感技术的迅猛发展，其对地观测能力已能够清晰呈现地表物体的细节特征，为资源调查、环境监测等领域提供了坚实的数据基础。因此，城市扩张与基础设施建设成为遥感监测的重要应用场景。多数建设用地演化始于推填土，城市化进程中形成了大量建筑渣土和工程堆填场地等推填土。推填土（人工填土）是指由人类活动堆填形成的特殊土体，主要包括素填土和杂填土（吴言军，2011）。此类区域不仅是土地资源利用状况的直接反映，更是城市扬尘污染监管的重要源头。掌握推填土的位置与范围变化，对于自然资源调查监测与环境治理具有关键意义。推填土特征复杂无规律，提取难度较大，监测精度较低。在遥感影像上常表现出尺度差异大、纹理杂乱、颜色多变、边缘不规则及背景复杂等特点，给自动化精准识别带来巨大挑战。因此，迫切需要高效的推填土提取算法。

近年来，深度学习技术在遥感影像解译领域得到了广泛应用（刘宇承等，2023；刘秀慧等，2025）。基于编码器–解码器架构的卷积神经网络通过编码器和解码器层学习图像语义信息实现像素级分类，已在高分辨率遥感影像地物信息提取方面展现了普适性（Bai等，2018；刘钊等，2020；Sun和Zheng，2023）。深度学习模型性能的不断提升，推动了遥感技术在对地物细节和精度要求极高的城市高分遥感领域持续深化应用。例如，何静（2023）构建了SD-UNet网络，通过增加卷积深度、密集连接和标准假彩色样本集，在GF-1D数据上达到95.81%的精确率和89.77%的交并比（intersection over union，IoU），展现了深度学习结合近红外光谱特征对提升绿地提取精度的显著优势；裴建（2024）通过对比最小距离分类与面向对象最邻近方法，证明后者在高分二号（GF-2）影像中能有效减少城市绿地提取中的椒盐现象，总体精度超80%，强调了高分辨率影像下多特征融合的抗噪声能力。与此同时，深度学习技术在裸地的高精度提取中也展现了重要应用价值。例如，陈丽佳等（2025）提出了CATrans框架，通过引入跨尺度注意力与语义视觉Transformer，在DeepGlobe土地覆盖数据集上的平均IoU（mean IoU，mIoU）值达到76.2%，通过上下文先验知识增强了类内差异大的地物的分割一致性；Zhao等（2023）通过构建结合多尺度上下文提取与流对齐上采样的编解码架构，解决了多尺度上下文信息捕获不充分的问题，有效减少了裸土的误检与漏检；卓必莲和刘瑞（2025）针对城市空地识别，对比了SegFormer、TransUNet等模型，发现多尺度特征融合与局部注意力机制能显著改善空地边界模糊的问题。同时，Cao和Huang（2022）提出了一种基于图像级标签的由粗到细的弱监督学习方法，通过先分类后分割的策略实现了高分辨率遥感影像城市场景中防尘网覆盖土的像素级分割，降低了标签的获取成本。上述研究为推填土提取提供了解决思路，但直接将这些模型应用于高分辨率遥感影像裸露推填土提取仍存在如下两个难题：①推填土等人工地物因推填造成土质、光谱突变等复杂特征，还混杂建筑材料、坡度阴影等干扰，经典方法泛化能力不足；②推填区域边界随机多样且相邻背景成分复杂，加剧了特征提取的难度，如城市用地紧张，推填土多呈孤岛状嵌入建筑群，易受建筑阴影、屋顶和背景影响。

此外，面向城市街景理解任务方向，其在复杂场景中处理多尺度目标与保留细节的机制，与城市裸露推填土这类特征复杂、背景多样的特殊地类具有显著的相似性，展现出了应用潜力。近年来，Ye等（2025）针对城市驾驶场景设计了特征优化模块，解决了复杂环境中空间细节丢失的问题；Yang等（2024）通过动态提取边缘轮廓，整合深度监督策略，增强网络对边界细节的感知能力，有效缓解了城市街景和道路驾驶场景下边缘模糊的问题。

因此，聚焦于城市裸露推填土的精准提取，提出一种面向高分遥感影像的城市裸露推填土轻量化提取方法LHENet（lightweight hybrid-feature network with edge-calibration）。其中，建立融合推填土特征与场景信息的推填土分类体系，构建城市裸露推填土遥感数据集。进一步地，构建如下两个优化模块：混合特征优化模块（hybrid feature refinement module，HFRM），通过捕获全局上下文与细粒度空间信息增强网络对推填土颜色与纹理变化的适应能力，解决土质突变导致的漏提现象；边缘校准模块（edge calibration module，ECM），以补偿复杂城市场景下推填土破碎的边界细节。

2 研究方法

围绕分类体系构建、数据集构建与轻量化语义分割网络设计三个核心环节展开。提出融合推填土特征与场景信息的推填土分类体系，明确提取目标的同时缓解因标注不一致导致的错检与漏检问题。采用双阶段标注，构建城市裸露推填土遥感数据集。设计HFRM、ECM两个核心模块来提升网络性能。

2.1 分类体系构建

从遥感解译角度分析总结卫片监测数据中推填土图斑的关键特征和提取所面临的主要问题，推填土在遥感影像中呈现复杂特征：尺度差异极大，从零星堆放到大型渣土场不等；纹理杂乱，混杂建材且植被覆盖不均；颜色因土质和湿度影响而多变；边缘不规则，无固定几何形态；背景复杂，常毗邻道路、农田或工地。依据这些特征进行多类型、多场景的筛选与分类，建立基于边界纹理和物质场景的分类原则。构建融合影像特征与场景信息的推填土分类体系见表1。以常见的城市裸露推填土为分类对象，包括建筑压实土、建筑堆掘场、建筑杂填场等。

2.2 数据集制作

基于上述分类体系，利用Google Earth 0.6 m RGB影像，制作数据集。其中，Google Earth 0.6 m RGB影像获取时间分别为2024年12月，2025年1月、4月；通过水经微图软件采样获取；水经微图软件来源于水经注网站。数据集制作流程如下：

（1）根据推填土分类体系在全国18个省进行数字采样，总计6320次。以边界明显、纹理清晰为原则，确保无云雾或畸变干扰，所有样本随机分布在全国各省（市、区），并表现出明显的光谱、空间和环境差异。随后，将大范围影像裁剪为标准化影像块，筛选后获得1.3万推填土影像块，从中选取城市裸露推填土作为分类对象，包括建筑压实土、建筑堆掘场、建筑杂填场，如图1所示。

（2）采用双阶段标注策略生成高质量像素级标签，具体而言：①基于红蓝反射指数（red-blue reflectance index，RBRI）实现粗提取；②结合集成修形与AI辅助标注模块的LabelMe平台进行像素级人工修正，确保标注精度；③标注过程中随机抽取10%样本进行三次重复标注，并计算Kappa系数以保证一致性，冲突结果由专家仲裁。最终，获得2319对512个像素×512个像素的样本集，得到城市裸露推填土遥感语义分割数据集，含影像与JSON/PNG双格式标签，满足高精度遥感解译需求。

2.3 边缘校准的轻量混合特征优化网络

LHENet整体结构遵循编码–解码架构，依次嵌入HFRM、ECM，协同实现高效率、高精度的城市裸露推填土分割。图2展示了网络总体结构。主要由三部分组成：①轻量编码器，采用“宽通道浅层+窄通道深层”策略，逐级下采样得到1/2、1/4、1/8、1/16四阶特征，既保留空间细节又控制参数量；②级联解码器，对应四阶特征进行逐级双线性上采样，并在1/8、1/4、1/2分辨率处嵌入混合特征优化模块，对重建特征进行通道–空间双重精化；③边缘补偿分支，ECM并行接收最深三层特征（1/16、1/8、1/2），最终生成边缘置信图，与解码主支路logits逐像素加权融合，实现边界增强。其中，轻量编码器由四个ConvBNReLU块级联而成，每块步长为2，通道数依次扩展为C→ 2C→4C→8C，其中基础通道数C设置32。所有卷积采用3×3内核+BN+ReLU，既提取局部上下文又避免冗余参数。

1）混合特征优化模块

参考HAMFNet的思想（Ye等，2025），设计HFRM，以增强模型对颜色和纹理变化的适应性。将HFRM集成到编码器、解码器架构中，旨在通过捕捉全局上下文和细粒度空间信息来提高分割性能。对解码器各阶段特征进行通道注意力→空间注意力→残差学习三步处理，增强网络保留关键细节的能力，可适应推填土颜色、纹理多变的情况。HFRM模块框架如图3所示。

（1）通道注意力，通过适应特征的通道重要性来增强模型的表达能力。主要包括一个自适应平均池化操作，随后是两个卷积层。其中一个卷积层减少通道数；另一个将通道恢复到原始维度。输出通过一个Sigmoid激活函数，强调最相关的通道。这个过程使得模型能够根据全局平均值聚焦于重要的特征通道。

（2）空间注意力，增强了模型对特征空间位置的敏感度。通过在通道维度上计算平均值和最大值，空间注意力机制学习到一个空间加权图，用来调制特征图，从而强调空间上重要的区域。

（3）残差学习，在模块的输入和输出之间集成了残差连接。这使得模型能够专注于学习高频特征，同时保留低级信息。通过一系列卷积、批量归一化层和ReLU激活函数来确保非线性映射。图2中，ReLU激活层与BN层用于提升模型非线性表达能力后对特征通道的归一化处理，可抑制梯度消失现象：

式中，x为ReLU激活层中单个网格的输入值；μ为特征均值；σ为特征标准差；分别为可学习的缩放、偏移参数。在ReLU激活层，将所有不大于0 的值设置为0，而大于0 的值保持原值，这样保留了正数部分的特征，抑制负数部分的特征；在BN层，对每个特征通道进行归一化操作，使特征分布接近于标准正态分布。经过BN层后，利用作用于输出层的Sigmoid 函数，将模型的特征输出转换为0～1的概率值，有利于判断像素点分割的结果，即

最终，将经过Sigmoid激活后的边界特征与解码器输出的掩码特征进行逐元素相乘，将边界特征与掩码特征进行有效的信息融合，可降低不相关的信息对边界预测的影响，使得边界处的像素更加准确。

2）边缘校准模块

根据MSEdgeNet的边缘分支思想（Yang等，2024），构建ECM，采用多尺度边缘提取→通道融合结构校准优化不规则边界细节，用于提高城市环境中推填土复杂边界在遥感影像中的分割精度，如图4所示。具体而言：①多尺度边缘提取，选取编码器1/16、1/8及解码器1/2三层特征，通道数分别为8C、4C、C，通过3×3卷积统一压缩至32维，消除通道差异；将1/16、1/8特征双线性插值至1/2分辨率实现空间对齐；②通道融合，将对齐后的特征拼接为96维融合特征。经3×3融合卷积+BN+ReLU降维至32，通过1×1卷积输出单通道边缘logits。

3 实验与结果分析

实验环境配置Python3.7.16、PyTorch1.13.1、CUDA11.7.使用Adam优化器，初始学习率为1× 10^–3，采用基于验证集性能平台期的动态学习率调度机制，设置批量大小为16，在NVIDIA RTX 4090 GPU上训练100轮。

实验数据主要为资源三号（ZY-3）影像，来源于天地图网站，影像时间2024年，空间分辨率0.8 m，图像尺寸7078个像素×3961个像素。为确保所构建深度学习模型的泛化能力与性能评估的客观性，采用分层抽样策略，将上文所述自建数据集划分为训练集、验证集和测试集三个互斥的子集。在整个数据集层面，依据样本的类别标签进行分层，以保证各子集中类别分布的比例与原始数据集整体分布保持一致，从而避免因划分偏差而引入的模型评估误差。随后，采用随机种子固定随机数生成器的状态，确保每次划分过程可复现，数据集最终按 8︰1︰1 的比例进行划分。

3.1 评价指标

选取总体精度（overall accuracy，OA）、F1分数（F1 score，F1）、IoU作为评价指标，以客观衡量模型在预测精度和稳健性方面的性能。F1综合考虑了精确率（precision，Pr）、召回率（recall，Re）。其中，Pr表示被正确预测的推填土像素与所有预测为推填土像素的比值；Re表示正确预测的推填土像素与真实标签中所有推填土像素的比值。此外，还通过参数量（Params）、计算复杂度浮点数（FLOPs），对模型的复杂程度和计算效率进行评估。有

式中，TP为预测的推填土被正确识别为推填土的像素数量；TN为预测的非推填土被正确识别为非推填土的像素数量；FP为预测的推填土被错误地识别为推填土的像素数量；FN为真实的推填土被错误地识别为非推填土的像素数量。

3.2 结果分析

为验证方法可行性，与U-Net（Ronneberger等，2015）、PSPNet（Zhao等，2017）进行对比实验。此外，为进一步验证模型的先进性，还引入轻量化模型BiSeNetV2（Yu等，2020）、SegFormer（Xie等，2021），以及高性能网络HRNet（Sun等，2020）作对比。为保证客观性与合理性，所有模型均在相同的软硬件环境与训练配置下进行训练，采用BCE+Dice Loss作为损失函数。

不同方法的评价结果见表2，相较于PSPNet，LHENet在OA、F1、IoU的结果均有提升，分别提高了约0.6%、1%、1.2%；而与使用同样编码器和解码器结构的U-Net相比，提升幅度更显著，在F1、IoU提升了2.1%、2.9%。在先进性方面，与当前性能最优的HRNet相比，LHENet在OA、F1、IoU的结果分别降低了约0.4%、0.6%、0.9%，但其Params、FLOPs分别显著降低了约88.0%、72.4%，体现出了更高的计算效率。此外，相较于BiSeNetV2、SegFormer两个轻量模型，LHENet在OA、F1、IoU的结果均有稳定提升，并能够保持Params、FLOPs处于更优水平。

为更直观地验证方法性能，图5展示了不同模型在测试集上的预测结果，相较于其他模型，LHENet可以清晰地提取出在遥感影像中较复杂的城市裸露推填土区域。如图5（c）所示，提取出了匀质大块且边界较平滑的推填土范围，但此类建筑压实土占比较少；如（d）所示，提取出了镶嵌建筑压实土的大部分区域，效果相较于（c）（e）中有较大细节上的改善，但出现大范围阴影时无法提取完整压实土区域；如（f）所示，提取出的边缘细节清晰无噪声，但对镶嵌建筑压实土这类离散、较小的目标提取效果较差，也无法适应土质、纹理变化大的堆掘场和杂填场；如（g）所示，压实土和推掘场所提取的效果与（h）中的接近，但无法适应堆放建筑材料的杂填场区域，出现了漏提。总体上，本文方法相较于经典语义分割模型有较大提升，不但缓解了推填土周围明显建筑、阴影的影响，还擅长土质、纹理不均匀的堆掘场和掺杂建筑材料的杂填场提取，减少了错提漏提，且边界清晰无噪声，如图5（h）所示。

3.3 消融实验

为验证HFRM、ECM两个模块的有效性，以LiteFusionNet为基线模型设计五组实验，见表3。其中，引入HFRM后，OA值提升至93.98%，相较于基线模型提高了0.32%，说明其能有效增强特征表达能力。以“先HFRM后ECM”组合顺序的LHENet，F1、IoU值分别达到90.02%、83.19%，相较于基线模型提升了约1.01%、1.52%，总体精度进一步提高至94.19%，显著优于其他结构配置。

总之，HFRM在提升特征区分度方面作用显著，ECM能够有效整合空间上下文信息。且两个模块组合顺序不同时，协同增强效应也不同。这说明模块嵌入顺序对模型性能具有重要影响，也验证了所提模块在遥感影像分割任务中的有效性和结构合理性，为模型性能与计算效率的平衡提供了可靠方案。此外，为支持结果复现性，还提供最小可复现子集。

3.4 泛化能力分析

为系统评估方法的泛化能力，设计跨数据源、跨区域、跨时相、跨分辨率的验证实验。实验区域覆盖天津市一处大面积城区。不同方法的泛化性能指标结果见表4。PSPNet在IoU、OA的结果，均表现优异，F1的结果略低于LHENet的，总体上，表现出最佳的综合泛化性能；U-Net作为语义分割的基准模型，性能显著落后于PSPNet、LHENet。这凸显了在复杂的跨域场景下，经典的编码器–解码器结构虽然有效，但其特征提取和上下文感知能力稍差。BiSeNetV2表现较差，在OA、F1、IoU的结果与U-Net的差距均大于1%。HRNet对推填土类的区分能力严重不足，泛化能力较差。SegFormer、U-Net的表现未达到预期，在跨域任务中表现不佳，可能数据量有限未发挥优势所致。LHENet虽在多维域变化下对测试样本中城市裸露推填土边界的分割质量有一定下降，但取得了最高的F1结果，且IoU值相比PSPNet的低了1.55%。综合来看，对城市裸露推填土的跨域提取任务中LHENet在精确率和召回率之间取得了不错的平衡。

如图6（b）所示，LHENet测试结果可视化印证了上文所述，尽管存在多维域差异，城市裸露推填土目标仍能被精确提取出来。图6（a）显示对于植被场景的泛化能力表现不错；（c）显示随着多维域变化，本文方法存在一定局限性；（d）显示存在一定程度的错提河流现象；（e）显示无法区分与城市裸露推填土光谱特征相似的建筑。这表明，LHENet并非局限于特定数据集，其学习到的表征具有较高泛化能力。

4 结论

为高效精准地提取城市场景中的裸露推填土区域，充分考虑了复杂城市环境中推填土区域的多样性和背景干扰问题，本文提出了一种高效的语义分割方法。以编码–解码架构为基础，嵌入混合特征优化模块和边缘校准模块，以提升模型对复杂特征的适应能力和复杂背景干扰下边界提取能力。其中，混合特征优化模块通过通道注意力、空间注意力和残差学习的三步处理，有效增强了全局上下文捕获和关键细节的保留能力；边缘校准模块通过多尺度边缘提取和通道融合的方式，有效提升了复杂边界提取和细节补偿能力。研究表明，本研究在推填土提取任务上展现出了良好的可行性和有效性，对提升城市遥感智能解译与自然资源遥感监测水平具有一定的参考价值。

本研究尚存在不足之处。所建体系尚未完全覆盖特殊季节、特殊地域的裸露推填土特征，如阴影或植被残留的区分。在数据层面，植被压实土、覆网待建土、植被堆掘场、植被杂填场和矿区杂填场五类推填土尚未纳入，制约了模型在全场景下的泛化能力。在方法层面，虽可应对复杂多变的城市裸露推填土边界、纹理特征，但难以避免太阳阴影对陡坡边缘提取精度的影响。下一步工作将聚焦于此，并加强与业务化监测流程的对接设计，以推动研究成果的实际应用。

↓↓ 了解更多产业要闻↓↓

请将我设为星标★