基于地物光谱和轮廓特性的半自动遥感影像样本标注方法
完备的训练数据集是监督学习算法的基石。对于新特定任务的监督学习算法,传统的手动标注新数据集的方式时间和人力成本过高,如何实现高精度标签数据集的快速标注是当前面临的主要挑战,在遥感领域中更是如此。目前标注数据集的方法主要依靠手工选点制作多边形ROI区域或使用涂抹的方式来标注数据。然而,对于无固定形状的自然地物来说,使用这类方法进行标注的精度和效率都较低。鉴于此,我们开发了一个基于地物光谱、轮廓特性的半自动化遥感影像语义分割样本标注方法(Labeled by spectrum and outline,LabelSO),用以实现遥感影像的半自动标注。本方法可直接利用地物光谱特性选择合适的遥感指数(如NDWI,NDSI),或借助外置监督学习算法生成伪标签,并在伪标签上进行涂抹修改。针对伪标签中缺失标签的地物,若具有相似光谱特征,可基于改进的漫水填充算法工具,根据选择的正负种子点提取出准确的地物标签。在此基础上,为避免对微小地物的遗漏(如细小湖泊等),可进一步选择背景为反种子点,快速获取地物标签。对于具有明显轮廓的地物,可以借助改进livewire算法的精确地物轮廓分割的工具,通过少数的点击得到种子点,并基于所选种子点进行精细边缘提取并合成地物的标签。此外,我们还提供了标签审核工具,旨在快速发现标签缺陷并将其修正。实验证明,LabelSO方法可以有效降低在新特定任务的监督学习算法上标注数据集的时间与人力成本(表1)。相较其他标注方法,LabelSO在精确度上有大幅度的提升,尤其在水体数据集上表现出了较高的优越性,从而验证了本研究创建的半自动化遥感影像样本标注方法,可以为监督学习算法的训练数据集制作提供一种新的快捷有效的途径。基于上述流程,我们生产了一套使用LabelSO标注的水体变化数据集Water-CD。该数据集由大量双时态Sentinel-2卫星图像组成,包含1359 个图像对 (512 × 512) 与精细标注标签,可以为水体动态监测等实际应用提供数据支持。
表1 不同标注方法的精度对比
标注任务类型 |
标注方法 |
F1值(%) |
复杂水体数据集 |
NDWI |
79 |
复杂水体数据集 |
LabelSO |
97 |
林地数据集 |
Labelme |
90 |
林地数据集 |
LabelSO |
95 |
|
|
|
发表评论