科学研究

王占山和程鑫彬团队在《光学与激光技术》发表研究成果,实现了基于特征光谱蒸馏的相似昆虫物种鉴别

发布时间:2025-01-15 发布者: 来源: 浏览:190

昆虫是地球上种类最丰富的动物类群,在生态研究、环境保护和农业生产等领域存在重要的研究价值。快速、准确地识别昆虫物种是野外生物多样性研究中长久以来的迫切需求。基于视觉观察和分子遗传标记的传统方法无法在准确性和实时性之间取得平衡。近年来,基于深度学习的计算机视觉方法已被广泛用于昆虫自动分类,但在处理外观相似的昆虫物种时,依然存在准确度不高的问题。高光谱成像技术(HSI)能够同时获取目标的几何形态和光谱指纹,提供更丰富的目标特性信息,有望用于昆虫物种地实时分类。然而,高光谱数据立方体的庞大数据量和算力需求对便携式设备的实时处理带来了巨大挑战,在一定程度上限制了在线分析场景的推广应用。

鉴于此,同济大学物理科学与工程学院王占山教授和程鑫彬教授团队提出一种基于主成分分析(PCA)和VGG的HSI自动分类方法(PCA-VGG)。该方法利用特征光谱蒸馏方法将原始高光谱图像转化为光谱-空间特征图像,结合微调的VGG模型在蟋蟀相似物种中实现了88.0%的准确率,同时平衡了实时性能和高光谱计算能力要求。该研究成果以“Visible-NIR hyperspectral imaging based on characteristic spectral distillation used for species identification of similar crickets”为题发表在物理与天体物理二区TOP期刊《光学与激光技术》(Optics & Laser Technology)上。


图1基于特征波段蒸馏的高光谱图像预处理及昆虫物种自动分类方法


昆虫的物种鉴定中,油葫芦属的蟋蟀类群由于外观存在高度相似性,其物种区分一直是生态学中的领域难题。本研究使用PCA-VGG自动分类模型首次尝试对黄脸油葫芦、黑脸油葫芦、南方油葫芦三个近缘物种进行鉴定。图1显示了高光谱数据的预处理和蟋蟀自动分类过程。由于原始蟋蟀高光谱数据集中存在大量冗余信息,我们使用PCA 波段选择算法提取特征波段,使用 K-means 算法获得蟋蟀样本的空间特征。然后,将蟋蟀的光谱空间特征图像放入微调的 VGG 模型中,并输出测试集的最终预测结果。


图2(a)黄脸油葫芦样本;(b)PCA-VGG-8模型的混淆矩阵;(c)基于RGB图像模型的混淆矩阵


与基于全光谱图像数据集、RGB图像数据集和纯光谱数据集的模型相比,PCA-VGG模型通过选择合适的特征波段显著提高了分类准确率。在基于光谱-空间特征图像的PCA-VGG模型(图2(b))中,昆虫鉴定结果准确率高达88.0%,远高于基于RGB图像的分类结果(图2(c))。经过与模型压缩和边缘部署方法相结合,我们提出的模型可以实现5.02ms的推理速度,充分显示了该方法在快速物种鉴别领域的优越性和巨大潜力。在将来的物种鉴别任务中,基于本文中提出的特征光谱蒸馏方法,有望在极短的时间内对不同昆虫物种进行大规模鉴定,为高效物种普查和生态学研究奠定技术基础。

同济大学王绪泉助理教授和华东师范大学何祝清副教授为论文通讯作者,同济大学博士研究生马志远和华东师范大学研究生狄米为论文共同第一作者。对论文做出重要贡献的合作者还包括华东师范大学张健教授、研究生胡天浩。


论文链接:https://doi.org/10.1016/j.optlastec.2025.112420