
一粒种子的“身份密码”,不仅藏在颜色与形状中,更隐藏在肉眼看不见的光谱里。想象一下,未来人们只需用一台设备扫描种子,就能立刻识别出其品种、纯度甚至健康状况——这不再是科幻场景,而是正在成为现实。近日,德国马丁路德·哈勒维腾贝格大学在《scientific data》上的发表了一项研究,研究公布了一个名为BiSID-5k的双模式种子图像数据集,它结合了RGB图像与高光谱成像技术,为AI种子识别提供了前所未有的高质量数据资源。
图1. BiSID-5 k B24采集和制备管道概述。
研究背景:种子识别的重要性与挑战
在农业生产中,种子纯度对作物产量与品质至关重要。根据国际种子检验协会规定,许多国家对种子批次有严格的认证要求。为满足合规要求,相关任务通常依赖于人工逐粒识别,这项工作耗时耗力、极度依赖经验,尤其在种子外形相似、颜色多变时,人眼识别容易出错。近年来,基于深度学习的图像分类技术在多领域取得突破,但其成功高度依赖大规模标注数据集。在农业种子识别领域,高质量、大规模的光谱图像数据集仍十分稀缺。现有数据集往往样本有限,或仅包含可见光图像,难以支撑复杂模型的训练与应用。
研究方法:构建双模式种子图像数据库
样本选择:选取10种欧洲油菜田常见杂草种子,每种500粒,共计5000粒种子;
成像系统:使用自制种子托盘,通过半自动传送系统,使用两个同步光谱仪同时采集:
l RGB图像:采用高质量RGB成像仪;
l 高光谱图像:使用Resonon Pika L高光谱成像仪,覆盖380.96~1017.9 nm波长范围,光谱分辨率为5 nm,共300个光谱波段。实验设置种子与镜头下端之间的距离为14.5 cm,使用4个卤素灯泡照明;
图像采集完成后,进行数据预处理,并通过多种方法提取特征,最终采用深度学习模型对采集的图像进行种子精确分类。
图2.半自动数据采集流水线。该流水线由恒速链式传动装置组成,每个种子被放置在单独的种子托盘中。当种子托盘到达流水线中心位置时,Resonon Pika L高光谱成像仪和RGB成像仪被触发,同时捕捉一组高光谱图像和RGB图像。
图3. BiSID-5k数据集概述。
图4.(a)高光谱和(b)RGB模式的特征提取方法概述。
图5.数据集中各物种的平均光谱。
研究结果:高光谱数据显著提升识别准确率
(1)在MS模式上训练的ResNet模型表现出最高的性能,其中,3D-ResNet-18模型在光谱数据上表现最佳,准确率达到99.60%,在HS模式上训练的ResNet在所有指标上的表现比在MS模式上训练的ResNet下降约1%,这表明增加光谱带的数量并不一定会提高性能。相比之下,HS模型上训练的结果仍旧优于仅使用RGB图像的模型和传统机器学习方法。此外,所有ResNet都出现了一致的模式:较小的架构往往会实现更好的性能。
表1.以下结果为对所评估模型进行三次独立运行后取平均值所得。
(2)低空间分辨率时,光谱信息占主导,高空间分辨率时,空间信息价值凸显,二者之间存在一个最佳平衡点,但无论采样策略如何,增加空间分辨率都会一致性地提升模型的分类性能,而光谱信息则需适度优化。
表2. 下表展示了3D-ResNet模型在不同空间和光谱分辨率下对多光谱 (MS) 和高光谱 (HS) 数据进行处理的结果。
未来展望,多模式融合助力智能农业
BiSID-5k数据集不仅为种子分类研究提供了重要资源,也为多模式图像融合、小样本学习、域自适应等研究方向提供了实验基础。未来,结合光谱、形态、纹理等多维度信息,AI系统有望实现更精准、更高效的种子纯度检测、品种鉴定与质量评估。
对于种子企业、农业监管部门和科研机构而言,这类技术的推广将有助于提升种子质量控制的自动化水平,降低人工成本,保障农业生产的安全与效益。此外,随着传感器技术的进步与数据集的不断丰富,光谱成像技术有望在作物病害早期诊断、营养状态监测、产量预测等方面发挥更大作用。
发表期刊:scientific data【影响因子:8.7(五年影响因子)】
研究单位:马丁路德·哈勒维腾贝格大学、莱比锡大学等
使用设备:Resonon Pika L高光谱成像仪
DOI:https://doi.org/10.1038/s41597-025-05979-6