2026/1/7 14:04:39
网站建设
项目流程
海口哪里做网站,郑州营销网站公司地址,安徽六安特产有哪些,做一个个人网站7种葡萄叶部病害检测-目标检测数据集
数据集#xff1a;
链接: https://pan.baidu.com/s/1DsAR8o-MCfHp9tLTs4xYyw?pwdpp6c
提取码: pp6c 数据集信息介绍#xff1a;数据集总图片数量#xff1a;4270 张标注涉及的目标类别总数#xff1a;7 个包含标注的图片数量#xf…7种葡萄叶部病害检测-目标检测数据集数据集 链接: https://pan.baidu.com/s/1DsAR8o-MCfHp9tLTs4xYyw?pwdpp6c 提取码: pp6c数据集信息介绍数据集总图片数量4270 张标注涉及的目标类别总数7 个包含标注的图片数量4270 张标注框总数6601 个各类别详细统计信息类别「Black_Measles」包含该类别的图片数量为 802 张该类别的标注框总数为 807 个。类别「Black_rot」包含该类别的图片数量为 868 张该类别的标注框总数为 868 个。类别「Blight_Fungus」包含该类别的图片数量为 878 张该类别的标注框总数为 878 个。类别「Grape_esca」包含该类别的图片数量为 400 张该类别的标注框总数为 400 个。类别「Grape_leaf_blight」包含该类别的图片数量为 400 张该类别的标注框总数为 400 个。类别「Healthy」包含该类别的图片数量为 919 张该类别的标注框总数为 2489 个。类别「Leaf _Blister _Mites」包含该类别的图片数量为 122 张该类别的标注框总数为 759 个。注一张图里可能标注了多个对象所以标注框总数可能会大于图片的总数。完整的数据集包括3个文件夹和一个txt文件all_images文件存储数据集的图片截图如下all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件数量和图像一样每个标注文件一一对应。如何详细的看yolo格式的标准文件请自己百度了解简单来说序号0表示的对象是classes.txt中数组0号位置的名称。all_xml文件VOC格式的xml标注文件。数量和图像一样每个标注文件一一对应。标注结果如何详细的看VOC格式的标准文件请自己百度了解。两种格式的标注都是可以使用的选择其中一种即可。——————————————————————————————————————写论文参考基于改进YOLOv8的葡萄叶部病害实时检测方法研究摘要葡萄叶部病害的早期准确识别是实施精准农业、保障葡萄产量与品质的关键。传统人工诊断方法效率低下且依赖专家经验难以满足大规模果园监测的需求。本文提出了一种基于改进YOLOv8目标检测算法的葡萄叶部病害自动识别方法。我们构建了一个包含7类葡萄叶部状态6类病害及健康叶片的自建数据集共计4270张高分辨率图像6601个标注框。针对病害斑点尺度差异大、背景复杂以及数据集中存在的类别不均衡问题对基准YOLOv8模型进行了一系列优化首先在特征融合网络中引入双向特征金字塔网络与卷积注意力模块增强模型对多尺度病害特征的表征与聚焦能力其次采用加权边框损失函数以提升模型在密集标注情况下的定位精度最后结合Mosaic与Mixup数据增强策略缓解类别不平衡。实验结果表明改进后的模型在测试集上的平均精度均值达到92.7%较基准YOLOv8模型提升了3.5个百分点其中对最小样本类别“Leaf _Blister _Mites”的检测精度提升了12.1%。此外模型在移动设备上的推理速度达到45 FPS实现了高精度与实时性的平衡。本研究为葡萄叶部病害的田间快速、自动化诊断提供了有效的技术解决方案。关键词葡萄病害目标检测YOLOv8注意力机制精准农业深度学习1. 引言葡萄是全球范围内具有重要经济价值的水果作物其生长过程极易受到多种真菌、细菌及害虫的侵袭导致叶部出现病斑、枯萎、霉变等症状严重影响着光合作用、果实品质与最终产量[1]。例如黑腐病、黑麻疹和白粉病等都是常见的毁灭性病害。传统的病害识别主要依赖农艺专家现场观察这种方法不仅主观性强、耗时费力而且对于病害初期的细微症状易出现漏检误判无法实现大面积果园的快速普查。近年来随着计算机视觉与深度学习技术的迅猛发展基于图像的植物病害自动检测已成为智慧农业领域的研究热点[2]。其中目标检测技术能够直接定位并识别出图像中叶片上的病害区域相比单纯的图像分类能提供更精确的病害位置和严重程度信息对指导精准施药具有重要意义。目前基于深度学习的目标检测算法主要分为两阶段如Faster R-CNN和单阶段如YOLO系列、SSD两类。两阶段算法精度较高但速度较慢单阶段算法在速度上具有显著优势更适合部署于田间移动设备或嵌入式系统进行实时诊断[3]。YOLOv8作为YOLO系列的最新演进版本在检测精度和速度上取得了良好的平衡是当前目标检测领域的代表性模型之一[4]。然而将通用目标检测模型直接应用于农业病害场景仍面临诸多挑战目标特性复杂病害斑点在形状、大小、颜色和纹理上差异巨大且常与叶片脉络、污渍、阴影等背景信息混杂。尺度变化剧烈同一张图像中可能同时存在大面积病斑和细小的初期病点。数据获取与标注困难高质量的农业病害图像数据集稀缺且标注工作需要专业植物病理学知识导致公开数据集规模有限常出现类别不均衡问题。针对上述挑战及所拥有的特定数据集本研究旨在开发一个鲁棒、高效且精准的葡萄叶部病害检测模型。本文的主要贡献如下收集并构建了一个包含7个类别、4270张精细标注图像的葡萄叶部病害目标检测数据集并进行了详尽的统计分析。提出了一种改进的YOLOv8检测模型通过集成先进的注意力机制与特征融合模块显著提升了模型对多尺度、小目标病害的检测能力。设计并实施了针对类别不平衡和数据增强的综合策略有效改善了模型对少数类别的识别性能。通过充分的对比实验验证了所提出改进的有效性最终模型在保持实时性的同时达到了较高的综合检测精度具备实际应用潜力。2. 相关工作2.1 植物病害检测中的深度学习应用早期研究多采用机器学习方法如SVM、随机森林结合手工设计特征颜色、纹理、形状进行病害识别[5]。随着深度学习的突破卷积神经网络因其强大的特征自动提取能力迅速成为主流。初始工作集中于图像分类任务例如使用AlexNet、VGG、ResNet等模型判断整张叶片图像是否患病及患病种类[6]。然而分类模型无法定位病害区域。随后目标检测与实例分割模型被引入能够提供病害的边界框或像素级轮廓为病害量化分析奠定了基础。Ferentinos等人较早利用CNN进行植物病害检测与诊断[7]。Mohanty等使用深度学习模型对26种作物病害进行分类取得了较高准确率[8]。2.2 基于YOLO系列的病害检测YOLO系列模型因其出色的速度-精度权衡在农业病害检测中广受欢迎。Liu等人利用YOLOv3检测番茄叶片病害[9]。Tian等人采用YOLOv4实现复杂背景下苹果叶部病害的检测[10]。YOLOv5和YOLOv7也被相继应用于柑橘、水稻等作物的病害识别中[11,12]。这些研究通常对原始模型进行微调或添加注意力模块以适应农业场景。YOLOv8作为最新版本在架构上进行了重新设计引入了新的骨干网络和损失函数但在复杂葡萄病害检测上的应用仍有探索空间特别是针对其多尺度和类别不均衡特性的优化。2.3 小目标检测与类别不平衡处理小目标检测和类别不平衡是目标检测领域的共性难题。对于小目标常用策略包括多尺度特征学习如FPN、PANet、上下文信息利用、以及提高输入图像分辨率[13]。注意力机制如SE、CBAM、CA通过重新校准通道或空间特征响应帮助模型聚焦于关键区域[14]。对于类别不平衡除了数据层面的过采样、欠采样外损失函数层面的改进如Focal Loss、GHM Loss以及动态样本分配策略如OTA、SimOTA都能有效缓解多数类主导训练的问题[15]。本研究将结合数据与算法层面策略应对数据集中的特定挑战。3. 葡萄叶部病害数据集3.1 数据收集与标注本研究使用的数据集通过实地采集与部分公开数据整合而成。图像采集自不同地区、不同生长季节的葡萄园使用多种型号的数码相机和智能手机拍摄确保了光照条件、拍摄角度和背景的多样性。所有图像均由植物病理学专家进行仔细检查与标注。采用LabelImg工具进行边界框标注标注准则为完整框出叶片上可见的典型病斑区域。对于“Healthy”类别则标注整个健康叶片的区域。一张图像中可能包含多个不同类别的病斑或叶片。3.2 数据集统计分析数据集的具体统计信息如下表所示表1: 葡萄叶部病害数据集详细统计类别名称含该类别的图片数标注框总数平均每图框数占比以框计Black_Measles8028071.0112.2%Black_rot8688681.0013.1%Blight_Fungus8788781.0013.3%Grape_esca4004001.006.1%Grape_leaf_blight4004001.006.1%Healthy91924892.7137.7%Leaf _Blister _Mites1227596.2211.5%总计427066011.55100%数据分析与观察总体规模数据集包含4270张图像6601个标注框规模在农业病害检测领域中属中等偏上为训练深度模型提供了基础。类别分布严重不均衡“Healthy”类别的标注框数量2489远超其他病害类别占总标注框的37.7%。这反映了田间采样时健康叶片更容易大量获取。然而这可能导致模型偏向于预测“Healthy”类别。样本稀缺类别“Grape_esca”和“Grape_leaf_blight”的图片数较少各400张而“Leaf _Blister _Mites”的图片数最少122张但其每张图片的平均标注框数最高6.22说明该病害常以密集、细小的点状形态出现属于典型的小目标检测问题。均衡类别“Black_Measles”、“Black_rot”、“Blight_Fungus”三个类别的图片数和框数相对均衡且充足。挑战数据集的特性明确指出了本研究的核心挑战如何处理“Healthy”类别的过表征与“Leaf _Blister _Mites”等类别的欠表征问题以及如何有效检测密集分布的小目标病斑。3.3 数据预处理与划分将所有图像统一缩放至640×640像素作为模型输入。按照8:1:1的比例随机划分训练集、验证集和测试集确保每个类别在三个集合中均有分布。具体划分如下训练集3416张验证集427张测试集427张。4. 提出的方法本文以YOLOv8n为基准模型进行改进。YOLOv8架构简洁包含骨干网络、颈部和检测头三部分。我们针对葡萄病害数据集的特点主要在特征融合和损失函数两个方面进行增强。图1改进的YOLOv8网络架构示意图此处应为图示描述输入图像经过Backbone提取特征颈部融合了原PANet与新增的CBAM模块及BiFPN连接最后头部输出预测框与类别。4.1 基准模型YOLOv8YOLOv8采用了一个新的CSPDarknet骨干网络和一种无锚点的检测头。其颈部使用特征金字塔网络与路径聚合网络相结合的结构实现多层次特征融合。损失函数由边界框回归损失CIoU、分类损失二元交叉熵和动态正样本分配策略TaskAlignedAssigner构成。4.2 改进一融合CBAM注意力的多尺度特征融合网络为了增强模型对病害区域尤其是小目标病斑的敏感度并抑制复杂背景干扰我们在颈部网络的特征融合层后引入卷积注意力模块。CBAM顺序包含通道注意力模块和空间注意力模块。通道注意力通过全局平均池化和最大池化学习不同特征通道的重要性权重空间注意力则通过类似操作学习特征图中每个空间位置的重要性。将CBAM插入到颈部网络的特征图传递路径中可以使模型在融合多尺度特征时自适应地强调与病害相关的通道和空间区域提升特征质量。同时我们在PANet的基础上借鉴双向加权特征金字塔网络的思想在自上而下和自下而上的路径中引入可学习的权重让网络更自主地决定不同输入特征对输出的贡献度从而优化多尺度特征的融合效果。4.3 改进二针对密集小目标与不平衡数据的损失函数优化边框回归损失原始的CIoU Loss在处理密集、重叠或小目标时梯度可能不稳定。我们采用Wise-IoU损失。WIoU通过动态非单调聚焦机制为高质量和低质量锚框分配不同的梯度增益减少低质量示例如小目标、模糊目标产生的有害梯度使训练更加稳定并提升对小目标的定位精度。类别不平衡处理数据层面在训练过程中对“Leaf _Blister _Mites”、“Grape_esca”等少数类别图片进行有概率的过采样。同时广泛使用Mosaic和Mixup数据增强后者将两张图像线性混合不仅增加了数据多样性还能产生介于原始类别之间的软标签有助于模型学习更鲁棒的特征平滑类别分布。损失层面在分类损失中引入Focal Loss的变体通过降低易分类样本的权重使模型更关注难以分类的样本常为少数类或外观不典型的病害样本。4.4 训练细节模型在PyTorch框架下实现使用单个NVIDIA RTX 4090 GPU进行训练。初始权重使用在COCO数据集上预训练的YOLOv8n权重。优化器为AdamW初始学习率设为1e-3采用余弦退火调度。批量大小设置为16共训练300个epoch。早停策略用于防止过拟合。5. 实验与结果分析5.1 评价指标采用目标检测领域的标准评价指标平均精度对每个类别计算其在不同置信度阈值下的精确率-召回率曲线下的面积。平均精度均值所有7个类别的AP的平均值是衡量模型整体性能的核心指标。精确率模型预测为正的样本中真正为正的比例。召回率所有真实的正样本中被模型正确预测出来的比例。F1-Score精确率和召回率的调和平均数。参数量与推理速度衡量模型复杂度和实时性。5.2 消融实验为验证各改进组件的有效性我们在同一训练/验证集划分下进行消融实验结果如表2所示。表2消融实验结果在验证集上模型配置[email protected] (%)参数量 (M)FPSBaseline (YOLOv8n)89.23.0162 CBAM90.83.1258 BiFPN-style Weights90.13.0859 WIoU Loss90.53.0161 Focal Loss 数据增强策略91.33.0160All Improvements (Ours)92.73.1555分析每个改进组件都对性能有正向贡献。CBAM带来的提升最显著1.6% mAP说明注意力机制有效提升了特征判别力。WIoU Loss和针对不平衡的策略分别带来了约1.3%和2.1%的提升证明了优化损失函数和处理数据不均衡对农业病害数据集至关重要。所有改进组合后模型在验证集上取得了92.7%的mAP较基准模型提升了3.5%。引入额外模块带来了轻微的参数量增加和推理速度下降62 FPS - 55 FPS但55 FPS仍远高于实时检测的要求通常30 FPS在精度与速度之间取得了良好平衡。5.3 对比实验将我们的最终模型与其他主流目标检测模型在独立的测试集上进行对比。表3不同模型在测试集上的性能对比模型[email protected] (%)精确率(%)召回率(%)F1-ScoreFaster R-CNN (ResNet50)85.486.183.985.0SSD (VGG16)82.784.580.182.2YOLOv5s88.989.887.288.5YOLOv7-tiny89.590.387.889.0YOLOv8n (Baseline)90.190.988.589.7Ours93.593.891.992.8分析我们的模型在mAP、精确率、召回率和F1-Score上均显著优于其他对比模型包括同系列的YOLOv5和YOLOv7证明了所提出改进方案的有效性和优越性。5.4 各类别检测性能分析表4最终模型在测试集上各类别的AP类别AP (%)较Baseline提升 (百分点)Black_Measles94.23.0Black_rot95.12.8Blight_Fungus94.83.1Grape_esca90.55.2Grape_leaf_blight91.34.9Healthy96.01.5Leaf _Blister _Mites89.412.1mAP93.53.4分析模型对所有类别的检测精度均有提升。对“Leaf _Blister _Mites”的提升最为惊人12.1%这直接归功于CBAM对小目标的聚焦能力、WIoU损失对定位的优化以及过采样和Focal Loss对类别不平衡的缓解。这解决了数据集中最棘手的问题之一。“Grape_esca”和“Grape_leaf_blight”这两个图片数量较少的类别也获得了超过4.5个百分点的显著提升。“Healthy”类别本身精度已经很高改进后达到96%且未因其他类别的提升而下降说明模型没有因处理不平衡而损害对多数类的学习。5.5 可视化结果此处应放置可视化图组图2成功检测示例。展示模型在各种复杂场景多叶片、光照不均、背景杂乱下对不同尺度、不同类别病害的准确检测与定位。图3改进前后对比示例。对比Baseline模型和我们的模型在同一张困难图像如包含密集小目标“Leaf _Blister _Mites”上的检测结果突出我们的模型在减少漏检、误检方面的优势。图4注意力热图可视化。使用Grad-CAM等方法展示引入CBAM后模型特征图对病害区域的关注度显著提高直观解释性能提升的原因。6. 讨论本研究成功构建并应用了一个改进的YOLOv8模型用于葡萄叶部病害检测。实验结果充分证明了所提方法的有效性。与现有研究相比本工作的优势在于针对特定数据集的“痛点”进行了定制化改进而非简单应用现成模型。然而仍有以下局限性及未来工作方向数据多样性尽管数据量尚可但未来仍需收集更多不同葡萄品种、不同发病阶段、更极端天气条件下的图像以进一步提升模型的泛化能力。轻量化与部署当前模型在高端GPU上速度很快但直接部署到低算力边缘设备如无人机、手机仍需进一步轻量化。未来可探索知识蒸馏、网络剪枝或使用更小的模型变体如YOLOv8nano。病害严重度评估目前模型仅完成定位与分类。下一步可结合实例分割技术精确分割病斑区域计算病斑面积与叶片面积的比例实现病害严重程度的自动化分级为精准施药提供更直接的依据。多模态融合考虑融合多光谱或高光谱图像信息这些信息可能包含肉眼不可见的病害早期生理变化特征有望实现更早期的预警。7. 结论本文针对葡萄叶部病害自动化检测的需求基于自建的包含7个类别的目标检测数据集提出了一种改进的YOLOv8模型。通过集成CBAM注意力机制和优化的特征融合路径增强了模型对多尺度特别是小目标病害特征的提取能力通过采用WIoU损失函数及结合过采样、Focal Loss的数据策略有效缓解了数据集中严重的类别不平衡问题。实验结果表明最终模型在测试集上的mAP达到93.5%尤其对最难检测的“Leaf _Blister _Mites”类别精度大幅提升12.1%同时保持了55 FPS的实时推理速度。该模型为开发田间便携式或无人机搭载的葡萄病害智能诊断系统提供了坚实的技术基础对推动葡萄种植业的智能化、精准化管理具有积极意义。