专利基于改进YOLOV5模型的工地安全帽佩戴检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210977122.0 (22)申请日 2022.08.15 (71)申请人艾迪恩（山东）科技有限公司地址 264000 山东省烟台市芝罘区港城西大街69号B座6楼申请人西南交通大学烟台新一代信息技术研究院 (72)发明人郑狄　李晶　姚涛　闫连山　蒲桂东　 (74)专利代理机构烟台双联专利事务所(普通合伙) 37225 专利代理师矫智兰 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/774(2022.01)G06V 10/80(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于改进YOLOV5模型的工地安全帽佩戴检测方法 (57)摘要本发明公开了一种基于改进YOLOV5模型的工地安全帽佩戴检测方法，基于单阶段原始的 YOLOV5目标检测模型，通过优化网络结构降低最小感受野，利用池化金字塔及注意力机制等手段规范输入尺寸，模糊背景差异，增强小目标学习能力，本发明所提出的方法在基准网络基础上只增加了少量参数及计算开销，并显著提升了小目标检测效果，克服原始YOLOV 5目标检测模型小目标场景检测性能较低的缺点，改进后的YOLOV 5模型能够在施工场景下的安全帽检测任务中有着优异的检测表现，在同一场景下比原始YOLOV 5网络检测到更多正样本，提高了施工场景下安全帽佩戴检测的可靠性，降低漏检、误检的情况发生。权利要求书2页说明书6页附图4页 CN 115512387 A 2022.12.23 CN 115512387 A 1.基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤1、收集并划分数据集：收集开源数据集SHWD、 SHD及其他网络图片，制作所需数据集，将数据集划分为训练集、验证集和测试集；步骤2、对YOLOV5目标检测模型进行改进：通过在原始的YOLOV5目标检测模型基础上优化网路结构，得到改进后的YOLOV5模型；所述改进后的YOLOV5模型采用K‑Means++聚类算法实时计算锚框，加速模型收敛；采用Swin Tranformer Block作为Backbone高层语义提取网络，增强模型上下文特征提取能力；添加小目标检测层，降低网络最小感受野；特征融合部分融入SPPF特征融合金字塔，通过多层次的空间箱从不同的角度进行特征提取再聚合，提升算法对物体变形的鲁棒性；采用 Bottleneck Transformer优化特征融合部分的卷积层，增强网络特征融合能力；采用 Shuffle Attention作为注意力机制更新特征矩阵，增强小目标特征表达能力；步骤3、利用改进后的YOLOV5模型进行训练：将所述步骤1数据集中的训练集送入改进后的YOLOV5模型进行训练，并保存训练过程中改进后的YOLOV5模型在验证集上检测准确率最高的权重参数，并将权重文件命名为 best.pt；步骤4、利用改进后的YOLOV5模型进行检测：加载步骤3所述权重文件best.pt至改进后的YOLOV5模型中，并将测试集图像输入改进后的YOLOV5模型，得到该模型在测试集上的检测结果，检测到的结果分为两部分，包含施工场景下佩戴的安全帽与未佩戴安全帽的头部。 2.根据权利要求1所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于，对于步骤1中的数据集为图片及文本文件格式的锚框坐标，数据集类别分为安全帽和头部两类。 3.根据权利要求2所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤2中，所述的添加小目标检测层，是在原始的YOLOV5目标检测模型的三个尺度输出的基础上添加降低感受野的检测尺度，使改进后的Y OLOV5模型在四种尺度上预测检测目标的边界框；在改进后的Y OLOV5模型的检测头中，每个尺度都输出一个三维预测张量；预测张量中的编码信息包含：预测框的位置信息、待检测目标的置信度、预测框中包含的目标类别；所述预测框中包含的目标类别分为佩戴的安全帽及未佩戴安全帽的头部；在改进后的YOLOV5模型的检测部分中，对于尺度大小为N ×N的特征图，改进后的 YOLOV5模型产生的预测张量大小为N ×N×[4*(1+4+2)]，其中第一个4代表改进后的YOLOV5 模型有四个预测头，对应四个尺度的张量， 1代表置信度的预测，第二个4代表预测框位置信息， 2代表目标类别为两个类。 4.根据权利要求3所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤2所述的Swin Transformer Block是基于滑动窗口机制新视觉网络，其通过移位窗口将自注意力的计算限制在非重叠的局部窗口内，同时考虑跨窗口连接，通过相邻窗口合并扩大窗口感受野，利用移位窗口划分方法， Sw in变换块被计算为：权　利　要　求　书 1/2 页 2 CN 115512387 A 2 （1）（2）（3）（4）其中代表块的W ‑MSA模块的输入特征，和、和分别表示块的（S） W ‑ MSA模块和MLP模块的输出特征； W ‑MSA和SW‑MSA分别表示使用规则和移位窗口划分配置的基于窗口的多头部自注意； L N表示LayerNorm层。 5.根据权利要求4所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤2所述的Bottleneck Transformer属于Hybrid network，其将CNN与Tran sformer结合起来处理对输入图像尺寸要求较高的视觉任务。 6.根据权利要求5所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤2所述的Shuffle Attention是多分支结构的置换注意力机制，其利用组卷积高效结合通道注意力与空间注意力。 7.根据权利要求6所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤3中，将训练集的输入图像尺寸限制为M ×M，使用批量大小为8的小批量随机梯度下降法对损失函数进行优化，通过遗传算法进行超参数训练，训练120代后初始学习率设置为 0.01013，动量设置为0.98；在训练过程中使用余弦退火的方法来调整学习率，从而加速模型收敛至全局最优；训练过程中，验证集用于对模型的训练情况进行反馈，当模型在验证集上检测的准确率最高时，保存模型的权重参数至权重文件best.pt 。 8.根据权利要求7所述的基于改进YOLOV5模型的工地安全帽佩戴检测方法，其特征在于：步骤4中，使用非极大值抑制方法对测试集中的检测结果进行筛选，其中对于检测到的安全帽，使用绿色的框将其框出；对于检测到的头部，使用红色框进行框出。权　利　要　求　书 2/2 页 3 CN 115512387 A 3

专利 基于改进YOLOV5模型的工地安全帽佩戴检测方法

专利基于改进YOLOV5模型的工地安全帽佩戴检测方法