专利一种基于视觉智能的中考实验评分方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210893505.X (22)申请日 2022.07.27 (71)申请人上海大风实验室设备有限公司地址 201617 上海市松江区玉佳西路6 6号- 2 (72)发明人孙可芯　张朋　张洁　 (74)专利代理机构深圳运赢知识产权代理事务所(普通合伙) 44771 专利代理师王倩斐 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/764(2022.01) G06V 10/77(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) (54)发明名称一种基于视觉智能的中考实验评分方法 (57)摘要本申请涉及一种基于视觉智能的中考实验评分方法，属于计算机视觉和智慧教育领域，本申请可实现计算机快速准确地评判考试实验操作的得分，针对实验场景的检测难点，发明了基于Yolo v3改进的G ‑Yolo v3智能目标检测模型；首先，通过使用密集残差网络替代原始Yolo v3 的深度残差网络进行特征提取，解决了特征传递过程中梯度消失的问题；其次，通过对原始模型增加特征提取尺度，加强了局部细节和全局信息的联系与学习；最后，使用GHM ‑CLoss函数替换 Yolo v3的交叉熵损失函数计算模型的分类损失，解决了数据集难易样本不均衡的问题。该模型在速度和检测精度方面达到了很好的平衡，降低错检以及漏检的情况，适用于中考实验场景的实时高精度检测。权利要求书2页说明书7页附图7页 CN 115424005 A 2022.12.02 CN 115424005 A 1.一种基于视觉智能的中考实验评分方法，其特征在于，包括如下步骤：步骤1：划分实验步骤，形成评分机制，确定得分点并找出对应关键判断特征；步骤2：采集每个关键特征对应的图像，制作图像集；步骤3：对图像集中的图片进行预处理以及数据增强，扩大图像集容量；步骤4：遍历图像集，使用图像标注软件对每张图像中的关键得分特征进行标注，将标注目标的位置和类别信息保存起来，制得数据集并划分为实验图像训练集和测试集；步骤5：以Yo lo v3模型为基础，构建视觉智能检测模型G ‑Yolo v3模型；步骤6：采用聚类算法对制作的数据集中的目标框的高和宽进行聚类，获得更适合的先验框尺寸；步骤7：使用实验图像训练集对视觉检测模型G ‑Yolo v3进行训练，训练周期共300代，得到最终的模型；步骤8：使用实验图像测试集对视觉检测模型G ‑Yolo v3进行性能测试；步骤9：将改进后的视觉检测模型G ‑Yolo v3与原始Yolo v3进行性能对比；步骤10：使用摄像头拍摄学生实验考试过程，通过视觉检测模型G ‑Yolo v3识别关键得分特征并反馈位置信息；步骤11：根据实验得分要求和视觉检测模型G ‑Yolo v3反馈的关键特征类别及位置信息，通过已建立的评分机制对考生判断得分。 2.根据权利要求1所述的一种基于视觉智能的中考实验评分方法，其特征在于，步骤1 中形成评分机制的具体方法为：评分机制分为静态单目标检测和动态多目标组合识别两种判定方式，静态单目标检测是指视野内出现关键特征即判定得分；动态多目标组合识别则是视野内同时出现多个关键特征，通过视觉检测模型G‑Yolo v3反馈其相对位置关系并计算判断是否符合要求，从而判定得分。 3.根据权利要求2所述的一种基于视觉智能的中考实验评分方法，其特征在于，所述步骤5中构建 G‑Yolo v3模型的方法为： S51、构建G ‑Yolo v3模型的特征提取层，使用密集卷积网络DenseNet替代原始 Darknet‑53的深度残差网络ResNet； S52、构建G ‑Yolo v3模型的检测输出层，在原始Yolo v3检测输出层上增加第四个特征提取尺度； S53、构建G ‑Yolo v3模型的损失函数，具体为使用GHM ‑CLoss函数计算模型的分类损失，替换原始Yolo v3的二值交叉熵损失计算方式。 4.根据权利要求3所述的一种基于视觉智能的中考实验评分方法，其特征在于，所述步骤5中构建 G‑Yolo v3模型的方法为： S51的步骤为：使用Dense层替代原始Yolo v3的Residual层，通过直接连接所有非线性变换层，并使每一残差层拼接之前所有层的输入，而后传递输出的特征给之后的所有层，加强特征的融合与传递； S52的步骤为：对Yolo v3原始52x52尺度层融合后的特征连接上采样层；权　利　要　求　书 1/2 页 2 CN 115424005 A 2与浅层网络特征拼接，形成第4个特征尺度，输出的特征尺度由52x52提升至104x104；通过route层将第109层与特征提取网络的第1 1层特征进行特征融合； S53中损失函数计算公式为：式中p为模型输出类别概率、 p*是真实值标签，取值为0或1、系数βi由样本的梯度密度确定、 LCE为二值交叉熵损失函数，计算公式如下： LCE＝‑[p*log(p)+(1 ‑p*)log(1‑p)]， psigmo id(x)。 5.根据权利要求4所述的一种基于视觉智能的中考实验评分方法，其特征在于，所述步骤6中采用聚类算法对制作的数据集目标框重聚类的具体方法为：读取已标注好的数据集，随机取出其中一个图片的宽度和高度值形成坐标点并作为初始聚类中心，再使用K ‑means算法聚类出十二个avg IOU （样本框与anchors boxs的交并比平均值）最高值对应的先验框尺寸。 6.根据权利要求5所述的一种基于视觉智能的中考实验评分方法，其特征在于，所述步骤7中训练模型的具体方法为：训练的样本批尺寸设定为16，每10次迭代更新1次权重，训练共200个迭代周期，训练的初始学习率设为0.0 01，学习率调整采用epoc h‑decay策略，随迭代周期下降。 7.根据权利要求6所述的一种基于视觉智能的中考实验评分方法，其特征在于，所述步骤9中模型性能对比的具体步骤为：采用平均精度均值mAP，识别速度作为性能评价指标，观察测试集上两种模型的整体检测能力；观察两种模型在同一测试集下的PR曲线；对比在复杂图像上两种模型的目标检测情况，对比复杂特征类别测试的具体mAP值，进一步比较模型的检测性能。 8.根据权利要求7所述的一种基于视觉智能的中考实验评分方法，其特征在于，还包括记录学生实验规范以及不规范的图像，将实验规范的图片制作成规范图集，将实验不规范的图片制作成不规范图集。 9.根据权利要求8所述的一种基于视觉智能的中考实验评分方法，其特征在于，将规范图集以及不规范图集发生给老师以及学生的智能终端。 10.根据权利要求9所述的一种基于视觉智能的中考实验评分方法，其特征在于，所述智能终端至少为手机、笔记本电脑或平板电脑中的一种。权　利　要　求　书 2/2 页 3 CN 115424005 A 3

专利 一种基于视觉智能的中考实验评分方法

专利一种基于视觉智能的中考实验评分方法