专利基于可靠性评估和迭代学习的细粒度图像识别方法和装置

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210953125.0 (22)申请日 2022.08.10 (65)同一申请的已公布的文献号申请公布号 CN 115035389 A (43)申请公布日 2022.09.09 (73)专利权人华东交通大学地址 330013 江西省南昌市经济技术开发区双港东大街808号 (72)发明人余鹰　汤洪　钱进　蔡震　朱志亮　 (74)专利代理机构南昌市平凡知识产权代理事务所 36122 专利代理师姚伯川 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/774(2022.01) G06N 3/08(2006.01)(56)对比文件 CN 111985572 A,2020.1 1.24 CN 110929802 A,2020.0 3.27 CN 114417048 A,202 2.04.29 CN 113159067 A,2021.07.23 CN 114463676 A,202 2.05.10 CN 113128593 A,2021.07.16 CN 114119979 A,202 2.03.01 CN 114626476 A,202 2.06.14 CN 114299343 A,202 2.04.08 US 201613275 0 A1,2016.0 5.12 贺南南等.多层次细粒度特征三分支网络行人重识别方法. 《太原科技大学学报》 .2021,第 42卷(第5期), 余鹰等.基于改进卷积神经网络的多标记分类算法. 《智能系统学报》 .2019,第14卷(第3 期), (续) 审查员范园园 (54)发明名称基于可靠性评估和迭代学习的细粒度图像识别方法和装置 (57)摘要一种基于可靠性评估和迭代学习的细粒度图像识别方法和装置，所述方法收集细粒度图像，构建细粒度图像数据集，改进得到PST模型；将图像数据张量输入到PST模型中前向传播，进行迭代学习训练，并反向传播更新PS T模型参数；将加载模型推理所用到的图像，转换成图像数据张量；将图像数据张量和标签张量输入到PST模型进行前向传播，得到三轮迭代输出；经过 SoftPLUS激活函数层处理得到证据；再将三轮迭代的输出经处理得到的三种证据进行相加融合，得到融合证据：通过计算融合证据下的不确定性，实现量化识别结果的不确定性；找出概率分配最大值索引，得到识别结果。本发明适用于智慧农业、智能交通、生态系统保护等领域。 [转续页] 权利要求书3页说明书8页附图3页 CN 115035389 B 2022.10.25 CN 115035389 B (56)对比文件 Jianqiu C hen 等.Weak ly Supervised Leaming of Discrimi native F eatures for Fine-Grained Visual Categorizati on. 《2020 Internati onal Conference o n Big Data, Artificial I ntelligence and I nternet of Things Engi neering (ICBAIE)》 .2020,2/2 页 2[接上页] CN 115035389 B1.一种基于可靠性评估和迭代学习的细粒度图像识别方法，其特征在于，所述方法收集细粒度图像并给定标签，构建细粒度图像数据集，并基于Swin Transformer网络模型，改进设计得到PST模型；将图像数据张量输入到PST模型中进行前向传播，进行迭代学习训练，并反向传播更新PST模型参数；将加载模型推理所用到的图像，对其进行大小改变、中心裁剪、像素归一化操作，转换成图像数据张量；将图像数据张量和标签张量输入到PST模型中进行前向传播，从第二Stage模块、第三Stage模块、第四Stage模块后经对应MLP层分别得到第一轮迭代、第二轮迭代、第三轮迭代的输出；经过SoftPLUS层处理得到证据；再将三轮迭代的输出经处理得到的三种证据进行相加融合得到融合证据：计算融合证据下的不确定性；通过计算融合证据下的不确定性，实现量化识别结果的不确定性；遍历向量找出概率分配最大值索引，得到识别结果；所述方法步骤如下： S1、收集细粒度图像并给定标签，构建细粒度图像数据集，式中，下标表示数据集中图像的索引号，为数据集中图像的数量；表示数据集中第i张图像，表示数据集中第i张图像的标签； S2、基于Swin Transformer模型，保留Patch Embedding模块，然后将第二St age模块、第三Stage模块和第四Sta ge模块分别接上MLP层，改进设计得到P ST模型； S3、将细粒度图像数据集中的图像分批取出，对某一批次图像进行大小改变、随机裁剪、像素归一化操作，转换成图像数据张量；其中，表示数据集某一批次中第m张图像；表示数据集某一批次中第m张图像的标签；下标m表示某一批次中图像的索引号， B表示批次图像数量；的上标1表示为第1轮迭代，并将标签转换成张量，为一个1×C的向量， C为类别数； S4、将 S3得到的图像数据张量输入到PST模型中进行前向传播，从第二Stage模块后经对应 M L P 层进行输出，得到第一轮迭代的输出，其表达式为：；其中，为一个1×C的向量， C为类别数； stage1为第一阶段； stage2为第二阶段；为切片嵌入； S5、根据和标签张量计算交叉熵损失，其计算公式为：其中，为标签张量one ‑hot编码中第i个位置的编码值；为第一轮迭代的输出中第 i个位置的编码值； C为类别数；然后通过损失值计算当前梯度，反向传播更新P ST模型参数，至此第一轮迭代完毕；权　利　要　求　书 1/3 页 2 CN 115035389 B 3

专利 基于可靠性评估和迭代学习的细粒度图像识别方法和装置

专利基于可靠性评估和迭代学习的细粒度图像识别方法和装置