(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210953125.0
(22)申请日 2022.08.10
(65)同一申请的已公布的文献号
申请公布号 CN 115035389 A
(43)申请公布日 2022.09.09
(73)专利权人 华东交通大 学
地址 330013 江西省南昌市经济技 术开发
区双港东大街808号
(72)发明人 余鹰 汤洪 钱进 蔡震 朱志亮
(74)专利代理 机构 南昌市平凡知识产权代理事
务所 36122
专利代理师 姚伯川
(51)Int.Cl.
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06V 10/774(2022.01)
G06N 3/08(2006.01)(56)对比文件
CN 111985572 A,2020.1 1.24
CN 110929802 A,2020.0 3.27
CN 114417048 A,202 2.04.29
CN 113159067 A,2021.07.23
CN 114463676 A,202 2.05.10
CN 113128593 A,2021.07.16
CN 114119979 A,202 2.03.01
CN 114626476 A,202 2.06.14
CN 114299343 A,202 2.04.08
US 201613275 0 A1,2016.0 5.12
贺南南 等.多层次细粒度特 征三分支网络
行人重识别方法. 《太原科技大 学学报》 .2021,第
42卷(第5期),
余鹰 等.基 于改进卷积神经网络的多标记
分类算法. 《智能系统学报》 .2019,第14卷(第3
期), (续)
审查员 范园园
(54)发明名称
基于可靠性评估和迭代学习的细粒度图像
识别方法和装置
(57)摘要
一种基于可靠性评估和迭代学习的细粒度
图像识别方法和装置, 所述方法收集细粒度图
像, 构建细粒度图像数据集, 改进得到PST模型;
将图像数据张量输入到PST模型中前向传播, 进
行迭代学习训练, 并反向传播更新PS T模型参数;
将加载模型推理所用到的图像, 转换成图像数据
张量; 将图像数据张量和标签张量输入到PST模
型进行前向传播, 得到三轮迭代输出; 经过
SoftPLUS激活函数层处理得到证据
; 再将三轮
迭代的输出经处理得到的三种证据进行相加 融
合, 得到融合证据
: 通过计算融合证据下
的不确定性, 实现量化识别结果的不确定性; 找
出概率分配最大值索引, 得到识别结果。 本发明
适用于智慧农业、 智能交通、 生态系统保护等领
域。
[转续页]
权利要求书3页 说明书8页 附图3页
CN 115035389 B
2022.10.25
CN 115035389 B
(56)对比文件
Jianqiu C hen 等.Weak ly Supervised
Leaming of Discrimi native F eatures for
Fine-Grained Visual Categorizati on. 《2020 Internati onal Conference o n Big Data,
Artificial I ntelligence and I nternet of
Things Engi neering (ICBAIE)》 .2020,2/2 页
2[接上页]
CN 115035389 B1.一种基于可靠性评估和迭代学习的细粒度图像识别方法, 其特征在于, 所述方法收
集细粒度图像
并给定标签
, 构建细粒度图像数据集, 并基于Swin Transformer网络模
型, 改进设计得到PST模 型; 将图像数据张量输入到PST模 型中进行前向传播, 进 行迭代学习
训练, 并反向传播更新PST模型参数; 将加载模型推理所用到的图像
, 对其进行大小改
变、 中心裁剪、 像素归一化操作, 转换成图像数据张量
; 将图像数据张量
和标签张量
输入到PST模型中进行前向传播, 从第二Stage模块、 第三Stage模块、 第四Stage模块后
经对应MLP层分别得到第一轮迭代、 第二轮迭代、 第三轮迭代的输出; 经过SoftPLUS层 处理
得到证据
; 再将三轮迭代的输出经处理得到的三种证据进行相加融合得到融合证据
: 计算融合证据下的不确定性
; 通过计算融合证据下的不确定性, 实现量化识别结
果的不确定性; 遍历
向量找出概 率分配最大值索引, 得到识别结果;
所述方法步骤如下:
S1、 收集细粒度图像
并给定标签
, 构建细粒度图像数据集
, 式中,
下标
表示数据集中图像的索引号,
为数据集中图像的数量;
表示数据集中第i张图像,
表示数据集中第i张图像的标签;
S2、 基于Swin Transformer模型, 保留Patch Embedding模块, 然后将第二St age模块、
第三Stage模块和第四Sta ge模块分别接上MLP层, 改进设计得到P ST模型;
S3、 将细粒度图像数据集
中的图像分批取出, 对某一批次图像
进行大
小改变、 随机 裁剪、 像素归一 化操作, 转换成图像数据张量
;
其中,
表示数据集某一批次中第m张图像;
表示数据集某一批次中第m张图像的标
签; 下标m表示某一批次中图像的索引 号, B表示批次图像数量;
的上标1表示为第1轮迭
代, 并将标签
转换成张量
,
为一个1×C的向量, C为类别数;
S4、 将 S3得到的图像数据张量
输入到PST模型 中进行前向传 播, 从第二Stage模块后
经 对 应 M L P 层 进 行 输 出 ,得 到 第 一 轮 迭 代 的 输 出
,其 表 达 式 为 :
;
其中,
为一个1×C的向量, C为类别数; stage1为第一阶段; stage2为第二阶段;
为
切片嵌入;
S5、 根据
和标签张量
计算交叉熵损失
, 其计算公式为:
其中,
为标签张量one ‑hot编码中第i个位置的编码值;
为第一轮迭代的输出 中第
i个位置的编码值; C为类别数;
然后通过损失值计算当前梯度, 反向传播更新P ST模型参数, 至此第一轮迭代完毕;权 利 要 求 书 1/3 页
2
CN 115035389 B
3
专利 基于可靠性评估和迭代学习的细粒度图像识别方法和装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:14:27上传分享