全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211005938.3 (22)申请日 2022.08.22 (71)申请人 重庆科技学院 地址 401331 重庆市沙坪坝区大 学城东路 20号 (72)发明人 周伟 肖亿 郑黎 漆仲黎  赵怡恒 易军 黄河 刘洪 赵猛  (74)专利代理 机构 重庆蕴博君晟知识产权代理 事务所(普通 合伙) 50223 专利代理师 王玉芝 (51)Int.Cl. G06V 20/64(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01)G06V 10/40(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于深度学习的三维物体识别方法 (57)摘要 本发明提供一种可用于三维物体识别方法, 首先通过采集三维物体数据, 同时加入三维物体 识别的公共 数据作为数据集, 通过反射模型渲染 图像,映射为均匀水平方向上的2D图像序列, 然 后对2D图像序列使用数据增强, 将预处理后的 图 像输入到ResNeXt分类网络, 利用ResNeXt的前22 层提取语义特征, 并对语义特征进行最大化操作 获得全局混合特征, 通过注意力扩展模块提取全 局混合特征特征。 另外, 利用带标签平滑的分类 模块来分类特 征。 权利要求书2页 说明书4页 附图2页 CN 115359475 A 2022.11.18 CN 115359475 A 1.基于深度学习的三维物体识别方法, 其特 征在于, 包括以下步骤: S1: 采集三维物体数据, 同时加入三维物体识别的公共数据作为数据集; S2: 通过反射模型渲染图像,将三维物体数据映射 为均匀水平方向上的二维图像序列; S3: 对二维图像序列使用数据增强, 随机色彩扰动和水平旋转的策略可以增加训练集 的丰富性和网络模型 的泛化性, 并且计算二维 图像的标准差和平均值, 并将其应用于训练 数据, 以此来加快网络的收敛速度; S4: 搭建多尺度扩展卷积网络对三维物体进行识别, 使用ResNeXt作为主干网络, 在前 22个卷积层中提取语义信息, 再将最大化操作得到的混合语义特征输入到注意力扩展模 块, 提取更大的感受野特征, 增强各个视图的上下文信息, 然后使用ResNeXt剩下的卷积层 作为特征解码器; S5: 在训练时, 使用标签平滑方法, 标签平滑方法可以将硬标签转换为软标签, 以防止 模型在训练过程中过度信任真实标签, 从而提高模型对未知数据的泛化能力。 2.根据权利要求1所述基于深度 学习的三维物体识别方法, 其特征在于步骤S2所述, 通 过反射模型渲染图像,映射 为均匀水平方向上的2D图像序列, 其具体步骤如下: S21:将虚拟相机的分辨率设置为固定尺寸, 图像的背景设置为固定颜色, 同时虚拟相 机垂直于Z轴的水平面上, 这样能够得到三维形状的正 面视图; S22: 由于没有关于形状直立方向一致的假设, 选择从0 °到360°每隔一定的角度放置一 个虚拟相机, 从更多的角度来呈现三维形状, 多个虚拟相机在多角度拍摄产生良好的视图。 3.根据权利要求1所述基于深度 学习的三维物体识别方法, 其特征在于步骤S4所述, 搭 建多尺度扩展卷积网络对三维物体进行识别, 其具体步骤如下: S41:通过ResNeXt网络 的前22个卷积层来提取不 同角度视图的语义特征, 然后输出各 个视图的特征映射集, 采用元素最大化运算来提取全局特征融合最大值, 利用特征映射集 在宽高维度上的优势, 具有强大表达能力的膨胀卷积可以进一步挖掘和细化特征映射集的 潜在关系; S42:搭建注意力模块, 先采用1 ×1卷积层将通道维数降低到二分之一, 减少卷积的计 算量; 然后再使用膨胀卷积提取全局感受野特征并细化语义上下文, 膨胀卷积可以从全局 特征中提取丰富的上下文信息, 但它将伴随着巨大的特征冗余; 为此, 在膨胀卷积模块中引 入注意力机制, 专注于消除特征冗余的负面影响, 确保空间维度的关注区域, 同时关注重要 的特征通道; 最后, 使用1 ×1卷积层恢复通道数; S43:串联注意力模块组成注意力扩展模块, 对于注意力扩展模块的通道注意力部分, 对输入特征应用Max  pooling操作和Avg  pooling操作以获得两个具有丰富特征的描述, 计 算结果表示为 和 然后将 和 分别输入 到共享多层 感知器中, 生成通道注意力图 (C为通道数), 带一个隐藏层,MLP第一层中的 神经元数设置为使用通道数计算的值, 以减少计算量, 将共享网络应用于每个描述符后, 使 用元素求和对输出 特征向量进行积分, M c(F)由以下 所示: 其中σ 表示Sigmo id函数;权 利 要 求 书 1/2 页 2 CN 115359475 A 2将 和 两个描述符连接起来以生成有效的特征F,然后 应用核大小为K的卷积层来 生成空间注意图Ms(F)∈RW×H, 即 最后, 为了使注意力扩展模块的输出特征覆盖各种尺度上的所有语义特征, 对输入和F 进行了残差运 算, 即输入和F之间的向量相加; S44:使用ResNeXt网络的剩下的卷积层作为注意力扩展模块的解码器, 提升特征分类 能力; 同时使用自适应平均池化将解码器输出 的空间维度进行压缩, 抑制无效信息对分类 结果的影响。权 利 要 求 书 2/2 页 3 CN 115359475 A 3

.PDF文档 专利 基于深度学习的三维物体识别方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度学习的三维物体识别方法 第 1 页 专利 基于深度学习的三维物体识别方法 第 2 页 专利 基于深度学习的三维物体识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:15:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。