全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211044480.2 (22)申请日 2022.08.30 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 街道八一路2 99号 (72)发明人 郑先伟 宦麟茜 岳林蔚 吴秀杰  熊汉江  (74)专利代理 机构 武汉科皓知识产权代理事务 所(特殊普通 合伙) 42222 专利代理师 严彦 (51)Int.Cl. G06V 20/00(2022.01) G06V 10/26(2022.01) G06V 10/30(2022.01) G06V 10/88(2022.01)G06V 10/82(2022.01) G06V 10/54(2022.01) G06V 10/56(2022.01) G06V 10/80(2022.01) (54)发明名称 基于聚集指导学习机制的室内RGB-D语义分 割方法及系统 (57)摘要 本发明提供一种基于聚集指导学习机制的 室内RGB‑D语义分割方法及系统, 设置跨模态聚 集指导机制的融合模块, 通过自适应模态校准的 方式实现互补信息的提取与融合, 保留有利于分 割任务的特征并抑制冗余的噪音信息; 所述跨模 态聚集指导融合模块由一个特征聚集编码器和 一个特征指导器构成, 所述特征聚集编码器, 用 于挖掘RGB ‑D的互补特征, 包括先利用区域自适 应池化操作高度概括模态间高层语义特征, 再通 过门控融合模块有选择地融合两组全局描述算 子从而生成一组跨模态的描述算子, 该描述算子 包含了RGB和深度数据有利的互补信息; 所述特 征指导器, 用于根据由跨模态 算子生成的通道权 重指导向量对RGB特 征响应进行矫 正优化。 权利要求书2页 说明书5页 附图2页 CN 115546616 A 2022.12.30 CN 115546616 A 1.一种基于聚集指导学习机制的室内RGB ‑D语义分割方法, 其特征在于: 设置跨模态聚 集指导机制的融合模块, 通过自适应模态校准的方式实现互补信息的提取与融合, 保留有 利于分割任务的特征并抑制冗余的噪音信息; 所述跨模态聚集指导融合模块由一个特征聚 集编码器和一个特 征指导器构成, 所述特征聚集编码器, 用于挖掘RGB ‑D的互补特征, 包括先利用区域自适应池化操作高 度概括模态间高层语义特征, 再通过门控融合模块有选择地融合两组全局描述算子从而生 成一组跨模态的描述 算子, 该描述 算子包含了RGB和深度数据有利的互补信息; 所述特征指导器, 用于根据由跨模态算子生成的通道权重指导向量对RGB特征响应进 行矫正优化。 2.根据权利要求1所述基于聚集指导学习机制的室内RGB ‑D语义分割方法, 其特征在 于: RGB输入与深度数据HHA输入分别 经双分支编码器结构后, 输入跨模态聚集指导机制的 融合模块, 特征聚集编码器中首先采用区域 自适应池化操作, 分别对RGB特征与HHA特征进 行全局语义压缩, 然后输入门控融合模块。 3.根据权利要求2所述基于聚集指导学习机制的室内RGB ‑D语义分割方法, 其特征在 于: 区域自适应池化操作实现方式为, 首先对输入特征X做1 ×1卷积操作, 增强给定输入特征的表达层次, 随后利用空间池化 金字塔模块丰富多尺度上下文信息特征得到特征映射Y, 再经过softmax激活函数保留最显 著的区域, 同时平滑特征图中弱响应和有噪音的区域, 进而生成权重图, 记为语义区域映射 图B; 对输入特 征X通过1×1卷积操作进行降维, 得到降维结果A, 对于降维结果A中的每个特征图, 通过应用B计算一个n维的全局描述算子用来表示全 局信息, 计算 得到全局描述算子向量gl; 全局描述算子向量gl中的数值表现A是否在B所呈 现 的语义区域中包 含有效信息 。 4.根据权利要求2所述基于聚集指导学习机制的室内RGB ‑D语义分割方法, 其特征在 于: 门控融合模块的实现方式为, 记Grgb和Gdep分别是由RGB特征和深度特征生成的全局描述算子, 而Gfus是两个全局描述 算子拼接在一 起的结果; 将Gfus经过一个1 ×1卷积操作和sigmoid函数后, 得到两种全局描述算子的贡献度权 值, 分别记为 W,1‑W, 进而得到门控融合表达式如下, 上式中⊙为哈达玛乘积操作, 与 分别表示经过贡献度权重过滤后的RGB全局 描述算子和深度全局描述 算子, 而 为最终生成的跨模态全局描述 算子。 5.根据权利要求1或2或3或4所述基于聚集指导学习机制的室内RGB ‑D语义分割方法, 其特征在于: 特 征指导器实现方式如下, 首先对跨模态全局描述算子 利用加权平均操作压缩为一组全局向量v, 然后经过一个 1×1卷积操作构建非线性交互, 再利用激活函数sigmoid将全局向量的数值映射到(0,1)的 范围得到通道权值向量 Wguide;权 利 要 求 书 1/2 页 2 CN 115546616 A 2得到Wguide之后通过门控机制对RGB特征相应的降维结果A进行过滤增强, 使得RGB特征 的语义表现更加集中在语义分割任务上; 特征指导器所 得过滤结果经解码器与原 始RGB特征图相融合。 6.一种基于聚集指导学习机制的室内RGB ‑D语义分割系统, 其特征在于: 用于实现如权 利要求1‑5任一项所述的一种基于聚集指导学习机制的室内RGB ‑D语义分割方法。 7.根据权利要求6所述基于聚集指导学习机制的室内RGB ‑D语义分割系统, 其特征在 于: 包括处理器和存储器, 存储器用于存储程序指 令, 处理器用于调用存储器中的存储指 令 执行如权利要求1 ‑5任一项所述的一种基于聚集指导学习机制的室内RGB ‑D语义分割方法。 8.根据权利要求6所述基于聚集指导学习机制的室内RGB ‑D语义分割系统, 其特征在 于: 包括可读存储介质, 所述可读存储介质上存储有计算机程序, 所述计算机程序执行时, 实现如权利要求1 ‑5任一项所述的一种基于聚集指导学习机制的室内RGB ‑D语义分割方法。权 利 要 求 书 2/2 页 3 CN 115546616 A 3

.PDF文档 专利 基于聚集指导学习机制的室内RGB-D语义分割方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于聚集指导学习机制的室内RGB-D语义分割方法及系统 第 1 页 专利 基于聚集指导学习机制的室内RGB-D语义分割方法及系统 第 2 页 专利 基于聚集指导学习机制的室内RGB-D语义分割方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:15:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。