全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210908356.X (22)申请日 2022.07.29 (71)申请人 南昌航空大 学 地址 330063 江西省南昌市丰和南大道696 号 (72)发明人 张聪炫 陈立志 卢锋 葛利跃  汪洋 陈震 李楠  (74)专利代理 机构 南昌市平凡知识产权代理事 务所 36122 专利代理师 张文杰 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 基于特征提取和RFB上下文信息优化的图像 语义分割方法 (57)摘要 一种基于特征提取和RFB上下文信息优化的 图像语义分割方法: 首先输入图像到Swin   Transformer特征提取网络, 分别输出包含深层 语义信息的特征图和包含浅层语义信息的特征 图; 然后将包含深层语义信息的特征图和包含浅 层语义信息的特征图分别输入到不同深度的RFB 模块进行上下文信息优化, 得到两个含有更丰富 上下文信息的特征图; 对RFB模块优化后的两个 特征图进行拼接融合, 再将融合后的特征图进行 双线性插值上采样处理, 随后将结果输入到解码 网络, 得到最终图像语义分割结果。 本发明利用 Swin Transformer模块不仅能提取图像的深层 和浅层语义特征, 同时结合RFB上下文信息优化 模块, 提高语义分割精度。 权利要求书1页 说明书4页 附图4页 CN 115205532 A 2022.10.18 CN 115205532 A 1.一种基于特征提取和RFB上下文信 息优化的图像语义分割方法, 其特征在于, 包括以 下步骤: 步骤1、 输入大小为H ×W的RGB图像; 步骤2、 将图像输入到Swin  Transformer特征提取模块, 分别输出包含深层语义信息的 特征图和包 含浅层语义信息的特 征图; 步骤3、 将包含深层语义信息的特征图和包含浅层语义信息的特征图分别输入到不同 深度的RFB模块进行 上下文信息优化, 得到 两个含有更丰富上 下文信息的特 征图; 步骤4、 对RFB模块优化后的两个特 征图进行拼接融合, 随后将结果输入到解码网络; 步骤5、 将融合后的特征图进行双线性插值上采样, 通过交叉熵损失约束迭代优化后输 出最终的分割结果。 2.如权利要求1所述的方法, 其特征在于: 所述步骤2首先对输入图像分别进行窗口切 分和块切分操作, 将每个图像块会被当作一个待处理对 象, 紧接着将图像输入一个线性特 征长度编码层, 将处理好的特征图传入Swin  Transformer  模块, 并对每个窗口做自注意力 计算。 3.如权利要求2所述的方法, 其特征在于: 所述步骤3经Swin  Transformer模块提取得 到特征图, 将最终得到的特征图和Swin  Transformer中1/4分辨率特征图分别送入不同的 RFB上下文信息模块, 1/4分辨率特征图采取更深的RFB模块, 最终得到的特征图采 取较浅的 RFB模块。权 利 要 求 书 1/1 页 2 CN 115205532 A 2基于特征提取和RF B上下文信息优化的图像语 义分割方 法 技术领域 [0001]本发明涉及一种基于特 征提取和RFB上 下文信息优化的图像 语义分割方法。 背景技术 [0002]图像语义分割技术是计算机视觉领域热点研究之一, 是图像推 理从粗粒度到细粒 度过程中一个自然的步骤, 当类似目标检测类的图像级任务所获得的推理结果达不到实际 要求时, 那么语义分割就是能提供更精细结果的选择。 语义分割本质是像素级别的图像分 类, 即对每一个像素点进 行分类判断, 从而提供更加丰富的图像信息。 语义分割技术被广泛 用于自动驾驶、 医疗影 像分析、 遥感影 像分析、 视频AI换脸 等众多领域。 [0003]目前, 现有的语义分割方法基本是基于深度学习方法展开研究的, 在具体实现精 度上也达到了较高的精度水平。 但是像素级的分类意 味着往往需要使用resnet101级别等 深层网络才能提取更好特征, 现有CNN网络受限于感受野往往全局特征提取能力不 强; 其次 分割领域现有方法对于感受野问题仍然 有待进一步改善。 [0004]针对现有问题, 引入基于Swin  Transformer特征提取和RFB上下文信息图像语义 分割方法, 旨在改善网络特征提取能力, 同时Swin  transformer和RFB相互耦合改善上下文 信息, 最终提升分割精度, 提高系统鲁棒 性。 发明内容 [0005]基于此, 本发明主要是解决现有语义分割技术特征提取不足和上下文信息不完善 的问题, 提出一种基于特征提取和RFB上下文信息优化的图像语义分割方法, 利用Swin   Transformer改善特征提取问题, 利用Swin  Transformer和RFB相互耦合改善上下文信息问 题, 最终提升图像 语义分割的精度。 [0006]本发明提供一种基于特征提取和RFB上下文信息优化的图像语义分割方法, 包括 以下步骤: [0007]步骤1、 输入大小为H ×W的RGB图像; [0008]步骤2、 将图像输入到Swin  Transformer特征提取模块, 分别输出包含深层语义信 息的特征图和包 含浅层语义信息的特 征图; [0009]步骤3、 将包含深层语义信息 的特征图和包含浅层语义信息 的特征图分别输入到 不同深度的RFB模块进行 上下文信息优化, 得到 两个含有更丰富上 下文信息的特 征图; [0010]步骤4、 对RFB模块优化后的两个特征图进行拼接融合, 随后将结果输入到解码网 络; [0011]步骤5、 将融合后的特征图进行双线性插值上采样, 通过交叉熵损失约束迭代优化 后输出最终的分割结果。 [0012]进一步的, 所述步骤2首先对输入图像分别进行窗口切分和块切分操作, 将每个图 像块会被当作一个待处理对 象, 紧接着将图像输入一个线性特征长度编码层, 将处理好的 特征图传入Sw in Transformer模块, 并对每 个窗口做自注意力计算。说 明 书 1/4 页 3 CN 115205532 A 3

.PDF文档 专利 基于特征提取和RFB上下文信息优化的图像语义分割方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于特征提取和RFB上下文信息优化的图像语义分割方法 第 1 页 专利 基于特征提取和RFB上下文信息优化的图像语义分割方法 第 2 页 专利 基于特征提取和RFB上下文信息优化的图像语义分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:15:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。