全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211050886.1 (22)申请日 2022.08.29 (71)申请人 安徽大学 地址 230601 安徽省合肥市经开区九龙路 111号 (72)发明人 刘政怡 檀亚诚 吴伟 张广辉  (51)Int.Cl. G06V 10/80(2022.01) G06V 10/52(2022.01) G06V 10/82(2022.01) (54)发明名称 面向Transformer的多尺度特 征增强模块 (57)摘要 本发明公开了一种面向Tran sformer的多尺 度特征增强模块, 包括以下步骤: 基于原始的特 征块序列构造一条Transformer路径; 对原始的 特征块序列进行不同级别的块合并, 构造多条带 残差的Transformer路径; 对所述S1和S2产生的 结果进行级联, 降维, 产生增强的特征块序列; 所 述模块通过不同级别的块合并, 形成不同尺度的 块序列, 由多条Transformer路径增强特征感知 尺度的能力。 权利要求书1页 说明书2页 附图1页 CN 115359331 A 2022.11.18 CN 115359331 A 1.本发明面向Transformer的多尺度特 征增强模块, 包括以下步骤: S1、 基于原 始的特征块序列构造一条Transformer路径; S2、 对原始的特征块序列进行不同级别的块合并, 构造多条带残差的Transformer路 径; S3、 对所述S1和S2产生的结果进行级联, 降维, 产生增强的特 征块序列。 2.根据权利要求1所述的面向Transformer的多尺度特征增强模块, 其特征在于, 在所 述步骤S1中, 假设原始的特征块序列表示为f=[t1,t2, …,tn], 构造的Transformer路径表 示为: F=Trans(f) 其中, Trans( ·)表示一个Transformer块, 有两个多头自注意力层构成。 3.根据权利要求1所述的面向Transformer的多尺度特征增强模块, 其特征在于, 在所 述步骤S2中, 对原始的特征块序列进行不同级别的块合并, 构造多条带残差的Transformer 路径; 具体表示 为: Fi=MLP(Reshape(FC(Trans(Mergei(f))))+f) 其中, Mergei(·)表示第i种合并方法, i从1到m, m表示带残 差的Transformer路径总数; FC(·)表示全连接层, Reshape( ·)表示变形操作, MLP( ·)表示多层感知机, “+”表示通道 级联操作。 4.根据权利要求1所述的面向Transformer的多尺度特征增强模块, 其特征在于, 在所 述步骤S3中, 对所述S1和S2产生的结果进行级联, 降维, 产生增强的特 征块序列Ffinal。 权 利 要 求 书 1/1 页 2 CN 115359331 A 2面向Transformer的多尺度特征增强模块 技术领域 [0001]本发明涉及计算机视觉领域, 特别是涉及一种面向Transformer的多尺度特征增 强模块。 背景技术 [0002]在图像处理中, 因物体的大小不一, 所以多尺度问题是很多计算机视觉任务都必 须要解决的问题, 如目标检测、 图像 分割、 人群计数等。 DeepLab中提出的多尺度空洞空间金 字塔池化Atrous  Spatial Pyramid Pooling(ASPP)模块使用具有不同采样率的多个并行 空洞卷积层获取多尺度物体信息。 受此启发, 本发明意在提出一种即插即用的面向 Transformer的多尺度特 征增强模块。 发明内容 [0003]本发明所需要解决的技术问题 是提供一种面向Transformer的多尺度特征增强模 块, 通过不同级别的块合并, 形成不同尺度的块序列, 由多条Tr ansformer路径增强特征感 知尺度的能力。 [0004]本发明具体采用的技 术方案如下: [0005]本发明面向Transformer的多尺度特 征增强模块包括以下步骤: [0006]S1、 基于原 始的特征块序列构造一条Transformer路径; [0007]S2、 对原始的特征块序列进行不同级别的块合并, 构造多条带残差的Transformer 路径; [0008]S3、 对所述S1和S2产生的结果进行级联, 降维, 产生增强的特 征块序列。 [0009]进一步地, 在所述步骤S1中, 假设原始的特征块序列 表示为f=[t1,t2, …,tn], 构 造的Transformer路径 表示为: [0010]F=Trans(f) [0011]其中, Trans( ·)表示一个Transformer块, 有两个多头自注意力层构成; [0012]进一步地, 在所述步骤S2中, 对原始的特征块序列 进行不同级别的块合并, 构造多 条带残差的Transformer路径; 具体表示 为: [0013]Fi=MLP(Reshape(FC(Trans(Mergei(f))))+f) [0014]其中, Mergei(·)表示第i种块合 并方法, i从1到m, m表示带残差的Trans former路 径总数; FC( ·)表示全连接层, Reshape( ·)表示变形操作, MLP( ·)表示多层感知机, “+”表 示通道级联操作; [0015]进一步地, 在所述步骤S3中, 对所述S1和S2产生 的结果进行级联, 降维, 产生增强 的特征块序列Ffinal。 [0016] [0017]与已有技 术相比, 本发明有益效果体现在:说 明 书 1/2 页 3 CN 115359331 A 3

.PDF文档 专利 面向Transformer的多尺度特征增强模块

文档预览
中文文档 5 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向Transformer的多尺度特征增强模块 第 1 页 专利 面向Transformer的多尺度特征增强模块 第 2 页 专利 面向Transformer的多尺度特征增强模块 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:17:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。