全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210900359.9 (22)申请日 2022.07.28 (71)申请人 北京卫星信息 工程研究所 地址 100086 北京市海淀区知春路61号 (72)发明人 刘世烁 冯鹏铭 贺广均 符晗  常江 金世超 梁银川 邹同元  韩昱 车程安 张鹏  (74)专利代理 机构 北京谨诚君睿知识产权代理 事务所 (特殊普通合伙) 11538 专利代理师 延慧 (51)Int.Cl. G06V 20/10(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06N 5/04(2006.01) G06V 10/764(2022.01) G06V 10/77(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 基于知识蒸馏和图像重构的遥感影像模型 迁移方法 (57)摘要 本发明涉及一种基于知识蒸馏和图像重构 的遥感影像模型迁移方法, 包括: 在样本充足和 标注完整的数据集A中训练第一目标检测模型, 获得教师模 型; 利用知 识蒸馏对 所述教师模型进 行压缩, 获得学生模型, 并在样本不足的数据集B 中进行训练; 利用训练后的学生模 型对与所述数 据集B的数据类型相同的待测试数据进行判别, 获得第一判别结果; 重构所述待测试数据, 使所 述待测试数据与所述数据集A的数据类型相同, 利用所述教师模型对重构后的待测试数据进行 判别, 获得第二判别结果; 将所述第一判别结果 和所述第二判别结果的全 连接层进行加权融合, 获得用于判别所述待测试数据的第二目标检测 模型。 该方法可实现不同类型遥感影像的模型迁 移。 权利要求书2页 说明书6页 附图1页 CN 115019183 A 2022.09.06 CN 115019183 A 1.一种基于知识蒸馏和图像重构的遥感影 像模型迁移方法, 包括: 在样本充足和标注完整的数据集A中训练第一目标检测模型, 获得教师模型; 利用知识蒸馏对所述教师模型进行压缩, 获得学生模型, 并在样本不足的数据集B中进 行训练; 利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别, 获 得第一判别结果; 重构所述待测试数据, 使所述待测试数据与所述数据集A的数据类型相同, 利用所述教 师模型对重构后的待测试 数据进行判别, 获得第二判别结果; 将所述第一判别结果和所述第 二判别结果的全连接层进行加权融合, 获得用于判别所 述待测试 数据的第二目标检测模型。 2.根据权利要求1所述的方法, 其特征在于, 所述数据集A和所述数据集B分别包含不同 数据类型的遥感影 像。 3.根据权利要求1所述的方法, 其特征在于, 在样本充足和标注完整的数据集A中训练 第一目标检测模型, 获得教师模型, 包括: 判断所述数据集A中遥感影像的目标名称和目标区域, 使用最小外接倾斜矩形框标注 所述目标区域, 标注所述目标名称和所述矩形框的四个角点 位置; 对标注的遥感影 像进行切片和翻转的预处 理; 将处理后的遥感影 像输入所述第一目标检测模型进行训练, 获得教师模型。 4.根据权利要求3所述的方法, 其特征在于, 所述第一目标检测模型采用主干网络为 resnet50的残差网络结构, 采用Faster  R‑CNN算法对所述第一目标检测模型进行训练。 5.根据权利要求1所述的方法, 其特征在于, 利用 知识蒸馏对所述教师模型进行压缩, 获得学生模型, 并在样本不足的数据集B中进行训练, 包括: 在所述教师模型的全连接层的softmax输出中引 入玻尔兹曼分布的温度系数, 获得学 生模型, 当所述 温度系数越趋向于0且 所述温度系数越大, 所述学生模型更接近于所述 教师 模型; 对所述教师模型和所述学生模型的交叉熵进行最小化, 利用样本不足的数据集B训练 优化所述学生模型, 得到所述交叉熵最小的系数 所对应的学生模型。 6.根据权利要求5所述的方法, 其特 征在于, 所述学生模型为: 其中, 为所述教师模型的全连接层的softmax输出, i表示第i个类别, 为所述玻尔兹 曼分布的温度系数, 表示判别为第i个 类别的可能性, j为总类别数量; 所述最小化的交叉熵为: 其中, 为所述教师模型的分布。权 利 要 求 书 1/2 页 2 CN 115019183 A 27.根据权利要求1所述的方法, 其特征在于, 利用训练后的学生模型对与所述数据集B 的数据类型相同的待测试 数据进行判别, 获得第一判别结果, 包括: 将与所述数据集B的数据类型相同的待测试 数据输入训练后的学生模型中; 利用所述训练后的学生模型采用two ‑stage目标检测算法对所述待测试数据的目标进 行推理定位和判别, 输出每 个定位框的第一判别结果; 判断所述第 一判别结果是否满足第 一预设阈值, 并记录满足所述第 一预设阈值的目标 位置和判别概 率, 作为最终的第一判别结果。 8.根据权利要求1所述的方法, 其特征在于, 重构所述待测试数据, 使所述待测试数据 与所述数据集A的数据类型相同, 包括: 对所述数据集B和所述数据集A的数据类型进行比较和判断; 对所述数据集A中的数据进行处 理, 获得与所述数据集B的数据类型相同的数据集Ab; 基于峰值信噪比建立损失函数, 建立所述数据集Ab和所述数据集B的数据类型之间的相 似度, 并基于所述相似度构建和优化所述数据集A到所述数据集B的退化模型 ; 利用所述退化模 型 采用以下图像重构模型重构所述待测试数据, 使所述待测试数 据与所述数据集A的数据类型相同, 其中, 为所述退化模型 的反投影, 为随机噪声, 为图像重构模型, 在训练过程中, 利用基于峰值信噪比建立的损失函数对所述退化模型的反投影进 行迭代优 化, 获得所述图像重构模型。 9.根据权利要求1所述的方法, 其特征在于, 利用所述教师模型对重构后的待测试数据 进行判别, 获得第二判别结果, 包括: 将重构后与所述数据集A的数据类型相同的待测试 数据输入所述教师模型中; 利用所述教师模型对所述待测试数据进行推理定位、 回归和分类, 输出每个定位框的 第二判别结果; 判断所述第 二判别结果是否满足第 二预设阈值, 并记录满足所述第 二预设阈值的目标 位置和判别概 率, 作为最终的第二判别结果。 10.根据权利要求1所述的方法, 其特 征在于, 所述加权融合的公式为: 其中, 为权重系数, 为所述第一判别结果, 为所述第二判别结果, 为所述第二目 标检测模型的全连接层。权 利 要 求 书 2/2 页 3 CN 115019183 A 3

.PDF文档 专利 基于知识蒸馏和图像重构的遥感影像模型迁移方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于知识蒸馏和图像重构的遥感影像模型迁移方法 第 1 页 专利 基于知识蒸馏和图像重构的遥感影像模型迁移方法 第 2 页 专利 基于知识蒸馏和图像重构的遥感影像模型迁移方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:15:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。