全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210909302.5 (22)申请日 2022.07.29 (71)申请人 深圳数联天下智能科技有限公司 地址 518000 广东省深圳市南 山区粤海街 道高新区社区高新南七道20号深圳国 家工程实验室大楼B16 01 (72)发明人 陈仿雄  (74)专利代理 机构 深圳市六加知识产权代理有 限公司 4 4372 专利代理师 陈金赏 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 年龄预测模 型的训练方法、 年龄预测方法及 相关装置 (57)摘要 本申请实施例涉及人脸图像识别技术领域, 公开了一种年龄预测模型的训练方法、 年龄预测 方法及相关装置, 该年龄预测模 型包括人脸编码 网络、 人脸解码网络以及感知机年龄预测 网络, 通过人脸编码网络对与原始人脸图像的年龄相 同的年龄风格图像进行处理, 并将处理之后的特 征图进行风格融合, 进一步通过人脸解码网络对 融合后的特征图进行解码, 并且, 还通过感知机 年龄预测网络对原始人脸图像进行年龄预测, 构 建年龄风格损失函数对年龄预测模 型进行训练, 本申请能够解决人脸特征的唯一性导致模型泛 化能力不足的问题, 提高年龄预测的准确度。 权利要求书3页 说明书18页 附图7页 CN 115147910 A 2022.10.04 CN 115147910 A 1.一种年龄预测模型的训练方法, 其特征在于, 所述年龄预测模型包括人脸编码网络、 人脸解码网络以及感知机年龄预测网络, 所述方法包括: 获取人脸数据集, 其中, 所述人脸数据集包括多个不同年龄值的人脸图像; 基于所述人脸编码网络, 对所述人脸数据集中的原始人脸图像和年龄风格图像进行处 理, 得到所述原始人脸图像对应的特征图和所述年龄风格图像对应的特征图, 其中, 所述原 始人脸图像和所述 年龄风格图像对应的年龄值相同; 融合所述原始人脸图像对应的特征图与 所述年龄风格图像对应的特征图, 得到 融合后 的特征图; 将所述融合后的特 征图输入到所述人脸 解码网络, 得到解码后的人脸图像; 将所述原始人脸图像对应的特征图输入到所述感知机年龄预测网络, 其中, 所述感知 机年龄预测网络用于预测所述原 始人脸图像对应的年龄; 构建年龄风格损 失函数, 基于所述人脸数据集和所述年龄风格损 失函数, 对所述年龄 预测模型进 行训练, 直至所述年龄风格损失函数收敛, 其中, 所述年龄风格损失函数包括人 脸解码网络输出 的解码后的人脸图像和原始人脸图像的内容损失, 以及, 人脸解码网络输 出的解码后的人脸图像和原 始人脸图像的风格损失。 2.根据权利要求1所述的方法, 其特征在于, 所述融合所述原始人脸图像对应的特征图 与所述年龄风格图像对应的特 征图, 得到融合后的特 征图, 包括: 将所述原始人脸图像按照每一像素点的像素值的大小进行排序, 并确定所述原始人脸 图像对应的第一排序索引, 其中, 所述第一排序索引用于确定所述原始人脸图像中的每一 像素点在排序之前的原 始位置; 将所述年龄风格图像按照每一像素点的像素值的大小进行排序, 并确定所述年龄风格 图像对应的第二排序索引, 其中, 所述第二排序索引用于确定所述年龄风格图像中的每一 像素点在排序之前的原 始位置; 根据所述第一 排序索引, 对所述 年龄风格图像进行处 理, 得到处 理后的特 征图; 将所述原 始人脸图像与所述处 理后的特 征图进行融合, 得到融合后的特 征图。 3.根据权利要求2所述的方法, 其特 征在于, 所述根据所述第 一排序索引, 对所述年龄风格图像进行处理, 得到处理后的特征图, 包 括: 根据所述第一排序索引, 对所述年龄风格图像的每一像素点进行提取, 得到处理后的 特征图; 所述将所述原始人脸图像与所述处理后的特征图进行融合, 得到融合后的特征图, 包 括: 将所述原始人脸图像的每一像素点的像素值与所述处理后的特征图的每一像素点的 像素值进行一 一对应相加, 得到每一个 像素点的融合像素值, 以得到融合后的特 征图。 4.根据权利要求1 ‑3任一项所述的方法, 其特 征在于, 所述 年龄风格损失函数包括: Loss=a*Lc+α *Lpix+β *Ldis+γ*Lstyle 其中, Loss为年龄风格损失, Lc为感知机年龄 预测网络的预测年龄与真实年龄的年龄交 叉熵损失, Lpix为人脸解码网络输出的解码后的人脸图像和原始人脸图像的内容损失, Ldis 为判别损失, Lstyle为人脸解码网络输出的解码后的人脸图像和原始人脸图像的风格损失, a权 利 要 求 书 1/3 页 2 CN 115147910 A 2为年龄交叉熵损失对应的权重, α 为内容损失对应的第一权重, β 为判别损失对应的第二权 重, γ 为风格损失对应的第三权 重。 5.根据权利要求 4所述的方法, 其特 征在于, 所述 年龄交叉熵损失包括: 其中, Lc为感知机年龄 预测网络的预测年龄与真实年龄的年龄交叉熵损失, i为年龄值, n为最大年龄值, Yi为年龄值i对应的真实年龄, Pi为年龄值i对应的预测年龄的概 率值。 6.根据权利要求 4所述的方法, 其特 征在于, 所述内容损失, 包括: Lpix=ET, s[||T‑G(T, S)||]mse 其中, Lpix为人脸解码网络输出的解码后的人脸图像和原始人脸 图像的内容损失, T为 原始人脸图像, S为与 原始人脸图像的年龄相同的年龄风格图像, G(T, S)为人脸解码网络输 出的解码后的人脸图像, ET, S[||T‑G(T, S)||]mse为人脸解码网络输出的解码后的人脸图像 与原始人脸图像的均方误差 。 7.根据权利要求4所述的方法, 其特征在于, 所述年龄预测模型还包括: 判别网络, 用于 判断所述 解码后的人脸图像是否为真实的人脸图像; 所述判别损失, 包括: Ldis=ET[logD(T)]+ET, S[log(1‑D(G(T, S) ))] 其中, Ldis为判别损失, T为原始人脸图像, S为与原始人脸图像的年龄相同的年龄风格 图像, G(T, S)为人脸解码网络输出的解码后的人脸图像, D(T)为判别网络对于原始人脸图 像的判断真假的概率值, D(G(T, S))为判别网络对于人脸解码 网络输出的解码后的人脸图 像的判断真假的概率值, ET[logD(T)]为判别网络对于原始人脸图像的判断为真的期望值, ET, S[log(1‑D(G(T, S)))]为判别网络对于人脸解码网络输出的解码后的人脸图像的判断为 假的期望值。 8.根据权利要求 4所述的方法, 其特 征在于, 所述 风格损失, 包括: 其中, i为第i个特征尺度, n为特征尺度的数量, Lstyle为风格损失, T为原始人脸图像, S 为与原始人脸图像的年龄相同的年龄风格图像, G(T, S)为人脸解码网络输出的解码后的人 脸图像, 为原始人脸图像输入到VGG网络中获得第i个特征尺度的特征值, 为 解码后的人脸图像输入到VG G网络中获得第i个特 征尺度的特 征值。 9.一种年龄预测方法, 其特 征在于, 包括: 获取待预测的人脸图像; 将所述待预测的人脸图像输入年龄预测模型, 得到所述待预测的人脸图像对应的预测 年龄, 其中, 所述 年龄预测模型 是基于权利要求1 ‑8任一项所述的方法进行训练得到的。 10.根据权利要求9所述的方法, 其特征在于, 所述将所述人脸图像输入年龄预测模型, 得到所述待预测的人脸图像对应的预测年龄, 包括: 将所述待预测的人脸图像输入所述年龄预测模型的人脸编码网络, 得到所述待预测的 人脸图像对应的特 征图;权 利 要 求 书 2/3 页 3 CN 115147910 A 3

.PDF文档 专利 年龄预测模型的训练方法、年龄预测方法及相关装置

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 年龄预测模型的训练方法、年龄预测方法及相关装置 第 1 页 专利 年龄预测模型的训练方法、年龄预测方法及相关装置 第 2 页 专利 年龄预测模型的训练方法、年龄预测方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:15:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。