全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210614375.1 (22)申请日 2022.05.31 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 杨明川 王昊 李伟 白亮  刘振华  (74)专利代理 机构 北京柏杉松知识产权代理事 务所(普通 合伙) 11413 专利代理师 马敬 项京 (51)Int.Cl. B25J 9/16(2006.01) B25J 19/02(2006.01) (54)发明名称 一种认知地图构建方法和装置 (57)摘要 本公开实施例提供了一种认知地图构建方 法和装置, 涉及人工智 能技术领域。 获取历史时 间段内目标场景的待处理图像流; 基于视觉里程 计算法处理待处理图像流, 得到机器人在多个历 史时刻的线速度和角速度; 将每一历史 时刻的线 速度输入至网格细胞环状吸引子模 型, 得到表征 每一历史时刻机器人位置的位置特征, 将每一历 史时刻的角速度输入至头朝向细胞模 型, 得到表 征每一历史时刻机器人姿态的姿态特征; 基于 Vision Transformer网络模型对待处理图像流 进行特征提取, 得到待处理图像流中每一历史时 刻对应的图像帧的第一图像特征; 基于得到的位 置特征、 姿态特征和第一图像特征, 生成目标场 景的认知地图, 提高认知地图的准确度。 权利要求书3页 说明书12页 附图4页 CN 114952847 A 2022.08.30 CN 114952847 A 1.一种认知地图构建方法, 其特 征在于, 所述方法应用于 机器人, 所述方法包括: 在所述机器人 行驶过程中, 获取历史时间段内目标场景的图像流, 作为待处 理图像流; 基于视觉里程计算法, 对所述待处理图像流进行处理, 得到所述机器人在所述历史时 间段内多个历史时刻的线速度和角速度; 将每一历史时刻的线速度输入至网格细胞环状吸引子模型, 得到表征每一历史时刻所 述机器人位置的位置特征, 以及将每一历史时刻的角速度输入至头朝向细胞模型, 得到表 征每一历史时刻所述机器人姿态的姿态特 征; 基于计算机视觉处理Vision  Transformer网络模型对所述待处理图像流进行特征提 取, 得到所述待处 理图像流中每一历史时刻对应的图像帧的图像特 征, 作为第一图像特 征; 基于得到的位置特 征、 姿态特 征和第一图像特 征, 生成所述目标场景的认知地图。 2.根据权利要求1所述的方法, 其特征在于, 所述基于得到的位置特征、 姿态特征和第 一图像特 征, 生成所述目标场景的认知地图, 包括: 生成多个认知节点; 其中, 一个认知节点包括对应的历史时刻的位置特征、 姿态特征和 第一图像特 征; 根据闭环更新 算法对所述多个认知节点进行 更新, 得到所述目标场景的认知地图。 3.根据权利要求1所述的方法, 其特征在于, 所述在所述机器人行驶过程中, 获取历史 时间段内目标场景的图像流, 作为待处 理图像流, 包括: 在所述机器人行驶过程中, 获取机器人的拍摄视角下目标场景的图像流, 作为待处理 图像流。 4.根据权利要求1所述的方法, 其特征在于, 所述在所述机器人行驶过程中, 获取历史 时间段内目标场景的图像流, 作为待处 理图像流, 包括: 在所述机器人行驶过程中, 获取机器人的拍摄视角下目标场景的图像流, 作为初始图 像流; 针对所述初始图像流中的每一初始图像帧, 对该初始图像帧进行语义分割, 得到第一 语义分割图像; 对第一语义分割图像进行 特征提取, 得到第二图像特 征; 基于所述第一语义分割图像和该初始图像帧对应的深度图像, 得到对应的点云图像, 并对所述 点云图像进行 特征提取, 得到第三图像特 征; 基于指定位置信息, 对所述第三图像特征和第二图像特征进行特征融合, 得到第二语 义分割图像; 其中, 所述指 定位置信息表示: 指 定空间位置与所述机器人采集该初始图像帧 时的位置之间的偏转角度和距离; 对该初始图像帧对应的第 二语义分割图像和该初始图像帧进行特征融合, 得到第四图 像特征; 将所述第四图像特征输入至图像生成网络, 得到以所述指定空间位置为监测视角的预 测图像帧; 将包含各初始图像帧对应的预测图像帧的图像流, 作为待处 理图像流。 5.根据权利要求1所述的方法, 其特征在于, 所述基于计算机视觉处理Vision   Transformer网络模型对所述待处理图像流进行特征提取, 得到所述待处理 图像流中每一 历史时刻对应的图像帧的图像特 征, 作为第一图像特 征, 包括:权 利 要 求 书 1/3 页 2 CN 114952847 A 2针对所述待处理图像流中每一历史时刻对应的图像帧, 将该图像帧划分为多个图像 块; 将所述多个图像块、 每一图像块的位置编码, 以及该图像帧中包含的对象的类别编码, 输入至Visi on Transformer网络模型, 得到该图像帧的第一图像特 征。 6.一种认知地图构建装置, 其特 征在于, 所述装置应用于 机器人, 所述装置包括: 图像流获取模块, 用于在所述机器人行驶过程中, 获取历史时间段内目标场景的图像 流, 作为待处 理图像流; 视觉里程计模块, 用于基于视觉里程计算法, 对所述待处理图像流进行处理, 得到所述 机器人在所述历史时间段内多个历史时刻的线速度和角速度; 认知模块, 用于将每一历史时刻的线速度输入至网格细胞环状吸引子模型, 得到表征 每一历史时刻所述机器人位置的位置特征, 以及将每一历史时刻的角速度输入至头朝向细 胞模型, 得到表征每一历史时刻所述机器人姿态的姿态特 征; 视觉特征表征模块, 用于基于计算机视觉处理Vision  Transformer网络模型对所述待 处理图像流进 行特征提取, 得到所述待处理图像流中每一历史时刻对应的图像帧的图像特 征, 作为第一图像特 征; 场景建图模块, 用于基于得到的位置特征、 姿态特征和第 一图像特征, 生成所述目标场 景的认知地图。 7.根据权利要求6所述的装置, 其特 征在于, 所述场景建图模块, 包括: 认知节点生成子模块, 用于生成多个认知节点; 其中, 一个认知节点包括对应的历史时 刻的位置特 征、 姿态特 征和第一图像特 征; 认知地图更新子模块, 用于根据闭环更新算法对所述多个认知节点进行更新, 得到所 述目标场景的认知地图。 8.根据权利要求6所述的装置, 其特征在于, 所述图像流获取模块, 具体用于在所述机 器人行驶过程中, 获取机器人的拍摄视角下目标场景的图像流, 作为待处 理图像流。 9.根据权利要求6所述的装置, 其特 征在于, 所述图像流获取模块, 具体用于: 在所述机器人行驶过程中, 获取机器人的拍摄视角下目标场景的图像流, 作为初始图 像流; 针对所述初始图像流中的每一初始图像帧, 对该初始图像帧进行语义分割, 得到第一 语义分割图像; 对第一语义分割图像进行 特征提取, 得到第二图像特 征; 基于所述第一语义分割图像和该初始图像帧对应的深度图像, 得到对应的点云图像, 并对所述 点云图像进行 特征提取, 得到第三图像特 征; 基于指定位置信息, 对所述第三图像特征和第二图像特征进行特征融合, 得到第二语 义分割图像; 其中, 所述指 定位置信息表示: 指 定空间位置与所述机器人采集该初始图像帧 时的位置之间的偏转角度和距离; 对该初始图像帧对应的第 二语义分割图像和该初始图像帧进行特征融合, 得到第四图 像特征; 将所述第四图像特征输入至图像生成网络, 得到以所述指定空间位置为监测视角的预 测图像帧;权 利 要 求 书 2/3 页 3 CN 114952847 A 3

.PDF文档 专利 一种认知地图构建方法和装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种认知地图构建方法和装置 第 1 页 专利 一种认知地图构建方法和装置 第 2 页 专利 一种认知地图构建方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:22:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。