全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210476308.8 (22)申请日 2022.04.29 (71)申请人 中国科学院自动化研究所 地址 100190 北京市海淀区中关村东路95 号 (72)发明人 陈嘉浩 王萧娜 乔红  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 白冬梅 (51)Int.Cl. B25J 9/16(2006.01) (54)发明名称 基于临界状态循环网络的肌肉骨骼机器人 控制方法及装置 (57)摘要 本发明提供一种基于临界状态循环网络的 肌肉骨骼机器人控制方法及装置, 方法包括: 基 于循环网络, 得到输入信号对应的控制信号, 并 基于控制信号控制肌肉骨骼机器人移动至目标 位置; 循环网络训练步骤包括: 基于临界状态权 重条件, 对初始模型的循环权重和偏置向量进行 调整, 得到临界网络; 将终点时刻的样本目标位 置、 作为样 本反馈信号的样本位置误差以及当前 时刻的样 本实际位置输入至临界网络, 得到样本 控制信号; 基于样本控制信号对应的样本实际位 置、 样本控制信号对应的样本目标位置以及循环 网络的谱半径, 确定样本奖励信号; 基于样本奖 励信号, 更新临界网络的权重, 得到循环网络。 本 发明能够精确控制肌肉骨骼机器人运动至目标 位置。 权利要求书2页 说明书12页 附图2页 CN 114872042 A 2022.08.09 CN 114872042 A 1.一种基于临界状态循环网络的肌肉骨骼机器人控制方法, 其特 征在于, 包括: 确定肌肉骨骼机器人的输入信号; 将所述输入信号输入至循环网络, 得到所述循环网络 输出的控制信号; 基于所述控制信号, 控制所述肌肉骨骼机器人移动至目标位置; 其中, 所述循环网络基于如下步骤训练得到: 基于临界状态权 重条件, 对初始模型的循环权 重和偏置向量进行调整, 得到临界 网络; 将终点时刻的样本目标位置、 作为样本反馈信号的样本位置误差以及当前时刻的样本 实际位置输入至所述临界网络, 得到所述临界网络输出 的样本控制信号, 所述样本位置误 差基于当前时刻的样本实际位置以及当前时刻的样本目标位置确定; 基于所述样本控制信号对应的样本实际位置、 所述样本控制信号对应的样本目标位置 以及所述循环网络的谱半径, 确定样本奖励信号; 基于所述样本奖励信号, 更新所述临界网络的权重, 直至所述临界网络达到收敛条件, 得到所述循环网络 。 2.根据权利要求1所述的基于临界状态循环网络的肌肉骨骼机器人控制方法, 其特征 在于, 所述临界状态权 重条件基于如下公式确定: rt=(1‑α )rt‑1+α(Wixt+Whht‑1+b) ht=tanh(rt) 其中, 表示施加到rt上的瞬时噪声向量, 为网络在t时刻的输入信 号, 和 分别为循环网络隐藏层神经元在t时刻的膜电位和激活频率, 为所述偏置向量, 为连接循环网络输入层神经元和隐藏层神经 元的输 入权重, 为循环网络隐藏层神经元之间相互连接的循环 权重, 为 循环网络 输出权重的矩阵。 3.根据权利要求1所述的基于临界状态循环网络的肌肉骨骼机器人控制方法, 其特征 在于, 所述当前时刻的样本目标位置基于如下公式确定: 其中, 表示所述当前时刻的样本目标位置, O表示起始时刻的样本位置, tF表示肌肉 骨骼机器人的运动持续时间, P表示所述终点时刻的样本目标位置 。 4.根据权利要求1至3任一项所述的基于临界状态循环网络的肌肉骨骼机器人控制方 法, 其特征在于, 所述基于所述样 本控制信号对应的样本实际位置、 所述样 本控制信号对应 的样本目标位置以及所述循环网络的谱半径, 确定样本奖励信号, 包括: 基于所述样本控制信号对应的样本实际位置以及所述样本控制信号对应的样本目标 位置, 确定所述样本控制信号对应的位置误差;权 利 要 求 书 1/2 页 2 CN 114872042 A 2基于终点 时刻的样本目标位置以及终点 时刻的样本实际位置, 确定终点 时刻对应的位 置误差; 基于所述样本控制信号对应的位置误差、 所述终点 时刻对应的位置误差以及当前循环 网络的谱半径, 确定所述样本奖励信号。 5.根据权利要求4所述的基于临界状态循环网络的肌肉骨骼机器人控制方法, 其特征 在于, 所述样本奖励信号基于如下公式确定: 其中, R表示持续了S个时刻的样本奖励信号, et表示所述样本控制信号对应的位置误 差, eend表示所述终点时刻对应的位置误差, ρ(Wh)表示循环权重Wh的谱半径, γ1, γ2, γ3和 γ4表示加权系数常数。 6.根据权利要求1至3任一项所述的基于临界状态循环网络的肌肉骨骼机器人控制方 法, 其特征在于, 所述基于所述样本奖励信号, 更新所述临界 网络的权 重, 包括: 基于所述样本奖励信号, 确定所述样本奖励信号的期望; 基于所述样本奖励信号、 所述样本奖励信号的期望以及随机噪声, 更新所述临界网络 的权重。 7.一种基于临界状态循环网络的肌肉骨骼机器人控制装置, 其特 征在于, 包括: 确定单元, 用于确定 肌肉骨骼机器人的输入信号; 输出单元, 用于将所述输入信号输入至循环网络, 得到所述循环网络 输出的控制信号; 控制单元, 用于基于所述控制信号, 控制所述肌肉骨骼机器人移动至目标位置; 其中, 所述循环网络基于如下步骤训练得到: 基于临界状态权 重条件, 对初始模型的循环权 重和偏置向量进行调整, 得到临界 网络; 将终点时刻的样本目标位置、 作为样本反馈信号的样本位置误差以及当前时刻的样本 实际位置输入至所述临界网络, 得到所述临界网络输出 的样本控制信号, 所述样本位置误 差基于当前时刻的样本实际位置以及当前时刻的样本目标位置确定; 基于所述样本控制信号对应的样本实际位置、 所述样本控制信号对应的样本目标位置 以及所述循环网络的谱半径, 确定样本奖励信号; 基于所述样本奖励信号, 更新所述临界网络的权重, 直至所述临界网络达到收敛条件, 得到所述循环网络 。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述基于临界状态循环网络的肌肉骨骼机器人控制方法。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处理器执行时实现如权利要求1至6任一项所述基于临界状态循环网络的肌肉骨骼 机器人控制方法。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述基于临界状态循环网络的肌肉骨骼机器人控制方法。权 利 要 求 书 2/2 页 3 CN 114872042 A 3

.PDF文档 专利 基于临界状态循环网络的肌肉骨骼机器人控制方法及装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于临界状态循环网络的肌肉骨骼机器人控制方法及装置 第 1 页 专利 基于临界状态循环网络的肌肉骨骼机器人控制方法及装置 第 2 页 专利 基于临界状态循环网络的肌肉骨骼机器人控制方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:24:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。