专利基于特征自适应融合的立定跳远阶段分类方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211005577.2 (22)申请日 2022.08.22 (71)申请人陕西师范大学地址 710062 陕西省西安市长安南路199号 (72)发明人马苗　李雨桐　武杰　裴炤　黄聪　 (74)专利代理机构西安永生专利代理有限责任公司 61201 专利代理师申忠才 (51)Int.Cl. G06V 10/764(2022.01) G06V 20/40(2022.01) G06V 40/20(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)A63B 71/06(2006.01) (54)发明名称基于特征自适应融合的立定跳远阶段分类方法 (57)摘要一种基于特征自适应融合的立定跳远阶段分类方法，由构建视频分类数据集、运动信息自适应融合、构建视频分类网络、训练视频分类网络和检测测试集视频组成。本发明采用运动信息自适应融合方式改变输入模态以注重运动边界信息，并在特征提取骨干网络中构建注重局部和全局特征信息的双层池化时序注意力模块，得到特征自适应融合的立定跳远阶段分类网络。本发明与现有技术相比，具有运动特征信息获取更加精细、分类结果更加准确等优点，在立定跳远自建数据集上的对比仿真实验结果表明，与现有的主流方法相比，分类准确率提高了14.1％，可用于立定跳远这一特定运动的阶段分类。权利要求书3页说明书10页附图3页 CN 115359292 A 2022.11.18 CN 115359292 A 1.一种基于特征自适应融合的立定跳远阶段分类方法，其特征在于由下述步骤组成： (1)构建立定跳远数据集在操场自然环境场景下采集学生立定跳远运动视频，将每一个完整的运动视频分割成 10个阶段剪辑，构建立定跳远阶段数据集{S0， S1， S2， S3， S4， S5， S6， S7， S8， S9}， S0表示视频开始到摆臂最高点阶段， S1表示摆臂最高点到脚掌开始离地阶段， S2表示脚掌开始离地到全脚掌离地起跳阶段， S3表示全脚掌离地起跳到拉背弓阶段， S4表示拉背弓到大腿垂直地面阶段， S5表示大腿垂直地面到举腿膝最高点阶段， S6表示举腿膝最高点到脚后跟开始落地阶段， S7 表示脚后跟开始落地到全脚掌落地阶段， S8表示全脚掌落地到骻骨最低点阶段， S9表示骻骨最低点到视频结束阶段，将数据集按3： 1： 1划分成训练集、验证集、测试集； (2)运动信息自适应融合将视频输入序列V分为等长的M个视频段V为{S1， S2， ...， SM}，每段选择相邻的f帧堆叠为{I1， I2， ...， IM}，相邻帧集中的f帧为将其输入运动增强模块得到运动信息每段的运动信息特征构成{ME1， ME2， ...， MEM}，与每f帧堆叠的第一帧为以加性特征自适应融合方式馈送到视频分类网络， M为有限正整数， f取值为4； (3)构建视频分类网络视频分类网络由7×7的卷积层(1)与最大池化层(2)、第二阶段残差块(3)、第三阶段残差块(4)、第四阶段残差块(5)、第五阶段残差块(6)依次串联构成，第二阶段残差块(3)由3 个残差基础块串联构成，第三阶段残差块(4)由4个残差基础块串联构成，第四阶段残差块 (5)由6个残差基础块串联构成，第五阶段残差块(6)由3个残差基础块串联构成，每个残差基础块由1 ×1卷积层与双层池化时序注意力模块、 3 ×3卷积层、 1 ×1卷积层依次串联构成； (4)训练视频分类网络 1)视频分类网络初始化用Xavier方法初始化视频分类网络参数； 2)设置视频分类网络的超级参数将训练集的视频帧尺寸大小调整为224 ×224；在训练过程中，数据批量为8，学习率为 0.0025，在36轮次学习率衰减为0.0 0025，后10次的学习率衰减为0.0 00025； 3)训练视频分类网络将训练集中的所有视频输入视频分类网络，进行前向传播，按下式确定损失函数L：损失函数L为负对数似然损失；使用随机梯度下降方法降低损失值来进行反向传播，反复循环前向传播和反向传播，并更新视频分类网络的权重和偏置，直至损失函数收敛，训练结束，得到训练好的视频分类网络； (5)检测测试集视频将测试集输入到训练好的视频分类网络中，输出视频分类结果。 2.根据权利要求1所述的基于特征自适应融合的立定跳远阶段分类方法，其特征在于所述的(2)运动信息自适应融合步骤为：将视频输入序列V分为等长的M个视频段V为{S1，权　利　要　求　书 1/3 页 2 CN 115359292 A 2S2， ...， SM}，每段选择相邻的f帧堆叠为{I1， I2， ...， IM}，相邻帧集中的f帧为将其输入运动增强模块得到运动信息每段的运动信息特征构成{ME1， ME2， ...， MEM}，与每f帧堆叠的第一帧为以加性特征自适应融合方式馈送到视频分类网络， M取值为3～8。 3.根据权利要求1所述的基于特征自适应融合的立定跳远阶段分类方法，其特征在于：所述的(2)运动信息自适应融合中的加性特征自适应融合方式为：按下式确定特征FIM： FIM＝I+ME 其中， I为每f帧堆叠的第一帧集合RGB特征， ME为每f帧堆叠的相邻帧对通过运动增强模块得到的映射特征，按下式确定特征融合结果FADP： FADP＝α1×FIIM+α2×FMEIM ∑iαi＝1 其中，特征FIIM由特征I与特征FIM通道维按列拼接得到，特征FMEIM由特征ME与特征FIM通道维按列拼接得到， αi为归一化权重， ωi为初始化权重系数， ωj为特征权重， i∈{1,2}， j∈ {1,2}，采用自适应可学习权重系数给不同的特征赋予权重。 4.根据权利要求1所述的基于特征自适应融合的立定跳远阶段分类方法，其特征在于：在(3)构建视频分类网络中，所述的双层池化时序注意力模块的构建方法为：该模块的输入特征为X0∈[N,T,C,H,W]， N为批尺寸大小， T为特征的时间维度， C为通道数， H为空间维度上的长， W为空间维度上的宽，将张量维度换位为X1∈[N,C,T,H,W]，按下式确定特征其中， n,c,t,h,w表示其相应维度所有取值， Co nv1d()为一维卷积；按下式确定时序注意力权重Ft：按下式确定特征X2：其中，表示逐元素相加， ⊙表示逐元素相乘；按下式确定对时序位置敏感的重要性权重Fs：其中， Relu()为线性整流激活函数， Sigmoid()为S 型激活函数， K为卷积核大小、 K取值权　利　要　求　书 2/3 页 3 CN 115359292 A 3

专利 基于特征自适应融合的立定跳远阶段分类方法

专利基于特征自适应融合的立定跳远阶段分类方法