专利异常状态确定方法、装置、设备、介质及产品

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210737229.8 (22)申请日 2022.06.27 (71)申请人中国工商银行股份有限公司地址 100140 北京市西城区复兴门内大街 55号 (72)发明人刘晓宇　刘家奇　王照　 (74)专利代理机构北京同立钧成知识产权代理有限公司 1 1205 专利代理师吴文茂　刘芳 (51)Int.Cl. G06V 40/16(2022.01) G06V 40/70(2022.01) G06V 10/80(2022.01) G06V 10/766(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06F 40/42(2020.01) G06N 3/04(2006.01) (54)发明名称异常状态确定方法、装置、设备、介质及产品 (57)摘要本申请属于人工智能技术领域，具体提供一种异常状态确定方法、装置、设备、介质及产品，该方法包括：获取监控区域中被监控人员的声音特征数据和人脸特征数据；所述声音特征数据和人脸特征数据的数据维度相同；将所述声音特征数据和人脸特征数据输入预设人员异常状态确定模型，以生成被监控人员处于异常状态的概率；若根据所述概率和预设概率阈值确定被监控人员处于异常状态，则输出异常状态信息至异常预警设备。本申请的异常状态确定方法，以多模态的方式确定被监控人员处于异常状态的概率，准确性较高。从而提高了异常状态确定的准确性，进而，也提高了安防效果。权利要求书4页说明书18页附图5页 CN 115019371 A 2022.09.06 CN 115019371 A 1.一种人员异常状态确定方法，其特征在于，包括：获取监控区域中被监控人员的声音特征数据和人脸特征数据；所述声音特征数据和人脸特征数据的数据维度相同；将所述声音特征数据和人脸特征数据输入预设人员异常状态确定模型，以生成被监控人员处于异常状态的概率；若根据所述概率和预设概率阈值确定被监控人员处于异常状态，则输出异常状态信息至异常预警设备。 2.根据权利要求1所述的方法，其特征在于，所述监控区域为自动取款机的预设范围区域；所述获取监控区域中被监控人员的声音特征数据和人脸特征数据，包括：获取自动取款机发送的异常状态确定指令；所述异常状态确定指令为所述自动取款机在被监控人员输入正确账户密码后生成的；根据所述异常状态确定指令获取所述自动取款机的预设范围区域的声音信号数据和图像数据；将所述声音信号数据输入预设卷积神经网络中，以提取所述声音特征数据；将所述图像数据输入预设人脸识别模型中，以提取所述人脸特征数据。 3.根据权利要求1或2所述的方法，其特征在于，所述预设人员异常状态确定模型包括：多模态融合子模型和分类概率确定子模型；所述将所述声音特征数据和人脸特征数据输入预设人员异常状态确定模型，以生成被监控人员处于异常状态的概率，包括：将所述声音特征数据和人脸特征数据输入所述多模态融合子模型进行多模态共有特征处理、多模态私有特征处理以及多模态特征融合处理，以生成对应的最终多模态特征数据；将所述最终多模态特征数据输入所述分类概率确定子模型进行分类处理和概率确定处理，以生成被监控人员处于异常状态的概率。 4.根据权利要求3所述的方法，其特征在于，所述多模态融合子模型包括：私有特征网络模块、共有特征网络模块和融合回归网络模块；所述将所述声音特征数据和人脸特征数据输入所述多模态融合子模型进行多模态共有特征处理、多模态私有特征处理以及多模态特征融合处理，以生成对应的最终多模态特征数据，包括：将所述声音特征数据输入所述私有特征网络模块进行图像翻译处理、私有特征筛选处理和注意力机制处理，以输出翻译后的最终图像私有特征和第一图像共有特征；将所述声音特征数据、所述人脸特征数据以及所述第一图像共有特征输入所述共有特征网络模块进行共有特征提取、共有特征融合处理和注意力机制处理，以生成最终共有特征；将所述最终图像私有特征和最终共有特征输入所述融合回归网络模块进行特征融合和回归处理，以生成最终多模态特征数据。 5.根据权利要求4所述的方法，其特征在于，所述私有特征网络模块包括：翻译子模块、第一注意力机制处理子模块、私有特征掩码矩阵以及第一共有特征掩码矩阵；所述将所述声音特征数据输入所述私有特征网络模块进行图像翻译处理、私有特征筛权　利　要　求　书 1/4 页 2 CN 115019371 A 2选处理和注意力机制处理，以输出翻译后的最终图像私有特征和第一图像共有特征，包括：将所述声音特征数据输入所述翻译子模块以翻译成对应图像特征数据；将所述图像特征数据输入所述第一共有特征掩码矩阵进行共有特征筛选，以生成所述第一图像共有特征；将所述图像特征数据输入所述私有特征掩码矩阵进行私有特征筛选，以生成对应图像私有特征；将所述图像私有特征输入所述第一注意力机制处理子模块进行注意力机制处理，以生成所述最终图像私有特征。 6.根据权利要求5所述的方法，其特征在于，所述第一注意力机制处理子模块包括：归一化指数函数和私有特征注意力单元；所述图像私有特征为多个；所述将所述图像私有特征输入所述第一注意力机制处理子模块进行注意力机制处理，以生成所述最终图像私有特征，包括：采用所述归一化指数函数确定各所述图像私有特征的注意力权重；采用所述私有特征注意力单元根据预设权重阈值对所述注意力权重进行筛选，并将筛选后对应的图像私有特征确定为所述最终图像私有特征。 7.根据权利要求4所述的方法，其特征在于，所述共有特征网络模块包括：共有特征融合生成子模块、门控注意力网络和第二注意力机制处理子模块；所述将所述声音特征数据、所述人脸特征数据以及所述第一图像共有特征输入所述共有特征网络模块进行共有特征提取、共有特征融合处理和注意力机制处理，以生成最终图像共有特征，包括：将所述声音特征数据、所述人脸特征数据以及所述第一图像共有特征输入所述共有特征融合生成子模块进行共有特征提取和共有特征融合处理，以生成融合共有特征；将所述融合共有特征输入所述门控注意力网络进行共有特征优化处理，以输出优化后的融合共有特征；将所述优化后的融合共有特征输入所述第二注意力机制处理子模块进行注意力机制处理，以生成所述最终共有特征。 8.根据权利要求7所述的方法，其特征在于，所述共有特征融合生成子模块包括：第二共有特征掩码矩阵、长短期记忆人工神经网络和特征融合单元：所述将所述声音特征数据、所述人脸特征数据以及所述第一图像共有特征输入所述共有特征融合生成子模块进行共有特征提取和共有特征融合处理，以生成融合共有特征，包括：将所述人脸特征数据输入所述长短期记忆人工神经网络进行卷积处理，以生成对应第一中间特征数据；将所述第一中间特征数据输入所述第二共有特征掩码矩阵进行共有特征筛选，以生成对应第二图像共有特征；将所述声音特征数据输入所述长短期记忆人工神经网络进行卷积处理，以生成对应第二中间特征数据；将所述第二中间特征数据输入所述第二共有特征掩码矩阵进行共有特征筛选，以生成对应声音共有特征；权　利　要　求　书 2/4 页 3 CN 115019371 A 3

专利 异常状态确定方法、装置、设备、介质及产品

专利异常状态确定方法、装置、设备、介质及产品