南方电网大数据服务有限公司李站获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南方电网大数据服务有限公司申请的专利一种针对特定内容语音片段的声纹特征提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117649842B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210967354.8,技术领域涉及:G10L15/02;该发明授权一种针对特定内容语音片段的声纹特征提取方法是由李站;赵永国;杨荣霞;杨凯;杜美华;钱林钧设计研发完成,并于2022-08-12向国家知识产权局提交的专利申请。
本一种针对特定内容语音片段的声纹特征提取方法在说明书摘要公布了:本申请提供了一种针对特定内容语音片段的声纹特征提取方法,所述声纹特征提取方法,包括:通过前处理,得到声学谱特征片段;构造时延神经网络模块;基于所述时延神经网络模块、加权激励机制和残差结构,构造残差时延神经网络模块;基于所述时延神经网络模块、所述残差时延神经网络模块、注意力池化机制,构造残差注意力时延神经网络模块;将所述声学谱特征片段输入所述残差注意力时延神经网络模块,得到特定内容语音片段的声纹特征。本所述提供的声纹特征提取方法,从多个尺度提取特征的深层次信息,并结合残差网络、加权激励、注意力池化机制等方法,能够有效地从特定内容语音片段中提取声纹特征。
本发明授权一种针对特定内容语音片段的声纹特征提取方法在权利要求书中公布了:1.一种针对特定内容语音片段的声纹特征提取方法,其特征在于,所述声纹特征提取方法,包括: 确定包含特定内容的文本和对应语音; 提取所述对应语音的声学谱特征,对所述声学谱特征进行语音识别,切分所述声学谱特征,得到包含特定内容的所述文本对应的声学谱特征片段; 基于时延神经网络模块、残差时延神经网络模块以及注意力池化机制,构造残差注意力时延神经网络模块,用于从声学谱特征片段中,输出特定内容语音片段的声纹特征,其中,所述时延神经网络模块,用于对输入特征信息进行时间长度上的一维卷积操作,提取声学特征信息,所述残差时延神经网络模块是基于所述时延神经网络模块、加权激励机制以及残差结构而构造的,用于从输入特征信息中,提取多尺度特征信息; 所述基于时延神经网络模块、残差时延神经网络模块以及注意力池化机制,构造残差注意力时延神经网络模块,包括: 通过至少一层时延神经网络模块、至少一层残差时延神经网络模块,提取特征信息; 使用Convolution函数对最后一层时延神经网络模块的输出特征信息进行一维卷积,通过tanh激活函数激活,再使用Convolution函数进行一维卷积,再经过softmax激活函数后得到注意力系数,将注意力系数作用到最后一层时延神经网络模块的输出特征信息,得到均值和标准差,将所述均值和标准差拼接后,得到注意力池化机制的输出特征信息; 通过BatchNorm函数,对所述注意力池化机制的输出特征信息进行标准化,经过线性层输出特定内容语音片段的声纹特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南方电网大数据服务有限公司,其通讯地址为:510445 广东省广州市天河区体育东路108号创展中心西座1506-10单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励