哈尔滨工业大学(威海);南京龙垣信息科技有限公司丁建睿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(威海);南京龙垣信息科技有限公司申请的专利基于双特征分支结构的声纹识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120412591B 。
龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510412761.6,技术领域涉及:G10L17/02;该发明授权基于双特征分支结构的声纹识别方法是由丁建睿;王欣;丁卓设计研发完成,并于2025-04-03向国家知识产权局提交的专利申请。
本基于双特征分支结构的声纹识别方法在说明书摘要公布了:本发明涉及深度学习声纹识别技术领域,具体涉及一种基于双特征分支结构的声纹识别方法:包括对原始语音信号分别提取Mel倒谱特征与小波变换特征并形成两路分支;将上述特征分别输入自注意力网络与卷积TDNN网络进行多尺度特征建模,并对两路输出进行融合;对融合后的声纹表征进一步计算多级判别损失,以增强在嘈杂或失配环境下的说话人区分度;对融合输出进行解码或上采样操作并作为下一级处理的输入,最终经由级联式编解码器结构生成多分辨率且更具鲁棒性的声纹特征。该方法旨在克服单一路径特征提取在复杂环境下的不足,通过结合自注意力与卷积TDNN的优势,显著提升对多分辨率语音特征的捕捉与识别能力。
本发明授权基于双特征分支结构的声纹识别方法在权利要求书中公布了:1.一种基于双特征分支结构的声纹识别方法,其特征在于,包括如下步骤: 对原始语音信号进行预处理,并分别提取Mel倒谱特征与小波变换特征,形成两条特征分支; 将Mel倒谱特征输入自注意力模块,进行多尺度时频特征的序列建模; 将小波变换特征输入卷积TDNN网络,对分段或分帧后的小波系数进行时间延迟卷积处理; 将自注意力模块对Mel倒谱特征进行序列建模的结果以及卷积TDNN网络对小波变换特征进行时间延迟卷积处理结果进行特征融合,得到融合后的声纹特征表示; 将融合后的声纹特征表示输入SE模块与平均统计池化层并连接线性层,最终采用AAM-Softmax损失进行说话人分类或相似度度量; 还包括:对多尺度特征进行提取和下采样,编码器每一阶段的输入层通过边界反射进行填充,并利用步长为1的滑窗卷积与特征激活;输出层则结合组分离卷积以实现特征通道的递增。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(威海);南京龙垣信息科技有限公司,其通讯地址为:264200 山东省威海市文化西路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励