南京邮电大学孙林慧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于深度神经网络的单通道语音分离方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115273887B 。
龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210598726.4,技术领域涉及:G10L21/0272;该发明授权一种基于深度神经网络的单通道语音分离方法是由孙林慧;梁文清;袁硕;李平安设计研发完成,并于2022-05-30向国家知识产权局提交的专利申请。
本一种基于深度神经网络的单通道语音分离方法在说明书摘要公布了:本发明公开了一种基于多重联合约束双输出深度神经网络的单通道语音分离方法,首先提出了三种联合约束损失函数,并进行整合,提出一种多重联合约束损失函数,用于训练双输出深度神经网络以解决单通道语音分离问题。该多重联合约束损失函数充分利用了网络输出值之间的关系,输出值与目标语音特征之间的关系,估计目标语音特征与混合语音特征之间的关系,在该损失函数指导下训练的深度神经网络可以输出更精确的预测值。此外,本发明采用优化思想求解了各约束项所对应的最优权重系数,使每项的约束力度更精准,进一步提升了分离系统的性能。实验结果表明,相比基于传统损失函数的方法,该方法的性能更加优越,能够更有效地分离出目标语音。
本发明授权一种基于深度神经网络的单通道语音分离方法在权利要求书中公布了:1.一种基于深度学习的单通道语音分离方法,其特征在于:所述单通道语音分离方法基于多重联合约束双输出深度神经网络,其中,所述深度神经网络DNN含有一个输入层、三个隐藏层和一个输出层,隐藏层选择ReLU作为激活函数,输出层选择sigmoid的激活函数,包括如下具体步骤: 步骤1、从语料库中随机选取说话人1和说话人2的语音信号进行预处理,得到混合语音信号,提取干净语音信号和混合语音信号的幅度谱特征,并计算训练目标IRM; 步骤2、将前述步骤中提取到的混合语音信号的幅度谱特征作为深度神经网络DNN的输入,训练目标IRM作为DNN的输出,分别在联合约束损失函数1、联合约束损失函数2、联合约束损失函数3的指导下,训练模型DNNJC_1、DNNJC_2、DNNJC_3; 步骤3、将测试混合语音信号的幅度谱特征分别输入到DNNJC_1、DNNJC_2和DNNJC_3,得到相应的IRM估计值,计算估计的目标语音信号的幅度谱特征,重构目标语音信号; 步骤4、将基于联合约束损失函数1、联合约束损失函数2、联合约束损失函数3的方法整合为组合预测方法,采用优化的算法求解最优权重系数作为多重联合约束损失函数的正则化系数;再将所述混合语音信号的幅度谱特征作为深度神经网络DNN的输入,训练目标IRM作为DNN的输出,在多重联合约束损失函数的指导下,训练模型DNNJC_multi; 步骤5、将测试混合语音信号的幅度谱特征输入到DNNJC_multi,得到相应的IRM估计值,计算估计的目标语音信号的幅度谱特征,重构目标语音信号,并对所提出的基于多重联合约束的双输出深度神经网络的单通道语音分离方法进行性能评估。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区亚东新城区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励