网易有道信息技术(北京)有限公司高飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉网易有道信息技术(北京)有限公司申请的专利基于NPU的流式语音合成声码器的方法及相关产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115440235B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210908194.X,技术领域涉及:G10L19/16;该发明授权基于NPU的流式语音合成声码器的方法及相关产品是由高飞;张广勇;高强;步兵;段亦涛设计研发完成,并于2022-07-29向国家知识产权局提交的专利申请。
本基于NPU的流式语音合成声码器的方法及相关产品在说明书摘要公布了:本发明的实施方式提供了一种基于NPU的流式语音合成声码器的方法及相关产品。其中,该方法包括获取关于所述流式语音的待处理的输入特征,其中所述待处理的输入特征为固定长度;基于部署在所述NPU上的声码器模型对固定长度的输入特征进行处理,以输出音频信息;以及基于所述音频信息确定对所述流式语音的合成结果。通过本发明的方案,将声码器模型有效部署在NPU上来执行对流式语音的合成,以结合NPU的高性能特别是在神经网络推理方面等的优势确保高质量语音的合成,同时有效降低延时和实时率,以满足实际市场需求。另外,本发明还提供了一种设备和一种计算机可读存储介质。
本发明授权基于NPU的流式语音合成声码器的方法及相关产品在权利要求书中公布了:1.一种基于嵌入式神经网络处理器NPU的流式语音合成声码器的方法,其特征在于,包括: 获取关于所述流式语音的待处理的输入特征,其中所述待处理的输入特征为固定长度,具体,对所述流式语音进行预处理,以将待处理的输入特征拆分成一个或多个固定长度的输入特征,其中对所述流式语音进行预处理包括利用滑窗方法从所述流式语音中提取固定长度的输入特征,所述滑窗方法包括: 利用大小为所述固定长度的滑窗从所述流式语音中顺次滑动提取所述固定长度的输入特征,每次滑动的滑动步长小于所述固定长度,以在相邻滑窗所提取的输入特征之间存在重叠,其中所述滑窗覆盖位于窗口中间的有效部分和位于窗口两端的重叠部分,所述有效部分的大小等于所述滑动步长,所述重叠部分的大小根据所述NPU上的声码器模型结构的感受野来确定; 响应于存在长度小于所述固定长度的输入特征,对长度小于所述固定长度的输入特征进行填充处理,以将其长度调整至所述固定长度; 基于部署在所述NPU上的声码器模型对固定长度的输入特征进行处理,以输出音频信息;以及 对所述声码器模型基于每个所述输入特征的输出进行切割处理,以得到每个所述输入特征的有效部分对应的音频信息; 对每个所述输入特征的有效部分对应的音频信息进行拼接;以及 根据拼接得到的音频信息确定所述合成结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人网易有道信息技术(北京)有限公司,其通讯地址为:100094 北京市海淀区西北旺东路10号院中关村软件园西区7号楼A座1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励