北京航空航天大学杨杨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利一种高噪声条件下的空管指令端到端语音识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119559940B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411696959.3,技术领域涉及:G10L15/16;该发明授权一种高噪声条件下的空管指令端到端语音识别方法是由杨杨;朱衍波;蒋屿童;惠仪;蔡开泉设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。
本一种高噪声条件下的空管指令端到端语音识别方法在说明书摘要公布了:本发明涉及空中交通管制和语音识别技术领域,具体涉及一种高噪声条件下的空管指令端到端语音识别方法,包括:对待识别语音进行预处理,提取得到原语音频率特征;采用自适应注意力降噪模块对所述原语音频率特征进行降噪强度控制、频带增益控制以及基音追踪处理,得到降噪语音;对所述降噪语音进行预处理,提取得到降噪语音频率特征;采用语音识别模块将所述降噪语音频率特征进行共享编码器编码、连接时序分类解码器解码以及基于注意力的编码器‑解码器解码,得到输出的语音识别转录文本;本发明能够提高高噪声条件下空管指令的语音识别精度。
本发明授权一种高噪声条件下的空管指令端到端语音识别方法在权利要求书中公布了:1.一种高噪声条件下的空管指令端到端语音识别方法,其特征在于,采用训练完成的端到端语音识别模型进行语音识别,包括以下步骤: 步骤S1、对待识别语音进行预处理,提取得到原语音频率特征; 步骤S2、采用自适应注意力降噪模块对所述原语音频率特征进行降噪强度控制、频带增益控制以及基音追踪处理,得到降噪语音; 步骤S3、对所述降噪语音进行预处理,提取得到降噪语音频率特征; 步骤S4、采用语音识别模块将所述降噪语音频率特征进行共享编码器编码、连接时序分类解码器解码以及基于注意力的编码器-解码器解码,得到输出的语音识别转录文本; 所述步骤S2具体包括: 步骤S2-1、采用自适应控制器对所述原语音频率特征进行卷积神经网络和门控循环单元处理,获取降噪力度; 步骤S2-2、采用RNN-GRU网络对所述原语音频率特征进行处理,经过平滑插值获取音频频域信号的各个频带的频带增益; 步骤S2-3、检测语音信号中的基音周期,基于所述基音周期,通过梳状滤波器确定增益信号; 步骤S2-4、将所述增益信号经过所述降噪力度和所述频带增益的控制,得到降噪后频域信号,经过IFFT反快速傅里叶变换得到所述降噪语音; 步骤S2-1中,所述卷积神经网络和门控循环单元处理过程的表达式为: 其中,是输入的原语音的FBank特征向量,表示卷积操作,表示批量归一化,表示最大池化,是门控循环单元,是全连接层,是自适应控制器的网络的中间特征向量,表示降噪强度参数; 步骤S2-2中,所述RNN-GRU网络的处理过程的表达式为: 其中,表示语音信号在第频带的能量,表示带噪语音信号在第频带的能量,表示动态调整的降噪强度; 步骤S2-3具体包括:基于基音周期的梳状滤波器,获取频带相关的滤波系数,其中滤波系数表达式为: 其中,表示取最小值,为信号在频带的复数值,为频带的基音信号的复共轭值,是频带的频谱值的功率,是频带的基音信号的功率,是频带的索引,是总的频带数; 对端到端语音识别模型进行训练,将训练完成的端到端语音识别模型用于空管指令语音识别,训练的步骤具体包括: 步骤S5、构建空管环境噪声-干净语音模拟数据集和空管指令语音-文字数据集; 步骤S6、采用所述空管环境噪声-干净语音模拟数据集对所述自适应注意力降噪模块进行预训练;采用空管指令语音-文字数据集对所述语音识别模块进行单独训练;采用空管指令语音-文字数据集对所述端到端语音识别模型进行联合训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励