Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东科技大学魏光村获国家专利权

山东科技大学魏光村获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东科技大学申请的专利基于多尺度SincNet和CGAN的端到端说话人辨认方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116524907B

龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310477230.6,技术领域涉及:G10L15/06;该发明授权基于多尺度SincNet和CGAN的端到端说话人辨认方法是由魏光村;张艳娜;郭泊言;闵航;许云飞设计研发完成,并于2023-04-28向国家知识产权局提交的专利申请。

基于多尺度SincNet和CGAN的端到端说话人辨认方法在说明书摘要公布了:本发明属于说话人辨认技术领域,具体公开了一种基于多尺度SincNet和CGAN的端到端说话人辨认方法。本发明引入多尺度SincNet,避免了在手工特征转换时丢失重要的信息,多尺度SincNet根据三个定制滤波器组捕获波形中三个通道的低级语音表示,使SincGAN模型更好地捕获重要的窄带说话人特征,本发明基于改进的条件生成对抗网络进行端到端识别,实现了用少量的训练语句辨别说话人,本发明损失函数包括经典GAN的对抗损失和分类任务的分类交叉熵损失。实验结果表明,在TIMIT和LIBRISPEECH语料库上,本发明模型表现出更好的性能,在缺乏训练数据时,本发明模型表现出比基线方法更强的鲁棒性。

本发明授权基于多尺度SincNet和CGAN的端到端说话人辨认方法在权利要求书中公布了:1.基于多尺度SincNet和CGAN的端到端说话人辨认方法,其特征在于, 包括如下步骤: 步骤1.对输入的原始语音信号进行语音分帧预处理操作,得到语音帧,将语音帧作为真实语音样本;将真实语音样本分为训练样本和测试样本,分别用于模型训练和模型测试; 步骤2.搭建说话人辨认模型SincGAN; 说话人辨认模型SincGAN由生成器网络以及鉴别器网络组成; 生成器网络包括一个多尺度SincNet层、三个卷积层、两个转置卷积层和一个自适应平均池化层; 定义生成器网络中的多尺度SincNet层为第一多尺度SincNet层;定义生成器网络中的三个卷积层分别为第一、第二、第三卷积层,两个转置卷积层分别为第一、第二转置卷积层; 真实语音样本在生成器网络中的处理流程如下: 真实语音样本首先经过第一多尺度SincNet层进行特征提取,得到语音信号的二维特征,然后语音信号的二维特征依次经过第一卷积层、第二卷积层、第一转置卷积层、第二转置卷积层、第三卷积层以及自适应平均池化层,生成虚假语音样本; 鉴别器网络包括一个多尺度SincNet层、五个卷积层、三个瓶颈式残差块堆叠层和四个全连接层; 定义鉴别器网络中的多尺度SincNet层为第二多尺度SincNet层; 定义鉴别器网络中的五个卷积层分别为第四、第五、第六、第七以及第八卷积层; 定义鉴别器网络中的三个瓶颈式残差块堆叠层分别为第一、第二以及第三瓶颈式残差块堆叠层,四个全连接层分别为第一、第二、第三以及第四全连接层; 真实语音样本和虚假语音样本在鉴别器网络中的处理流程如下: 真实语音样本和虚假语音样本首先经过第二多尺度SincNet层进行特征提取,得到语音信号的二维特征,然后语音信号的二维特征依次经过第四卷积层、第一瓶颈式残差块堆叠层、第五卷积层、第二瓶颈式残差块堆叠层、第六卷积层、第二瓶颈式残差块堆叠层、第七卷积层、第八卷积层、第一全连接层以及第二全连接层; 第二全连接层的输出分为两路,一路经过第三全连接层输出真假标志,另一路经过第四全连接层输出N维向量,分别对应于真实语音样本的说话人类别标签; 鉴别器网络输出的N维向量输入到Softmax函数中,通过将输出的向量映射到概率分布上,将最大概率预测类别的说话人类别标签作为预测输出; 步骤3.利用步骤1中的训练样本对步骤2搭建的说话人辨认模型SincGAN进行训练,通过反向传播优化说话人辨认模型的参数以最小化目标函数,得到训练好的说话人辨认模型SincGAN,并利用测试样本对训练好的说话人辨认模型SincGAN进行测试; 步骤4.利用训练好的SincGAN对给定的语音信号进行预测,输出对应的说话人标签。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东科技大学,其通讯地址为:266590 山东省青岛市黄岛区前湾港路579号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。