南京大学黄书剑获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利机器翻译模型的训练方法、装置和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116522961B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310244591.6,技术领域涉及:G06F40/58;该发明授权机器翻译模型的训练方法、装置和存储介质是由黄书剑;刘子涵;戴新宇;张建兵;陈家骏设计研发完成,并于2023-03-14向国家知识产权局提交的专利申请。
本机器翻译模型的训练方法、装置和存储介质在说明书摘要公布了:本发明公开了机器翻译模型的训练方法、装置和存储介质,方法为获取第i个词对第t的词的注意力分数;注意力分数和第i个词的词向量加权求和,得隐层向量;计算隐层向量与其对应离散隐变量的每个子属性值距离,距离最近子属性值为离散隐变量原始属性值;注意力分数和原始属性值对第t个词的离散隐变量加权求和,得属性向量;计算属性向量与第i个词的离散隐变量的每个子属性值距离,距离最近子属性值为第i个词离散隐变量的新属性值;损失函数对原始属性值和新属性值约束,得损失LC,新属性值融入隐层向量,得第i个词对应融合向量,利用融合向量计算机器翻译损失Lnmt;损失LC与损失Lnmt相加得最终损失函数,利用最终损失函数训练机器翻译模型。
本发明授权机器翻译模型的训练方法、装置和存储介质在权利要求书中公布了:1.机器翻译模型的训练方法,其特征在于:为源端和目标端中每个位置的词的离散属性都建模一个离散隐变量来表示,所述离散隐变量为所述离散属性中的每一个子属性都赋予一个子属性值,具体包括如下: S1:将所述源端和目标端的第i个词和第t个词分别转化为词向量ei和词向量et输入到神经网络翻译模型中,获取第i个词对第t个词的注意力分数ait,其中,t<i; S2:对所述注意力分数ait和词向量ei进行加权求和,得到第i个位置的词对应的隐层向量xi; S3:分别计算所述隐层向量xi与第i个词的离散隐变量的每个子属性值的距离,将距离最近的子属性值作为第i个词的离散隐变量的原始属性值li; S4:根据所述注意力分数ait和所述原始属性值li对第t个词的离散隐变量进行加权求和,得到第i个词对应的属性向量attri;分别计算所述属性向量attri与第i个词的离散隐变量的每个子属性值的距离,将距离最近的子属性值作为第i个词的离散隐变量的新属性值l2i; S5:利用损失函数对所述原始属性值li和所述新属性值l2i进行约束,得到损失LC,将所述新属性值l2i融入到所述隐层向量xi中,得到第i个词对应的融合向量hi,利用所述融合向量hi计算机器翻译的损失Lnmt; S6:通过所述损失LC与损失Lnmt相加得到机器翻译的最终损失函数L,利用机器翻译的最终损失函数L训练机器翻译模型;当所述离散隐变量表示性别的离散属性时,其分别为所述性别的离散属性中的男性赋予一个阳性值,为所述性别的离散属性中的女性赋予一个阴性值; S5中所述损失函数采用KL散度,损失LC的计算公式如下: LC=kl_divp1,p2; p1=softmax[d0,d1]; p2=softmax[d20,d21]; 其中,kl_div表示KL散度的损失,p1和p2表示概率分布;d0表示第i个词的隐层向量xi与第i个词的离散隐变量的阳性值的距离,d1表示第i个词的隐层向量xi与第i个词的离散隐变量的阴性值的距离,d20表示属性向量attri与第i个词的离散隐变量的阳性值的距离,d21表示属性向量attri与第i个词的离散隐变量的阴性值的距离,softmax为归一化指数函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210000 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励