电子科技大学许文波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于核采样的摘要自动生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115186089B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210810578.8,技术领域涉及:G06F16/34;该发明授权一种基于核采样的摘要自动生成方法是由许文波;孙靖哲;赫熙煦;李建;刘博文;胡佳丽设计研发完成,并于2022-07-11向国家知识产权局提交的专利申请。
本一种基于核采样的摘要自动生成方法在说明书摘要公布了:本发明公开了一种基于核采样的摘要自动生成方法,使用UniLM模型,使得在理解原文时可以结合上下文的语义信息,语义理解效果更好;在生成摘要时,通过Mask机制单向生成,符合文本续写的逻辑;且UniLM模型通过多任务进行预训练,拥有更强的泛化能力。在UniLM进行解码时,采用核采样函数,根据核采样函数构造Mask矩阵,使得待生成的词语在有限的范围内随机采样生成,主要解决生成式摘要生成重复文本的问题。
本发明授权一种基于核采样的摘要自动生成方法在权利要求书中公布了:1.一种基于核采样的摘要自动生成方法,其特征在于,具体包括如下步骤: 步骤1,使用微博摘要数据集,基于UniLM预训练模型,进行数据清洗,划分训练集和测试; 步骤2,构造适用于Seq2Seq的Mask矩阵; 步骤3,对UniLM语言模型的参数微调,即Fine-Tuning; 步骤4,核采样解码: a首先,根据输入的温度参数t,通过公式 对Token的原始概率分布进行重新塑形; b其次,根据输入的阈值p,定义Top-p的词汇表为满足条件的最小词汇集合; c然后,令,将初始条件概率分布重新缩放为新分布,其中当时,,否则为0,以此构造核采样函数; d最后,根据新分布对应的概率从大到小排序并逐个累加,形成候选Token集合,并从中随机采样得到预测Token; 步骤5,对于生成摘要需要预测的摘要部分,以每个Token为单位,循环核采样解码,形成摘要生成模型; 步骤6,将数据清洗后的测试集输入摘要生成模型,获得摘要结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励