武汉天喻信息产业股份有限公司胡波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉天喻信息产业股份有限公司申请的专利一种基于信息抽取的文档历史脉络提取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116340505B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310346216.2,技术领域涉及:G06F16/34;该发明授权一种基于信息抽取的文档历史脉络提取方法及装置是由胡波;邓嘉;董逢华设计研发完成,并于2023-03-31向国家知识产权局提交的专利申请。
本一种基于信息抽取的文档历史脉络提取方法及装置在说明书摘要公布了:本发明公开了一种基于信息抽取的文档历史脉络提取方法及装置,涉及信息抽取领域,该方法包括获取文档并按照设定字符清洗规则对文档进行清洗处理,得到清洗后的文档;解析清洗后文档的条款内容,并根据各条款的层次序号,对文档进行层次化表示;基于深度学习模型对文档的条款关系和条款时间进行识别,并输出识别结果。本发明可极大程度地提高模型的泛化性和准确性,仅需少量标注后的文档文件就可获得泛化性强的文档脉络识别能力。
本发明授权一种基于信息抽取的文档历史脉络提取方法及装置在权利要求书中公布了:1.一种基于信息抽取的文档历史脉络提取方法,其特征在于,具体包括以下步骤: 获取文档并按照设定字符清洗规则对文档进行清洗处理,得到清洗后的文档; 解析清洗后文档的条款内容,并根据各条款的层次序号,对文档进行层次化表示; 基于深度学习模型对文档的条款关系和条款时间进行识别,并输出识别结果; 其中,所述基于深度学习模型对文档的条款关系和条款时间进行识别,其中,对文档的条款关系的识别,具体步骤包括: 基于设定规则识别得到条款中的条款名和文号,并将条款和识别得到的条款名进行连接; 基于textcnn分类模型预测各条款中是否存在废除和修改关系,并将textcnn分类模型的预测结果和设定规则的识别结果进行对比: 若一致,则输出预测结果,并对废除和修改关系进行ner识别,识别条款中的具体款项并转换为统一标识符,以判断得到条款所属的文档; 若不一致,则输出设定规则的识别结果,并对废除和修改关系进行ner识别,识别条款中的具体款项并转换为统一标识符,以判断得到条款所属的文档; 其中,所述基于深度学习模型对文档的条款关系和条款时间进行识别,其中,对文档的条款时间的识别,具体步骤包括: 基于ner模型识别得到文档中的条款名、文号、开始时间、截止时间和条款; 将识别结果输入PLmarker关系预测模型,预测条款名-文号、条款名-条款、条款名-开始\截止时间、条款-开始\截止时间; 对时间进行解析,对于时间点类型的时间直接填入,时间区间类型的时间则解析成对应的2个时间点后填入; 其中,所述输出识别结果,具体步骤包括: 将文档的条款关系和条款时间的识别结果合并,得到各文档之间、条款之间、条款之间的修改关系,以及文档、条款的有效时间,作为文档历史脉络进行输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉天喻信息产业股份有限公司,其通讯地址为:430000 湖北省武汉市东湖开发区华中科技大学科技园天喻大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励