Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 苏州空天信息研究院郑杰获国家专利权

苏州空天信息研究院郑杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉苏州空天信息研究院申请的专利一种融合新闻发生时间与语义相似度的事件脉络链路生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116955537B

龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310978360.8,技术领域涉及:G06F16/334;该发明授权一种融合新闻发生时间与语义相似度的事件脉络链路生成方法是由郑杰;顾爽;沈红;蒋涛;杜星;陈曦圆;杨苏;周震设计研发完成,并于2023-08-04向国家知识产权局提交的专利申请。

一种融合新闻发生时间与语义相似度的事件脉络链路生成方法在说明书摘要公布了:本发明公开一种融合新闻发生时间与语义相似度的事件脉络链路生成方法,对新闻文本内容进行嵌入式表征,对新闻发生时间进行数字化表示,完成新闻集合预处理;对预处理后的新闻集合按照发生时间进行窗口划分,形成若干新闻子集合;结合新闻的发生时间和文本内容信息,对每一个窗口内的新闻子集合使用聚类算法计算事件簇结果并进行评估;在各个窗口下计算得到的事件簇结果中,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点形成新一轮的新闻集合;针对新形成的新闻集合,重复上述过程,直至得到最终的事件脉络结果。本发明提高了新闻事件脉络结果生成的准确性、可解释性以及高效性。

本发明授权一种融合新闻发生时间与语义相似度的事件脉络链路生成方法在权利要求书中公布了:1.一种融合新闻发生时间与语义相似度的事件脉络链路生成方法,其特征在于,包括如下步骤: 步骤1:新闻数据预处理:对新闻文本内容进行嵌入式表征,对新闻发生时间进行数字化表示,完成新闻集合预处理; 步骤2:新闻集合窗口划分:对预处理后的新闻集合按照发生时间进行窗口划分,形成若干新闻子集合; 步骤3:新闻事件簇计算:结合新闻的发生时间和文本内容信息,对每一个窗口内的新闻子集合使用聚类算法计算事件簇结果并进行评估; 步骤4:新闻窗口事件簇融合:在各个窗口下计算得到的事件簇结果中,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点形成新一轮的新闻集合; 步骤5:新闻事件脉络结果迭代更新:针对新形成的新闻集合,重复执行步骤2到步骤4,直至得到最终的事件脉络结果; 其中: 步骤1,新闻数据预处理,具体方法为: 使用TF-IDF,对新闻文本内容进行嵌入式表征; 使用时间戳的方式,将新闻发生时间按照固定格式解析成时间戳; 步骤2,新闻集合窗口划分,具体方法为: 对新闻发生时间戳,按照从小到大排序得到新闻发生的先后顺序; 对排序后的新闻集合,按照窗口进行切分,形成若干新闻子集合; 步骤3,新闻事件簇计算,具体方法为: 步骤3.1:计算新闻事件集合之间的语义距离矩阵:经过步骤1的预处理后,新闻集合的文本内容被表示成向量,这里记作X,使用余弦距离计算新闻事件集合的语义距离矩阵,具体计算方式如下: Dx=1-X'X'T2 其中,X是使用TF-IDF表示的新闻文本语义矩阵,矩阵一行表示一条新闻的文本向量,X'表示归一化后的X矩阵,Dx表示新闻事件集合的语义距离矩阵; 步骤3.2:计算新闻事件之间的时间距离特征矩阵:以天作为最小时间粒度,经过步骤1的预处理,新闻事件的发生时间戳集合记为{t1,t2…tn}; 首先构建新闻事件集合的时间矩阵: 使用阈值threshold剔除掉时间矩阵T中时间跨度过长的元素: 计算新闻事件集合的时间距离特征矩阵Dt: 其中,e表示自然常数,ij表示矩阵下标,w为调整系数,控制时间特征的分布离散程度,默认设置为0.1; 步骤3.3:融合语义距离矩阵和时间距离矩阵:将步骤3.1和步骤3.2计算得到的语义距离矩阵和时间距离特征矩阵融合,得到融合特征矩阵Dmix,这里使用一种特征融合权重进行计算,记为wt,默认值设置为0.5,计算公式如下: Dmix=wtDx+1-wtDt6 步骤3.4:使用聚类算法进行事件簇划分并评估划分结果:根据步骤3.3得到的融合特征矩阵Dmix,使用层次聚类算法划分事件簇,首先,为层次聚类算法在区间范围内取多值作为聚类中心个数,默认聚类中心个数设置为在区间[2,10]之间;然后,输入融合特征矩阵Dmix,根据设置不同的聚类中心数量,生成多种事件簇划分结果;最后,使用轮廓系数对多个新闻事件簇划分结果进行评估,选择得分最高的结果作为该窗口的事件簇输出结果; 步骤4,新闻窗口事件簇融合,具体方法为: 针对各个窗口下计算得到的事件簇结果,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点替代事件簇本身,形成新一轮的新闻集合,其中事件簇代表节点的选择策略是采用一种基于距离密度的计算方法,假设事件簇中节点个数为N,则代表节点选择策略的计算公式如下: si∈S,S={s1,s2…,sN}8 k=argmaxS9 其中,i,j表示融合特征矩阵的行、列号,si表示第i个节点的得分,k表示当前事件簇中被选择的节点下标;经过计算,每一个事件簇都会有一个代表节点,将所有事件簇的代表节点合并后形成新的新闻集合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州空天信息研究院,其通讯地址为:215000 江苏省苏州市苏州工业园区独墅湖大道158;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。