Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 唯品会(广州)软件有限公司邓佳阳获国家专利权

唯品会(广州)软件有限公司邓佳阳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉唯品会(广州)软件有限公司申请的专利语义相似度模型的训练集获取方法、装置及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115935190B

龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211717192.9,技术领域涉及:G06F18/214;该发明授权语义相似度模型的训练集获取方法、装置及计算机设备是由邓佳阳;林嘉良设计研发完成,并于2022-12-29向国家知识产权局提交的专利申请。

语义相似度模型的训练集获取方法、装置及计算机设备在说明书摘要公布了:本申请提供了一种语义相似度模型的训练集获取方法、装置及计算机设备,该方法包括:根据原始语料库的各个相似文本分组,构建多个相似训练样本;针对每个所述第一自然语言文本,根据该第一自然语言文本所属的相似文本分组,在所述原始语料库中确定与该第一自然语言文本语义不相似的各个目标语言文本,并分别计算该第一自然语言文本和每个所述目标语言文本之间的字面相似度,基于字面相似度最高的M个所述目标语言文本构建M个不相似训练样本;将各个所述相似训练样本和各个所述不相似训练样本作为用于获取语义相似度模型的训练集。采用本申请的方案可以提高语义相似度模型的泛化性和检测准确性。

本发明授权语义相似度模型的训练集获取方法、装置及计算机设备在权利要求书中公布了:1.一种语义相似度模型的训练集获取方法,其特征在于,所述方法包括: 根据原始语料库的各个相似文本分组,构建多个相似训练样本;其中,每个所述相似文本分组包括多个两两语义相似的自然语言文本,每个相似训练样本包括属于同一所述相似文本分组的第一自然语言文本和第二自然语言文本; 针对每个所述第一自然语言文本,根据该第一自然语言文本所属的相似文本分组,在所述原始语料库中确定与该第一自然语言文本语义不相似的各个目标语言文本,并分别计算该第一自然语言文本和每个所述目标语言文本之间的字面相似度,基于字面相似度最高的M个所述目标语言文本构建M个不相似训练样本;其中,M为预设的正整数; 获取预设的不相似训练样本数量,所述不相似训练样本数量是根据预设的样本比例确定的; 针对每个所述第一自然语言文本,从该第一自然语言文本对应的各个所述目标语言文本中,随机选取N-M个所述目标语言文本,并基于随机选取的N-M个所述目标语言文本,构建N-M个不相似训练样本;其中,N为所述不相似训练样本数量,且N大于M; 将各个所述相似训练样本和各个所述不相似训练样本作为用于获取语义相似度模型的训练集; 其中,所述从该第一自然语言文本对应的各个所述目标语言文本中,随机选取N-M个所述目标语言文本的步骤,包括: 从该第一自然语言文本对应的各个所述目标语言文本中,随机选取多个所述目标语言文本; 根据字面相似度最高的M个所述目标语言文本,对随机选取的多个所述目标语言文本进行去重,以得到N-M个所述目标语言文本。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人唯品会(广州)软件有限公司,其通讯地址为:510000 广东省广州市海珠区鼎新路128号601室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。