深圳鼎匠科技有限公司娄珂获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳鼎匠科技有限公司申请的专利基于树模型的语料对齐方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116187351B 。
龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211550190.5,技术领域涉及:G06F40/58;该发明授权基于树模型的语料对齐方法及装置是由娄珂;周振彬;宾朝林;秦文礼设计研发完成,并于2022-12-05向国家知识产权局提交的专利申请。
本基于树模型的语料对齐方法及装置在说明书摘要公布了:本发明公开了一种基于树模型的语料对齐方法及装置,该方法包括:对初始语料集进行语料预处理,获得第一语料列表以及第二语料列表;根据所述第一语料列表以及所述第二语料列表中,各元素的正向条件概率和逆向条件概率,获得所述初始语料集的关联矩阵;更新所述关联矩阵;当所述关联矩阵中的各元素值不再变化时,获得对应于所述关联矩阵的多个预对齐树模型,所述预对齐树模型用于实现语料对齐。通过初始语料集进行条件概率的计算,获得对应的关联矩阵,并根据更新流程对所述关联矩阵进行迭代更新,获得了大规模语料库中用于实现语料对齐的多个预对齐树模型,由此提升了语料对齐的效率。
本发明授权基于树模型的语料对齐方法及装置在权利要求书中公布了:1.一种基于树模型的语料对齐方法,其特征在于,所述方法包括: 对初始语料集进行语料预处理,获得第一语料列表以及第二语料列表; 根据所述第一语料列表以及所述第二语料列表中,各元素的正向条件概率和逆向条件概率,获得所述初始语料集的关联矩阵; 更新所述关联矩阵;当所述关联矩阵中的各元素值不再变化时,获得对应于所述关联矩阵的多个预对齐树模型,所述预对齐树模型用于实现语料对齐; 其中,所述更新所述关联矩阵,包括: 根据所述关联矩阵,按照源语言的字符位置进行语料排序,分别获得第三语料列表以及第四语料列表; 根据所述第三语料列表以及所述第四语料列表,通过语料统计配对算法,获得对应于所述第三语料列表中每个元素的第一树模型;所述语料统计配对算法用于从所述第四语料列表中,选取与所述第三语料列表中每个元素存在对应关系的语料,作为所述第一树模型的节点; 根据数据统计分解算法,对所述第一树模型进行处理,获得对应于每个所述第一树模型的第二树模型;以及,根据所述第二树模型,获得对应于所述第三语料列表中每个元素的主语料; 根据所述源语言的字符位置,通过所述第二树模型确定对应于所述源语言中各语料的备选目标语料; 确定所述源语言中各语料与所述备选目标语料的对齐概率,并确定所述对齐概率超过预设对齐概率阈值的所述备选目标语料,作为对应于所述源语言中各语料的目标语料。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳鼎匠科技有限公司,其通讯地址为:518066 广东省深圳市南山区前海深港合作区南山街道兴海大道3040号前海世茂金融中心二期2005;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励