扬州大学李斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉扬州大学申请的专利一种基于词典的新工科专业中文知识概念抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116127954B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211705135.9,技术领域涉及:G06F40/242;该发明授权一种基于词典的新工科专业中文知识概念抽取方法是由李斌;陈强;吴宇馨;李坤设计研发完成,并于2022-12-29向国家知识产权局提交的专利申请。
本一种基于词典的新工科专业中文知识概念抽取方法在说明书摘要公布了:本发明公开了一种基于词典的新工科专业中文知识概念抽取方法,包括以下步骤:1获取新工科相关细分专业,将所有课程的教材与教学大纲转化为文本数据;2利用相关文本数据经过分词处理获得相应词,并在此基础上训练出word2vec词向量模型与原始词向量;3通过爬虫技术,获得大量相关课程专业词汇集合,选择相应专业的关键词作为种子,输入到训练完成的word2vec模型中,获得相似度在阈值之上的词汇,与分词的词汇共同组成新工科知识概念词典;4构建NECE模型,对课程原始教材进行知识概念识别,并存储概念集。本发明能够利用word2vec模型构建相应课程专业词汇集合与词向量;并利用NECE模型实现对专业课程概念进行抽取,为教育系统的知识图谱构建奠定数据基础。
本发明授权一种基于词典的新工科专业中文知识概念抽取方法在权利要求书中公布了:1.一种基于词典的新工科专业中文知识概念抽取方法,其特征在于,包括以下步骤: 1获取新工科的学科专业的课程,并将所有课程的教材与教学大纲转化为原始文本数据; 2利用所述原始文本数据经过分词处理获得相应词,并在此基础上训练出word2vec词向量模型与原始词向量; 3通过python爬虫技术,获取相关领域词典集合,共同组成候选词汇集合;人工选取相关专业重要概念作为种子词,使用步骤2中训练的word2vec模型,进行词向量相似计算;选择skip-gram模型进行词向量相似度计算,分别计算与不同种子词的相似度,取TopK作为外部词库,并将其转化成适用于NECE模型的指定维度词向量,与切词文件中的词组成新工科相关课程的专业词典; 4构建新工科知识概念识别NECE模型,对原始文本数据进行知识概念识别,并存储概念集; 所述步骤4包括以下步骤: 41构建新工科知识概念识别NECE模型,通过已有的标注文本数据,对NECE模型进行预训练;所述NECE模型从下至上依次是字符嵌入层、词典匹配层、序列建模层、CRF层; 42在NECE模型中,由底层的字符嵌入层对原始文本数据进行基于字符向量嵌入表示,对每一字符在词典中进行匹配查找该字符位于词典的词汇;然后将词典中对应的词信息与原始文本字向量拼接输入序列建模层,该层为字符之间的依赖关系建模;序列建模层采用双向长短期记忆网络、卷积神经网络;在序列建模层之上,基于条件随机场层一次性对整个字符序列进行标签推断,从而对每个字符进行打标签,完成知识概念的识别,输出新工科相关课程概念,并存储。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人扬州大学,其通讯地址为:225009 江苏省扬州市大学南路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励