天津师范大学;天津艾思科尔科技有限公司张重获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津师范大学;天津艾思科尔科技有限公司申请的专利一种基于文本增强视觉语言模型的行人重识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121617043B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610141775.3,技术领域涉及:G06V20/52;该发明授权一种基于文本增强视觉语言模型的行人重识别方法是由张重;樊硕扬;张德馨;刘爽;范晓婷设计研发完成,并于2026-02-02向国家知识产权局提交的专利申请。
本一种基于文本增强视觉语言模型的行人重识别方法在说明书摘要公布了:本发明公开了一种基于文本增强视觉语言模型的行人重识别方法,该方法包括:构建视觉特征提取模块,提取得到RGB行人图像的视觉特征;构建文本特征提取模块,提取得到行人文本描述的文本特征;构建文本摘要模块,生成行人文本描述的摘要特征;构建损失计算模块,得到最优行人重识别模型;构建行人检索模块,利用最优行人重识别模型得到行人图像检索结果。本发明有效地通过引入文本摘要模块,生成更具判别力的行人文本描述的摘要特征,为充分利用行人文本描述的摘要特征又提出了摘要特征约束损失函数,从而进一步提高了行人重识别的准确率。
本发明授权一种基于文本增强视觉语言模型的行人重识别方法在权利要求书中公布了:1.一种基于文本增强视觉语言模型的行人重识别方法,其特征在于:所述方法包括以下步骤: 步骤S1,构建视觉特征提取模块,利用所述视觉特征提取模块提取RGB行人图像的视觉特征; 步骤S2,构建文本特征提取模块,利用所述文本特征提取模块提取行人文本描述的文本特征; 步骤S3,构建文本摘要模块,在所述文本摘要模块中,随机初始化可学习的文本摘要向量,利用交叉注意力机制将所述可学习的文本摘要向量与行人文本描述的文本特征进行融合,生成行人文本描述的摘要特征; 步骤S4,构建损失计算模块,将所述RGB行人图像的视觉特征、行人文本描述的文本特征、行人文本描述的摘要特征输入到所述损失计算模块中,利用得到的损失值对于由所述视觉特征提取模块、文本特征提取模块、文本摘要模块和损失计算模块组成的行人重识别模型进行优化,得到最优行人重识别模型; 其中,所述损失计算模块表示为: , 其中,和分别为相似度分布匹配损失函数和摘要特征约束损失函数的权重系数,为交叉熵损失函数,由视觉模态的交叉熵损失函数和文本模态的交叉熵损失函数组成,相似度分布匹配损失函数由视觉模态到文本模态的相似度分布匹配损失函数和文本模态到视觉模态的相似度分布匹配损失函数组成,摘要特征约束损失函数为: , 其中,是一个小批量中行人的总数,是第个行人的RGB行人图像的视觉特征,是第个行人的行人文本描述的文本特征,是第个行人的行人文本描述的摘要特征,是行人文本描述的文本特征和行人文本描述的摘要特征的权重系数,是摘要特征约束损失函数中控制平滑性的温度系数; 步骤S5,构建行人检索模块,在所述行人检索模块中,利用所述最优行人重识别模型提取待检索RGB行人图像的视觉特征以及待检索行人文本描述的文本特征,然后计算两种特征之间的相似度,将所得相似度由高到低排序,得到行人图像检索结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津师范大学;天津艾思科尔科技有限公司,其通讯地址为:300387 天津市西青区宾水西道393号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励