江西师范大学陈志威获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西师范大学申请的专利基于递归语义优化的零样本指示图像分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121505278B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610044629.9,技术领域涉及:G06V10/26;该发明授权基于递归语义优化的零样本指示图像分割方法是由陈志威;赵胜敏;张苗辉;何斌;江爱文;王明文设计研发完成,并于2026-01-14向国家知识产权局提交的专利申请。
本基于递归语义优化的零样本指示图像分割方法在说明书摘要公布了:本发明公开了基于递归语义优化的零样本指示图像分割方法,涉及多模态图像分割技术领域;本发明使用SegmentAnythingModel生成图像的候选掩码;然后图像通过构建的视觉Transformer主干网络,视觉Transformer主干网络是CLIP的图像编码器,包括局部分支和全局分支,分别提取局部特征和全局上下文信息;接着递归上下文注意力模块用于聚合多尺度上下文信息,增强长距离依赖建模,语义特征精细化模块通过计算视觉特征与文本特征的相似度,生成语义关注图并优化视觉表示,最后结合候选掩码和区域特征,通过加权融合得到最终的分割结果,从而在零样本指示图像分割任务中,显著提升了分割精度和语义对齐度。
本发明授权基于递归语义优化的零样本指示图像分割方法在权利要求书中公布了:1.基于递归语义优化的零样本指示图像分割方法,其特征在于:具体步骤包括: 步骤1,通过SegmentAnythingModel生成输入图像的候选掩码; 步骤2,将图像输入至视觉Transformer主干网络,其中视觉Transformer主干网络是CLIP的图像编码器,提取多尺度视觉特征和注意力图,所述主干网络包括局部分支和全局分支,局部分支通过逐元素乘积与生成的掩码提取区域特征,全局分支通过高斯模糊处理非掩码区域的上下文信息,保留全局语义; 步骤3,设计递归上下文注意力模块,聚合多尺度上下文信息以增强长程依赖建模; 步骤4,设计语义特征精细化模块,计算视觉特征与文本嵌入之间的语义相似性,重构语义感知的注意力矩阵以优化视觉特征; 步骤5,对生成的候选掩码进行下采样,并与局部分支的类别令牌进行融合,提取区域特征; 步骤6,计算区域特征与经过了CLIP的文本编码器后的文本特征,选取相似度最高的一张掩码的区域作为最终的分割结果; 步骤3中的递归上下文注意力模块的具体实现包括从视觉Transformer中提取原始图像的中间注意力图,进行平均融合,从第9层开始,将当前层自注意力权重与全局上下文注意力进行加权融合; 步骤4中的语义特征精细化模块的操作包括从视觉Transformer中提取多尺度视觉特征,并将其展平为空间特征向量,通过CLIP视觉投影矩阵将其投影到文本特征空间中,计算投影后的视觉特征与文本嵌入之间的相似度,生成语义图并进行加权融合; 步骤5中的区域特征融合过程包括对生成的候选掩码进行下采样,并与特征图分辨率对齐,然后对优化后的视觉特征进行掩码加权池化,通过逐元素乘积与掩码值相结合,生成每个区域的特征表示,并与局部分支的类别令牌特征进行加权融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西师范大学,其通讯地址为:330000 江西省南昌市高新技术开发区紫阳大道99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励