厦门大学;泉州经贸职业技术学院张建寰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学;泉州经贸职业技术学院申请的专利面向动态场景的梯度感知自监督单目深度估计方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121810754B 。
龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610270332.4,技术领域涉及:G06T7/50;该发明授权面向动态场景的梯度感知自监督单目深度估计方法及装置是由张建寰;代继栋;张陈涛;叶茂樟;李小丽;徐周毅;郑高峰设计研发完成,并于2026-03-06向国家知识产权局提交的专利申请。
本面向动态场景的梯度感知自监督单目深度估计方法及装置在说明书摘要公布了:本发明公开了一种面向动态场景的梯度感知自监督单目深度估计方法及装置,包括图像处理领域,包括:构建单目深度估计模型、预训练的伪深度预测模型和姿态估计网络,利用预训练的伪深度预测模型和姿态估计网络对单目深度估计模型进行训练,得到经训练的单目深度估计模型;单目深度估计模型采用梯度感知的密集跳跃连接结构,在训练过程中所使用的损失函数包括掩码加权光度损失、几何一致性损失、全局深度排序约束损失、法线匹配损失、边缘相对法线损失和多尺度特征对齐损失;获取待估计的单帧图像并输入到经训练的单目深度估计模型中,经过梯度感知的密集跳跃连接结构,得到预测深度图。本发明解决现有深度估计模型语义不一致、空间对齐不足等问题。
本发明授权面向动态场景的梯度感知自监督单目深度估计方法及装置在权利要求书中公布了:1.一种面向动态场景的梯度感知自监督单目深度估计方法,其特征在于,包括以下步骤: 构建单目深度估计模型、预训练的伪深度预测模型和姿态估计网络,并利用所述预训练的伪深度预测模型和姿态估计网络对所述单目深度估计模型进行训练,得到经训练的单目深度估计模型;所述单目深度估计模型包括编码器、中间组合层和解码器,并构成梯度感知的密集跳跃连接结构,在所述单目深度估计模型的训练过程中所使用的损失函数包括掩码加权光度损失、几何一致性损失、全局深度排序约束损失、法线匹配损失、边缘相对法线损失和多尺度特征对齐损失; 所述掩码加权光度损失的构建过程包含以下步骤:获取单目视频序列并将其中相邻两帧单目图像作为参考帧和源帧;将所述参考帧和所述源帧分别输入到所述单目深度估计模型,得到所述参考帧的预测深度图和所述源帧的预测深度图;将所述参考帧和所述源帧输入到所述姿态估计网络,得到对应的相对相机位姿;获取相机内参,根据所述源帧的预测深度图、所述相对相机位姿、相机内参和所述参考帧构建光度一致性损失,所述光度一致性损失的构建过程如下: 将所述源帧的预测深度图、所述相对相机位姿和所述相机内参输入至重投影和双线性可微采样算法,得到对应的重建图像; 根据所述参考帧和所述重建图像计算光度一致性损失,如下式所示: ; 其中,表示所述参考帧与所述重建图像在第个有效像素点的光度一致性损失,表示权重系数,表示所述参考帧与所述重建图像在第个有效像素点的结构相似度,与分别表示所述参考帧与所述重建图像中在第个有效像素点位置处的像素值,表示L1范数; 基于所述相对相机位姿将所述参考帧的预测深度图重投影至源帧坐标系并与所述源帧的预测深度图进行对齐,计算像素级归一化深度不一致度,并根据所述像素级归一化深度不一致度生成自发现掩码;利用所述自发现掩码对光度一致性损失进行加权得到所述掩码加权光度损失;所述掩码加权光度损失的计算过程如下: 将所述参考帧的预测深度图中的每个像素点的预测深度值重投影到三维空间,并通过所述相对相机位姿映射到所述源帧坐标系,得到所述参考帧在所述源帧坐标系下的预测深度图,并利用参考帧在源帧坐标系下的预测深度图在所述源帧的预测深度图上进行双线性插值采样,得到所述源帧的对齐深度图,如下式所示: ; ; 其中,表示所述参考帧到所述源帧的相对相机位姿,表示所述参考帧的预测深度图上的第个有效像素点的预测深度值,表示重投影与映射操作,表示所述参考帧在所述源帧坐标系下的预测深度图上的第个有效像素点的预测深度值,表示双线性插值采样操作,表示所述源帧的预测深度图上的第个有效像素点的预测深度值,表示所述源帧的对齐深度图上的第个有效像素点的预测深度值; 采用下式计算所述源帧的预测深度图与所述参考帧的预测深度图之间的像素级归一化深度不一致度: ; 其中,表示所述源帧的预测深度图与所述参考帧的预测深度图在第个有效像素点的像素级归一化深度不一致度; 根据所述像素级归一化深度不一致度计算自发现掩码,如下式所示: ; 其中,表示在第个有效像素点的自发现掩码; 利用所述自发现掩码对光度一致性损失进行加权并求均值,得到掩码加权光度损失,如下式所示: ; 其中,表示在投影与插值过程中成功对齐的有效像素点的集合,表示有效像素点的集合中有效像素点的总数,表示掩码加权光度损失; 采用下式计算所述几何一致性损失: ; 其中,表示所述几何一致性损失; 获取待估计的单帧图像并输入到所述经训练的单目深度估计模型中,经过梯度感知的密集跳跃连接结构处理,得到对应的预测深度图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学;泉州经贸职业技术学院,其通讯地址为:361000 福建省厦门市思明区思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励