深圳市凌云视迅科技有限责任公司王博帝获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市凌云视迅科技有限责任公司申请的专利一种倾斜文本行识别方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115565191B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211222343.3,技术领域涉及:G06V30/412;该发明授权一种倾斜文本行识别方法、系统及设备是由王博帝;彭斌;姚毅设计研发完成,并于2022-10-08向国家知识产权局提交的专利申请。
本一种倾斜文本行识别方法、系统及设备在说明书摘要公布了:本申请涉及文本识别方法技术领域,具体而言,涉及一种倾斜文本行识别方法、系统及设备,一定程度上可以解决在识别文本行时无法准确地识别出文本行中倾斜字体的问题。倾斜文本行识别方法包括:获取待识别图像;提取图像的多尺度特征并解码多尺度特征,获取解码后的多尺度特征;并基于解码后的多尺度特征,获取共享特征;基于共享特征,获得九通道特征图,并读取特征图中文本框的四个顶点坐标;基于文本框四个顶点坐标逐通道地对共享特征做透视变换,以得到特征图中文本区域特征;基于文本区域特征,获得最终识别字符串,并输出字符串。
本发明授权一种倾斜文本行识别方法、系统及设备在权利要求书中公布了:1.一种倾斜文本行识别方法,其特征在于,所述方法包括: 获取待识别图像,所述图像包含文本行; 提取所述图像的多尺度特征并解码所述多尺度特征,获取解码后的多尺度特征;并基于所述解码后的多尺度特征,获取共享特征; 基于所述共享特征,获得九通道特征图,并读取所述特征图中文本框的四个顶点坐标;其中,所述特征图中的第一个通道为分数图,所述分数图中的置信度高的区域对应所述图像中的文本行区域;所述特征图中剩余八个通道分别表示所述文本框顺时针四个顶点的坐标值; 基于所述文本框四个顶点坐标逐通道地对所述共享特征做透视变换,以得到文本区域特征; 基于文本区域特征,获得最终识别字符串,并输出所述字符串; 在所述基于所述共享特征,获得九通道特征图,并读取所述特征图中文本框的四个顶点坐标步骤中,进一步包括: 通过卷积层对所述共享特征进行处理,生成九通道的第一尺度特征图,所述特征图中剩余八个通道中,置信度高的区域表征坐标值,其中,包括多个置信度大于第一阈值的像素值的区域被表征为置信度高的区域,其余区域像素值为0; 在所述基于所述文本框四个顶点坐标逐通道地对所述共享特征做透视变换步骤中,进一步包括: 以所述文本框左上角顶点为起始点,将所述顶点顺时针排序,并依次获取四个顶点坐标; 对四个所述顶点坐标作透视变换,四个顶点透视变换后的坐标分别为0,0、w,0、w,h、0,h,其中,h为第一高度值,w是所述文本框宽高比在透视变化前后保持不变时,宽度缩放后的值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市凌云视迅科技有限责任公司,其通讯地址为:518000 广东省深圳市南山区南山智园C区2号楼11层1101室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励