Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于迭代语义视觉关联的指向物文本定位方法,该方法包括:获取包含指向物的文档图像及自然语言指令;提取视觉与语言特征,预测指向物边界框并生成指向掩码以提取指向上下文特征;将指向上下文特征与指令语义拼接生成通道缩放系数,对视觉特征...
  • 本申请涉及图像识别与数据处理的技术领域,尤其是涉及一种用于角度距离分析的数据定位方法、系统及设备,其方法包括对待处理图像数据进行预处理,利用集成的OCR技术对预处理后的待处理图像数据生成数据块信息集合;根据所述参考数据块集合中的参考数据块构...
  • 本发明涉及图像识别技术领域,公开了一种基于多识别目标分类的多路由OCR识别系统,包括图像特征提取模块,用于获取浅层特征张量;路由分配模块,用于根据局部梯度分布生成路由控制掩码;以及并行识别模块,其包含印刷识别单元以及手写识别单元,其中,路由...
  • 本申请提供了一种文档背景干扰去除方法及设备,通过获取待处理文档内的原始图像;对所述原始图像进行像素颜色聚类,得到多个颜色聚类簇;基于所述原始图像和所述多个颜色聚类簇,生成与每个颜色聚类簇相对应的掩码图像,得到多个掩码图像;响应于所述多个掩码...
  • 本发明公开了一种基于多尺度卷积与注意力机制的电力设备故障案例文本检测与识别方法,涉及电力设备运维与计算机视觉技术领域,包括构建并训练一种文本检测模型,模型在主干网络中集成了多尺度卷积注意力模块;利用训练好的文本检测模型对目标图像进行文本区域...
  • 本发明涉及一种光学标记识别方法、装置、计算机设备及存储介质,所述方法包括:获取原始图像;从所述原始图像中定位待判断区域;获取每个所述待判断区域的特征值;根据每个所述待判断区域的特征值,获取每个所述待判断区域的注意力权重值;根据每个所述待判断...
  • 本公开提供了一种单证影像的分类方法、系统、设备、介质及程序产品,该方法包括:利用图像分类模型对待分类的单证影像进行图像分类,获取图像分类模型的维向量;利用OCR模型对待分类的单证影像进行文本提取,并对提取的文本进行分词,得到分词集合;利用文...
  • 本发明属于人工智能与审计学的技术领域,具体涉及基于大模型和多模态数据融合的智能化审计方法及装置。所述方法包括:首先构建向量知识库,然后提取非结构化票据数据、原始审计文本和原始审计表格的深层特征,并基于跨模态对比学习并融合基于风险感知注意力的...
  • 本发明提供一种基于自适应预处理的字体识别方法、装置、设备和介质,方法包括:对采集的字体图像进行自适应预处理,所述预处理包括动态噪声抑制、光照不均校正及亚像素级几何校正,得到校正后的文字图像;对所述校正后的文字图像进行多维度特征提取,构建包含...
  • 本发明提供一种基于图像分割的工件金属表面文字识别方法,涉及图像处理技术领域,本发明通过全变分正则化分解,将单帧灰度图像解耦为本征反射率分布与光照分量分布;基于光照分量的梯度统计特性构建光照置信度场,并据此融合形态学腐蚀特征与骨架连通性特征,...
  • 本申请提供一种动态分辨率视觉语言模型训练方法、检测方法及设备,方法包括:获取多模态文档数据集和多个查询文本特征向量;训练预设的深度学习模型以使深度学习模型在训练过程中,检测各个文档图像以生成每个文档图像分别对应的多个不同分辨率的视觉区域图,...
  • 本发明涉及计算机领域,具体涉及一种适用于投标文件中的证照的验证系统及方法。根据证照图像的清晰度、光照均匀性和文字区域完整性进行图像质量评估,得到图像质量评分;根据所述图像质量评分进行OCR处理策略的动态选择,得到采用所选策略的OCR识别结果...
  • 本发明提供一种双引擎协同过滤的文本处理方法、装置、设备和介质,方法包括:双引擎特征提取与预处理,所述双引擎包括属性识别引擎和坐标解析引擎;协同过滤中枢处理,包括特征对齐、动态权重分配和置信度校准;输出结构化版面分析结果,所述结构化版面分析结...
  • 本发明公开了一种硬笔字笔画分割提取方法、系统、装置及存储介质,属于图像分割技术领域。方法包括获取手写硬笔字笔画图像数据;将手写硬笔字笔画图像数据输入预先训练好的改进TransUNet模型,得到笔画分割提取结果;其中,改进TransUNet模...
  • 本发明公开了一种自动化装配流水线上部件的数字ID识别系统,涉及数字识别技术领域。包括视觉传感器模块,安装在自动化装配流水线正上方的固定支架上,用于实时拍摄流水线上移动部件的部件壳体图片;其中,所述部件壳体图片包括部件的数字ID;工控机,对获...
  • 本发明公开了一种基于残差卷积网络的图片数字识别方法,涉及数字识别技术领域。包括获得待识别图片进行预处理,得到多个预处理后的分割块及对应位置码;将所述预处理后的分割块输入训练好的图片数字识别模型进行识别,获得所述分割块对应的数字信息;其中,所...
  • 一种汽车公告图文校对方法、装置、设备及可读存储介质。该方法包括:获取车型公告描述信息对应的汽车公告图片;调用OCR服务对所述汽车公告图片进行区域识别和文字描述提取,得到由多个文本单元组成的识别文本;对所述识别文本进行标准化处理,得到终版识别...
  • 本申请涉及一种图像文件生成方法、图像生成方法、图像文件及系统,包括:识别原始图像中的文本区域,提取文本区域中原始语言标识的原始文本,并识别原始文本在原始图像中的位置信息以及视觉渲染属性作为全局样式数据;去除原始图像中的原始文本,得到基础图像...
  • 本申请公开了一种文档中跨页表格识别方法,包括:检测出文档页面图片里面的表格区域,并将其裁剪出来,得到表格图片;对裁剪出来的表格图片,进行表格结构识别;设第一页面的底部为第一表格,第二页面的顶部为第二表格;第一页面和第二页面为前后相邻页面;若...
  • 本申请涉及数据处理技术领域,提供一种基于文字识别大模型的文字结构化处理方法及相关装置,所述方法包括:获取待处理电力文档数据;对所述待处理电力文档数据按照文本区域进行文档数据提取,得到k个区域文档数据;获取k个区域文档数据的关键信息,得到k个...
技术分类