• 深眸科技革新升级OCR技术,与AI视觉实现有效融合赋能各行业应用


    OCR即光学字符识别,是通过扫描仪或工业相机等电子设备检查打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

    目前,随着机器视觉和人工智能技术的进一步升级,OCR技术实现了与AI视觉的有效融合,在工业领域的实际生产应用中发挥着越来越重要的作用,包括在食品、医药、电力、消费电子等众多行业中具备良好的应用效果。

    字符识别流程

    图像预处理

    目的:提高图像质量,从而提高OCR的准确性。

    常见的图像预处理操作包括灰度化、二值化、降噪和图像增强等。

    文字分割

    目的:将图像中的文字区域切割出来,便于后续的文字识别。

    文字分割可通过基于连通区域的方法或基于深度学习的方法实现。

    文字识别

    目的:将区域中的文字内容转化为计算机可识别的字符编码。

    文字识别可以通过模版匹配的方法或基于深度学习的方法实现。

    后处理

    目的:进一步提高OCR的准确性,去除识别结果中的错误信息。

    常见的后处理操作包括纠错、排版和格式化等。

    场景复杂多样 字符识别难题凸显

    在实际生产中,众多场景需要用OCR技术实现对印刷字符的检测,包括自动化设备控制、产品品质控制和物流控制等识别场景,但由于这些识别场景复杂多样,想要进一步提升字符识别应用效果往往面临困难。

    高效率难题

    由于生产工艺的影响,字符标签往往存在印刷模糊、歪斜、污染、破损等问题,导致检测效率较低。

    高通用性难题

    对于字符的检测包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制。

    生产环境难题

    识别过程容易受生产环境、产品品质和工艺、拍摄角度等影响,从而出现字符图像不清晰、畸形、缺失等情况。

    研发难题

    OCR在复杂场景的应用部署需要研发人员的深度参与,还需要字符样本深度学习训练、反复调参,操作门槛较高。

    综上所述,在复杂多样的识别场景中,传统OCR技术面临多重难题,为实现缺陷字符的进一步检出,各制造厂商开始运用AI+机器视觉检测技术,对出厂前产品进行更严格检测,包括根据不同的产品材料、缺陷情况和客户需求,使用不同的光源、不同照射角度和不同像素的工业相机,对被识别字符的缺陷和复杂背景进行区分,最后利用缺陷图像的颜色、灰度、形状、大小等来识别。

    技术革新升级 深度学习与OCR有效融合

    随着字符识别技术加速渗透工业领域,作为机器视觉前沿技术的引领者,深眸科技坚持对OCR技术的革新升级,通过将深度学习与字符识别技术有效融合,全面赋能各行业应用。

    深眸科技创新研发的轻辙标注训练平台,通过字符识别模块配合具备较高精度的工业相机拍摄取图,集推、训、测、转一体,能够在字符复杂、环境干扰等情况下,实现全场景、复杂条件下的字符识别。

    通过深度学习算法,轻辙标注训练平台能够助力OCR技术能实现更高的识别精度和速度,并精准且快速完成因生产工艺导致的字符标签印刷模糊、歪斜、污染、破损等缺陷的检出,从而满足字符识别的高效率要求;轻辙标注训练平台还能通过自主学习各类工业场景中不同类型的字符,包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制,进一步提升了在字符识别场景中的通用能力。

    深眸落地案例 OCR技术在各行业的应用

    医药行业 · 药盒OCR检测

    项目背景:

    对于小盒装产品医药行业往往会将数个产品用透明塑料薄膜先包裹在进行装箱。塑料薄膜存在反光、多层堆叠(降低了字符的对比度)现象,会对字符识别产生严重的干扰。

    检测难点:

    · 多个产品多行字符

    · 需要实现较高的识别准确率

    · 塑料薄膜存在反光、堆叠对识别产生影响

    解决方案:

    深眸科技在此项目中,通过工业相机拍摄取图,以OCR技术加持,系统能够排除反光、堆叠等因素的干扰,提取分析并比较药盒生产日期、二维码等字符的完整性、正确性和是否存在缺失,当检测到问题时,发出信号给剔除装置并警报提示。

    医药行业 · 药盒OCR检测项目

    电力行业 · 电力线路杆号牌分拣

    项目背景:

    线路塔杆的杆号牌是线路杆塔的“身份证”,担负着宣传电力知识、安全警示的作用,杆号牌的字迹模糊、脱落等现象,给线路巡视检修、故障抢修等工作带来许多潜在隐患。

    检测难点:

    · 杆号牌字符不确定,无法预置字符库方式建立图像字符模版

    · 字符方向与来料多样,存在相近字符的干扰

    · 字符存在挤压变形,影响字符输出

    解决方案:

    深眸科技自研的轻辙标注训练平台,能够通过搭配文本检测算法与优化SVTR文本识别、文本方向分类器、文本尺度修正等算法,规范字符在尺度处理上的统一性。同时满足客户快速换型生产要求,在部分字符缺损、漏检、小数点符号干扰的情况下,对所有字符联想检出。

    电力行业 · 电力线路杆号牌分拣项目

    消费电子行业 · OCR错漏检测

    项目背景:

    空调内机外壳的品牌LOGO以及商标丝印在生产时会有缺损和错误的情况,同时装配阶段也会发生混料现象。由于生产量巨大,人工质检已经不能满足生产效率。

    检测难点:

    · 多种不同型号产品

    · 商标丝印各不相同,软件切换时间短

    · 单位检测时间需要判断多个图像特征

    · 缺陷类型多样,产品成像角度不稳定

    解决方案:

    深眸科技的轻辙标注训练平台通过自研算法,能够秒级切换不同产品型号生产,还能动态判断产品字符内容,并以高性能软件架构实现效率提升,实现空调内机外壳品牌LOGO和商标丝印等字符的精准识别。

    消费电子行业 · OCR错漏检测项目

  • 相关阅读:
    【Redis】基础数据结构-quicklist
    智能疾病查询接口
    wpf 和winform 的区别
    【新版】系统架构设计师 - 案例分析 - 架构设计<Web架构>
    002 OpenCV dft 傅里叶变换
    github action 基于个人项目实践
    Ubuntu1804里进行KITTI数据集可视化操作
    haproxy+keepalived实战
    【图像处理GIU】图像分割(Matlab代码实现)
    ヾ(⌐ ■_■)— HTML-CSS选择器
  • 原文地址:https://blog.csdn.net/Sensemoment/article/details/134447384