• EasyOCR 常用方法参数说明


    easyocr.Reader( )

            生成对象 reader。

    参数:

    lang_list (list) - 识别的语言代码列表,例如 ['ch_sim','en']

    gpu (bool, string, default = True) - 启用 GPU

    model_storage_directory (string, default = None) - 模型数据目录的路径。如果未指定,将从环境变量 EASYOCR_MODULE_PATH(首选)、MODULE_PATH(如果已定义)或 ~/.EasyOCR/ 定义的目录中读取模型。

    download_enabled (bool, default = True) - 如果 EasyOCR 无法找到模型文件,则启用下载;

    user_network_directory (bool, default = None) - 用户模型存储的路径。如果未指定,将从 MODULE_PATH + '/user_network' (~/.EasyOCR/user_network) 读取模型;

    recog_network (string, default = 'standard') - 用户模型、模块和配置文件的名称;

    detector (bool, default = True) - 将检测模型加载到内存中 

    recognizer (bool, default = True) - 将识别模型加载到内存中

    属性:

    lang_char - 显示当前模型中的所有可用字符

    reader.readtext(  ) 

            Reader对象的主要方法。有 4 组参数:General、Contrast、Text Detection 和 Bounding Box Merging。

    参数1:General

    image (string, numpy array, byte) - 输入图像;

    decoder (string, default = 'greedy')- 选项有 'greedy'、'beamsearch' 和 'wordbeamsearch';

    beamWidth (int, default = 5) - 当解码器 = 'beamsearch' 或 'wordbeamsearch' 时要保留多少光束;

    batch_size (int, default = 1) - batch_size>1 将使 EasyOCR 更快但使用更多内存;

    worker (int, default = 0) - 数据加载器中使用的编号线程;

    allowlist (string) - 强制 EasyOCR 只识别字符的子集。对特定问题有用(例如车牌等);

    blocklist (string) - 字符的块子集。如果给定了允许列表,则此参数将被忽略。

    detail (int, default = 1) - 将此设置为 0 以进行简单输出;

    paragraph (bool, default = False) - 将结果合并到段落中;

    min_size (int, default = 10) - 过滤文本框小于最小值(以像素为单位);

    rotation_info (list, default = None) - 允许 EasyOCR 旋转每个文本框并返回具有最佳置信度分数的文本框。符合条件的值为 90、180 和 270。例如,对所有可能的文本方向尝试 [90, 180 ,270]。

    参数2:Contrast 对比度

    contrast_ths (float, default = 0.1) - 对比度低于此值的文本框将被传入模型 2 次。首先是原始图像,其次是对比度调整为“adjust_contrast”值。结果将返回具有更高置信度的那个;

    adjust_contrast (float, default = 0.5) - 低对比度文本框的目标对比度级别。

    参数3:Text Detection 文本检测(来自CRAFT)

    text_threshold (float, default = 0.7) - 文本置信度阈值

    low_text (float, default = 0.4) - 文本下限分数

    link_threshold (float, default = 0.4) - 链接置信度阈值

    canvas_size (int, default = 2560) - 最大图像尺寸。大于此值的图像将被缩小。

    mag_ratio (float, default = 1) - 图像放大率

    参数4:Bounding Box Merging 边界框合并

            这组参数控制相邻边界框何时相互合并。除了 'slope_ths' 之外的所有参数都以盒子高度为单位。

    slope_ths (float, default = 0.1) - 考虑合并的最大斜率 (delta y/delta x)。低值意味着不会合并平铺框。

    ycenter_ths (float, default = 0.5) - y 方向的最大偏移。不应该合并不同级别的框。

    height_ths (float, default = 0.5) - 盒子高度的最大差异。不应合并文本大小非常不同的框。

    width_ths (float, default = 0.5) - 合并框的最大水平距离。

    add_margin (float, default = 0.1) - 将边界框向所有方向扩展某个值。这对于具有复杂脚本的语言(例如泰语)很重要。

    x_ths (float, default = 1.0) - 当段落=True 时合并文本框的最大水平距离。

    y_ths (float, default = 0.5) - 当段落 = True 时合并文本框的最大垂直距离。

    返回:结果列表

    detect( )

    参数

    image (string, numpy array, byte) -输入图像

    min_size (int,默认= 10)-筛选小于最小像素值的文本框

    text_threshold (float, default = 0.7)—文本可信度阈值

    low_text (float,默认= 0.4)-文本下限得分

    link_threshold (float, default = 0.4)—链路可信度阈值

    canvas_size (int,默认= 2560)-最大图像大小。大于此值的图像将向下调整大小。

    mag_ratio(浮动,默认= 1)-图像放大比

    slope_ths (float,默认= 0.1)-考虑合并的最大斜率(y/ x)。低值意味着平铺的盒子不会合并。

    ycenter_ths (float,默认= 0.5)- y方向的最大位移。不同级别的盒子不能合并。

    height_ths(浮动,默认= 0.5)-框高度的最大差异。文本大小非常不同的框不应该合并。

    width_ths(浮动,默认= 0.5)-合并框的最大水平距离。

    add_margin(浮动,默认= 0.1)-向所有方向扩展边界框。这对于具有复杂文字的语言(如泰国语)是很重要的。

    optimal_num_chars (int,默认= None) -如果指定,则首先返回接近该值的估计字符数的边界框。

            返回horizontal_list, free_list - horizontal_list是一个矩形文本框的列表。格式为[x_min, x_max, y_min, y_max]。Free_list是一个自由格式文本框的列表。格式为[[x1,y1],[x2,y2],[x3,y3],[x4,y4]]。

    recognize( )

    参数

    image (string, numpy array, byte) -输入图像

    horizontal_list (list, default=None) -查看检测方法输出的格式

    free_list (list, default=None) -查看检测方法输出的格式

    decoder (string, default = 'greedy') -选项为'greedy', 'beamsearch'和'wordbeamsearch'。docoder = 'beamsearch'或'wordbeamsearch'时,保留多少光束

    beamWidth (int, default = 5) - 当解码器= 'beamsearch'或'wordbeamsearch'时,保留多少光束?

    batch_size (int,默认= 1)- batch_size > 1 将使EasyOCR更快,但会占用更多内存

    workers (int,默认= 0)-在数据加载器中使用的线程数

    allowlist (string) -强制EasyOCR只识别字符的子集。适用于特定问题(如车牌等)

    blocklist (string)—字符的块子集。如果给出allowlist,则该参数将被忽略。

    detail (int, default = 1) -为简单输出设置为0

    paragraph (bool, default = False) -将结果合并到段落中

    contrast_ths (float, default = 0.1) - 对比度低于此值的文本框将被传递到模型2次。第一个是原始图像,第二个是对比度调整为'adjust_contrast'值。结果为置信度高的那个会被返回。

    adjust_contrast(浮动,默认= 0.5)-低对比度文本框的目标对比度级别

    返回结果列表

    原文链接:

            Jaided AI: EasyOCR documentation

  • 相关阅读:
    Matlab:查找命令行窗口或历史记录中的文本
    jsplumb应用场景快速开发
    浅谈react组件间通信方式
    YOLOv7独家原创改进:最新原创WIoU_NMS改进点,改进有效可以直接当做自己的原创改进点来写,提升网络模型性能精度
    ERP项目施行计划的目的是什么?
    [Python] 集合操作及方法总结
    氧化石墨烯(GO)掺杂多壁碳纳米管-离子液体(MWCNTs-IL)复合物偶联金纳米粒子(AuNPs)|MWCNTs-IL-GO/AuNPs复合纳米材料
    Java基础深化和提高 ---- 网络编程
    【android12-linux-5.1】【ST芯片】【RK3588】【LSM6DSR】HAL移植
    电脑投屏到TCL电视鼠标延迟
  • 原文地址:https://blog.csdn.net/m0_47943986/article/details/127636497