


算法-数据-产品的闭环

技术架构,算法》开发》部署》应用


光学识别,识别的准确,结构化理解

挑战,数据少,语义知识,泛华性

建设路径,通用》高频垂类》高频场景》复杂

通用OCR

垂类

场景结构化方案,全流程的质量控制,不单单是算法

复杂场景,前处理和后处理的干预,本质是矩阵+概率论,本身是没有确定性的

规模化,现状总结


挑战,少数据、共享、小模型、解决方案

标准化流程

前置预处理

版式

结构化方案Eaten,每个实体都镜像解码
结构化方案,EnDet,直接当做一个目标检测问题

方案

多模态方案,就跟人的理解那样

同时学到视觉和语义

识别的挑战

识别大模型方案MaskOCR

模型小型化


案例应用

训练平台特点

平台化案例

案例介绍,三分之一的时间客户驻场

总结
