算法-数据-产品的闭环
技术架构,算法》开发》部署》应用
光学识别,识别的准确,结构化理解
挑战,数据少,语义知识,泛华性
建设路径,通用》高频垂类》高频场景》复杂
通用OCR
垂类
场景结构化方案,全流程的质量控制,不单单是算法
复杂场景,前处理和后处理的干预,本质是矩阵+概率论,本身是没有确定性的
规模化,现状总结
挑战,少数据、共享、小模型、解决方案
标准化流程
前置预处理
版式
结构化方案Eaten,每个实体都镜像解码
结构化方案,EnDet,直接当做一个目标检测问题
方案
多模态方案,就跟人的理解那样
同时学到视觉和语义
识别的挑战
识别大模型方案MaskOCR
模型小型化
案例应用
训练平台特点
平台化案例
案例介绍,三分之一的时间客户驻场
总结