• 大模型解决方案:具体业务场景下的智能表单填充(附代码)


    大模型相关目录

    大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
    从0起步,扬帆起航。

    1. 大模型应用向开发路径:AI代理工作流
    2. 大模型应用开发实用开源项目汇总
    3. 大模型问答项目问答性能评估方法
    4. 大模型数据侧总结
    5. 大模型token等基本概念及参数和内存的关系
    6. 大模型应用开发-华为大模型生态规划
    7. 从零开始的LLaMA-Factory的指令增量微调
    8. 基于实体抽取-SMC-语义向量的大模型能力评估通用算法(附代码)
    9. 基于Langchain-chatchat的向量库构建及检索(附代码)
    10. 一文教你成为合格的Prompt工程师
    11. 最简明的大模型agent教程
    12. 批量使用API调用langchain-chatchat知识库能力
    13. langchin-chatchat部分开发笔记(持续更新)
    14. 文心一言、讯飞星火、GPT、通义千问等线上API调用示例
    15. 大模型RAG性能提升路径
    16. langchain的基本使用
    17. 结合基础模型的大模型多源信息应用开发
    18. COT:大模型的强化利器
    19. 多角色大模型问答性能提升策略(附代码)
    20. 大模型接入外部在线信息提升应用性能
    21. 大模型解决方案:具体业务场景下的智能表单填充


    概述

    在许多业务场景下,存在大量从表单、铭牌、参数快照等图像数据中进行信息提取和填充的需求。
    诸如数据摸排、信息录入、各时间颗粒度下的数据统计等业务,传统模式下主要通过人工手段完成,效率低、成本高、完成质量差。
    传统OCR技术结合大模型文字处理能力,可实现具体场景下的智能表单填充解决方案。

    技术路径

    1. 为解决图像可用性问题:运用形态学知识,对图像进行质量增强
    2. 为满足图像文字识别需求:利用OCR技术,对图像进行文字提取
    3. 为克服识别结果排布散乱、信息紊乱现象:预处理文字提取结果,设计专用性Prompt,提升大模型在该场景下的信息抽取、规整能力
    4. 为达成表单智能填充目的:结合实际业务需求,建立json数据和表单字段间的桥接关系,实现数据填充自动化

    在这里插入图片描述

    代码实现

    大模型在线API请参考系列文章。
    功能代码:

    from paddleocr import PaddleOCR
    import ask_Wenxin
    import json
    import re
    from datetime import datetime
    import os
    
    def post_processing(input_data: dict):
        # 获取当下时间并format
        formatted_time = str(datetime.now().strftime("%Y_%m_%d
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
  • 相关阅读:
    C语言深度理解之——结构体内存对齐
    STL String类详解(上)
    【LeetCode刷题(数据结构与算法)】:上下翻转二叉树
    今天就跟你们聊聊缓存穿透吧
    [附源码]Python计算机毕业设计Django个性化名片网站
    npm如何发布自己的插件包
    tx-前端笔试题记录
    程序员保密协议
    monaco-editor 动态插入文本到光标处
    LeetCode //C - 918. Maximum Sum Circular Subarray
  • 原文地址:https://blog.csdn.net/qq_43128256/article/details/138163078