码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Elasticsearch:RAG vs Fine-tunning (大语言模型微调)


    如果你对 RAG 还不是很熟悉的话,请阅读之前的文章 “Elasticsearch:什么是检索增强生成 - RAG?”。你可以阅读文章 “Elasticsearch:在你的数据上训练大型语言模型 (LLM)” 来了解更多关于如何训练你的模型。在今天的文章中,我们来讲述 RAG 及 大语言模型的优缺点。这篇文章旨在优化语言模型的终极指南。

    介绍

    你是否正在努力充分利用大型语言模型 (LLM)? 你不是一个人。 好消息是,你可以选择:检索增强生成 (RAG) 和微调。 但哪一款适合你呢? 让我们来看看吧。

    两大巨头:RAG 和微调

    • RAG:想象一下你的 LLM 是一名侦探。 RAG 允许它在解决案件(回答你的查询)之前从各种来源搜索线索(数据)。
      • 该方法帮助模型搜索并使用外部信息来回答问题或生成文本。 可以把它想象成一个学生在回答问题之前先在教科书中查找事实。

    在很多的情况下,我们可以很方便地使用 Elasticsearch 来作为向量数据库,并轻松地实现 RAG。详细实现请参阅文章 “ChatGPT 和 Elasticsearch:OpenAI 遇见私有数据(一)”。

    • 微调:将其视为 LLM 的专门训练营。 它针对特定游戏(任务)磨练自己的技能,使其成为明星玩家。
      • 在这里,你可以根据特定数据训练已经构建的模型,以使其更好地完成特定任务。 这就像一位厨师已经知道如何烹饪,但参加了一门特殊的课程来改进特定的食谱。

    是什么让他们与众不同

    • 目标:RAG 是你的数据侦探,而微调则将你的模型变成专家。
    • 轻松又省钱:RAG 就像按照菜谱做饭一样; 它更容易而且通常更便宜。 Fine-Tuning 就像创造一道美食; 它很复杂,但可以更令人满意。

    风险:为什么你的选择很重要

    明智地选择,否则你最终可能会得到一个低效、昂贵且难以管理的模型。 以下是如何避免陷阱。

    你的清单:做出正确的选择

    • 你需要外部信息吗? 选择 RAG。
    • 想要自定义行为吗? 选择微调。
    • 有很多具体数据吗? 微调会发光。
    • 数据不断变化? RAG 保持更新。
    • 需要解释模型的答案吗? RAG 提供更高的透明度。

    现实世界场景:哪一个获胜?

    我们将探讨如何在 RAG 和微调之间进行选择,以完成总结文章、在公司环境中回答问题以及自动化客户支持等任务。

    超越基础:需要考虑的其他因素

    从可扩展性和实时需求到道德和现有系统,我们将讨论其他可能使天平有利于一种方法而不是另一种方法的因素。

    结论:你的成功之路

    请记住,最好的方法是符合你的特定需求和目标的方法。 在许多情况下,你需要同时使用两者。 因此,评估、选择和优化你的 LLM 成功之路!

    更多有关 Elasticsearch 在大数据及人工智能方面的文章,请参阅 “AI”。

  • 相关阅读:
    一文带你摸清设计模式之单例模式!
    2.0SpingMVC使用RESTful
    【C】—文件版本通讯录的实现
    怎么恢复已删除的全部数据,不小心删除的数据怎么恢复,删除的文件还能找回吗
    文本处理三剑客之 sed 流编辑器(基础部分)
    消息队列实现进程间通信
    ARM-day9作业
    道可云元宇宙每日资讯|2023焦作市文旅元宇宙产业发展座谈会举行
    SQL语句中过滤条件放在on和where子句中的区别和联系
    GBPC1510W-ASEMI铝底塑壳针脚高散热方桥GBPC1510W
  • 原文地址:https://blog.csdn.net/UbuntuTouch/article/details/134226686
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号