码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 聊聊ShareGPT格式的微调数据集


    转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

    概述

    ShareGPT格式的数据集中,一般是如下格式:

    [
      {
        "conversations": [
          {
            "from": "human",
            "value": "I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?"
          },
          {
            "from": "function_call",
            "value": "{\"name\": \"calculate_discount\", \"arguments\": {\"original_price\": 200, \"discount_percentage\": 20}}"
          },
          {
            "from": "observation",
            "value": "{\"discounted_price\": 160}"
          },
          {
            "from": "gpt",
            "value": "The dress will cost you $160 after the 20% discount."
          }
        ],
        "system": "系统提示词(选填)",
        "tools": "[{\"name\": \"calculate_discount\", \"description\": \"Calculate the discounted price\", \"parameters\": {\"type\": \"object\", \"properties\": {\"original_price\": {\"type\": \"number\", \"description\": \"The original price of the item\"}, \"discount_percentage\": {\"type\": \"number\", \"description\": \"The percentage of discount\"}}, \"required\": [\"original_price\", \"discount_percentage\"]}}]"
      }
    ]
    

    function_call表示函数调用,什么是函数调用?其作用是什么?
    由于大模型的数据一般都是截止于某个时间点之前的数据,不具备实时性。比如,我要问今天的天气,正常来说,由于模型参数的局限性,是不会知道的。但基于函数调用的功能,就解决了这个问题。
    所谓的function_call,在某个程度来说,可以理解为API调用,这个API就是一个function,提供了某种功能。
    observation表示观测结果,即function_call的执行结果。
    tools表示工具,即对function_call的总结描述。

    observation并不是新词汇,对于HMM模型如果有了解的话,在其模型算法的表述中,也有着observation的相关引用。

    ShareGPT格式简单明了而且结构强大,不仅仅轻易的支持单轮对话、多轮对话;还引入了强大的函数调用,支持功能扩展。

    扩展

    function_call的设计引申出来,可以对应到业务开发中的规则引擎、脚本引擎等设计。譬如,支持在json参数的格式中,传入JS脚本参数,做一些强大的运算等。在原有的参数格式中,引入强大的函数调用支持。
    如何在聊天模型中调用函数(Function Calling)--金融大模型知识库实战(十六)
    大模型开发 - 一文搞懂 Function Calling(函数调用)

    转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

    首发于个人公众号
    image

  • 相关阅读:
    中国大陆IP段(含港澳)【2022-08-13】
    flask 发送ajax
    6176. 出现最频繁的偶数元素
    驱动开发:内核CR3切换读写内存
    【时间】 时间 加一个月减一个月,加一天减一天,加一年减一年
    swagger 生成代码
    DaVinci:套底流程
    docker运行javaWeb服务,操作文件异常
    10月第4周榜单丨飞瓜数据B站UP主排行榜(哔哩哔哩平台)发布!
    Golang GMP解读
  • 原文地址:https://www.cnblogs.com/zhiyong-ITNote/p/18093770
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号