• OpenAI 开放 GPT-3 微调功能,让开发者笑开了花


    出品 | AI科技大本营(ID:rgznai100)

    近日,OpenAI宣布,允许用户创建自定义版的 GPT-3。

    OpenAI 表示,开发人员可以使用微调来创建针对其应用程序和服务中的特定内容量身定制的 GPT-3 模型,从而在任务和工作负载中实现表面上更高质量的输出。

    OpenAI 发言人在一封电子邮件中写道:“据 Gartner 称,到 2024 年,80% 的技术产品和服务将由非技术专业人士构建。这一趋势是由商业社区加速采用人工智能推动的,需要专门定制的人工智能工作负载。”

    定制的 GPT-3 只需一行代码,就可以让开发人员和业务团队基于特定数据集运行和训练强大的AI模型,从而无需从头开始创建和训练自己的AI系统。

    openai api fine_tunes.create -t <train_file>

    通过微调,能够将输出的准确度从 83% 提高到 95%,错误率降低了 50% 。

    微调的好处

    在2020年6月发表的研究报告中,研究者用不到100个例子展示了微调是如何提高 GPT-3 的性能。通过结果发现,示例数量每增加一倍,质量就会提高。新的 GPT-3 微调功能使客户能够训练 GPT-3 识别特定域范围内内容生成、分类和文本摘要等工作负载的特定模式。

    最具挑战的数据之一就是解小学数学问题,微调 GPT-3 的正确率提高了2-4倍。

    图片

    事实上,已经有很多应用都已经用上定制版的 GPT-3,并且效果也是十分显著的。

    定制 GPT-3 提高了输出的可靠性,为用例提供了更加一致的结果。经发现,定制 GPT-3 将不可靠输出的频率从 17% 降低到 5% 。

    无论是文本生成、摘要、分类,还是 GPT-3 能够执行的任何其他自然语言任务,定制 GPT-3 都将提高性能。

    定制版本 GPT 3 驱动的应用

    Keeper Tax 帮助独立承包商和自由职业者纳税的App。在客户连接他们的财务账户后,Keeper Tax 使用各种模型提取文本并对交易进行分类。

    通过定制 GPT-3 Keeper Tax 能够吃持续改进结果,识别账单上的各种数据,以帮助用户找到可以免税的费用。

    Keeper Tax 表示,在用上微调后的 GPT-3 后,应用识别的准确率每周都会提高约1%,准确率已经从过去的85%提升到了93%。

    图片

    Viable 帮助公司从客户反馈中获得见解,智能读取用户评论。

    图片

    能够将大量非结构化数据转化为可读的自然语言报告,突出显示客户最大的投诉、称赞、请求和问题。

    定制 GPT-3 增加了报告的可靠性,通过使用 GPT-3 的定制版本,使应用在识别用户反馈的准确率上从 66% 提高到 90%。在输出结果的用时、多样性上,也有明显的优势。

    图片

    Sana Labs 是人工智能开发和应用于学习的全球领导者。通过利用最新的ML突破为每个人定制内容,为企业提供个性化的学习体验。

    通过定制 GPT-3 ,Sana Labs 的问题和内容生成从语法正确转变为高度准确的输出。从根本上为学习者提供了更加个性化和有效的体验。

    另外一个应用是 Elicit ,是人工智能检索工具,帮助人们使用学术论文的发现直接回答研究问题。

    图片

    该工具从大量研究论文中找到最相关的摘要,根据用户搜索的问题来智能给出结果。用上定制版 GPT-3 后,Elicit 给出的结果更容易理解提高了 24%、准确性上提高了 17%,整体方面提升了 33%。

    结语

    GPT-3 微调是在 OpenAI 删除 GPT-3 API 的候补名单之后推出的。

    OpenAI 技术人员在采访时表示:“我们开发此功能时,希望能够让没有AI研究背景的人也能使用它。

    网友表示:可以用 GPT-3 生出更多有意思的应用。

    还有网友表示:微调后的 GPT-3 更智能,更好用。

    对此,你怎么看呢?

    参考链接:

    https://venturebeat.com/2021/12/14/openai-begins-allowing-customers-to-fine-tune-gpt-3

    https://openai.com/blog/customized-gpt3/#example

  • 相关阅读:
    电脑系统重装后音频驱动程序怎么修复
    产品推荐 - 基于Xilinx Kintex-7 XC7K160T/325T/410T打造的水星Mercury+ KX2核心板
    股票配资软件cs架构开发技术方案[附源码]
    Python Web详细教程
    【C语言】联合(共用体)
    Datalogic,50年的成功
    云计算 - 3 - 使用MapReduce处理数据
    力扣记录:动态规划3打家劫舍——198 打家劫舍,213 打家劫舍II,337 打家劫舍III
    Docker安装
    基于springboot的个人博客管理系统
  • 原文地址:https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/121958595