码农知识堂 - 1000bd
Python
PHP
JS/TS
JAVA
C/C++
C#
GO
Kotlin
Swift
GPT-4:论文阅读笔记
多模态的模型
:GPT-4是一个多模态的模型,可以接受文本或图像的输入,但是只能以纯文本的形式给出输出。OpenAI的实验表明,通过结合图像输入,GPT-4能够取得更好的回答效果。
GPT的训练完成
:早在2022年8月,OpenAI就已经完成了GPT-4的训练过程,但是在后面的这段时间都在对GPT-4进行持续调整。
借助用户对回答的评价
:GPT-4在训练过程中,通过借助用户对模型回答的评价来帮助模型性能的提高。
专门搭建的训练集群
:OpenAI专门搭建了一个计算机集群用于GPT-4的训练。此前,该集群也被用于GPT-3.5的训练过程。
训练效果的外推
:OpenAI的GPT-4在训练过程中非常稳定,并且实现了根据小规模数据集上的模型训练效果推理出大规模数据集上的模型训练效果。大模型的训练本身是非常复杂的,如果中间出现了意外情况,则需要返回到上一个检查点重新训练,因此OpenAI能够实现训练效果的预测是非常有价值的。
GPT-4更加理性
:在之前的一系列大模型中,模型越大在面对一些问题时越难以做出理性的决定,但是GPT-4变得更大,却能够很好地做出理性的推断。
不同语言上的表现性能
:总体而言,GPT-4在不同语言上的表现性能都很好。而且,对于不同语言的性能和使用语言的人数没有直接关系。GPT-4在英语上的性能比在中文上的性能要好。
角色扮演能力
:GPT-4可以实现角色扮演,这是通过System Message实现的,从而更好地应用于具体的领域。
更长的输入
:GPT-4可以处理8192个token的输入,还有一个改进的版本可以处理32768个token的输入,但是暂未开放。
限制性
:
推理正确但是答案错误
:GPT-4经常会出现推理过程正确但是答案错误的情况;
训练数据不是最新
:GPT-4的训练数据截止2021年9月(尽管后面可能存在一定的更新)。
RLHF对模型的影响
:在使用RLHF之前,GPT对回答答案的置信度和答案正确的概率差不多;但是经过RLHF之后,两者之间的差距就变大了,也就是模型的校准没有那么好了。
相关阅读:
腾讯云精彩亮相 2023 长沙·中国 1024 程序员节,共创数智未来!
全面总结C++类模板使用的基础知识
使用element-plus的el-upload:1.手动上传2.第二次上传无效3.多图上传保留成功去除失败4.请求头添加token5.请求添加其他参数
百度飞桨“万有引力”2022首站落地苏州,全面启动中小企业赋能计划
求臻医学:实体肿瘤FDA/NMPA新获批抗癌药物/适应症盘点
70.【JavaScript 6.0】
基于51单片机的教室智能照明控制系统
设计模式——观察者模式(发布/订阅模式)
记录一下reverse回文字符串的对比与二叉树的对比
Kaggle 专利匹配比赛赛后总结
原文地址:https://blog.csdn.net/hanmo22357/article/details/134490372
最新文章
攻防演习之三天拿下官网站群
数据安全治理学习——前期安全规划和安全管理体系建设
企业安全 | 企业内一次钓鱼演练准备过程
内网渗透测试 | Kerberos协议及其部分攻击手法
0day的产生 | 不懂代码的"代码审计"
安装scrcpy-client模块av模块异常,环境问题解决方案
leetcode hot100【LeetCode 279. 完全平方数】java实现
OpenWrt下安装Mosquitto
AnatoMask论文汇总
【AI日记】24.11.01 LangChain、openai api和github copilot
热门文章
十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
奉劝各位学弟学妹们,该打造你的技术影响力了!
五年了,我在 CSDN 的两个一百万。
Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
面试官都震惊,你这网络基础可以啊!
你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
心情不好的时候,用 Python 画棵樱花树送给自己吧
通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
13 万字 C 语言从入门到精通保姆级教程2021 年版
10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系
2656653265@qq.com
京ICP备2022015340号-1
正则表达式工具
cron表达式工具
密码生成工具
京公网安备 11010502049817号