分享9个已开源的GPT4平替，用过感觉还不错

鱼子酱

关注她

22 人赞同了该文章

收起

1.Colossal AI

2.ChatGLM

3.LLaMa

4.LLaMa-ChatLLaMA

5.BELLE

6.PaLM-rlhf-pytorch

7.OpenAssistant

8.OpenChatKitk

9.stanford_alpaca

对于想要研究大模型的同学来说，目前ChatGPT无疑是最好的学习对象，但等它开源估计是不太可能了，所以学姐今天整理了一些开源的类GPT模型，帮助大家更好的理解大模型背后的机理。（文末有论文资料）

PS：有的功能还不错，也可以上手玩耍玩耍。

“夸父”AI，大规模并行AI训练系统，基于LLaMA预训练模型。作为ChatGPT的平替，开源了完整的RLHF流水线，包括，监督数据收集、监督微调、奖励模型训练和强化学习微调等。

优势：高效、简单、可扩展，功能多，包含AIGC
缺点：不完全支持中文，基于GPT-3

模型能力：集成现有的GPT-3 、GPT-2模型，能够提升模型效率

训练：

第一阶段（stage1_sft.py）：SFT监督微调阶段，该开源项目没有实现，这个比较简单，因为ColossalAI无缝支持Huggingface，本人直接用Huggingface的Trainer函数几行代码轻松实现，在这里我用了一个gpt2模型，从其实现上看，其支持GPT2、OPT和BLOOM模型；
第二阶段（stage2_rm.py）：奖励模型（RM）训练阶段，即项目Examples里train_reward_model.py部分；
第三阶段（stage3_ppo.py）：强化学习（RLHF）阶段，即项目train_prompts.py。

代码中的cores即原始工程中的chatgpt，cores.nn在原始工程中变成了chatgpt.models。

智谱AI研发，基于千亿参数大模型的支持中英双语的对话机器人。

网址：ChatGLM

优势：支持中英双语、开源平替里面参数规模较大的对话大模型

缺点：模型记忆和语言能力较弱，数学、编程类解答能力较弱

模型能力：

训练：

Meta打造的一个650 亿参数的大语言模型，可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。

优势：在生成文本、对话、总结书面材料、等任务上方面表现良好，支持20种语言。
缺点：对中文支持不足

由于 LLaMA 大模型系列没有使用 RLHF 方法，因此初创公司 Nebuly AI 开源了 RLHF 版 LLaMA（ChatLLaMA）的训练方法。

优势：

缺点：不支持中文

精通中文，基于斯坦福 Alpaca项目，70 亿参数的中文对话大模型。

优势：

数据：参考斯坦福大学的Alpaca项目，针对中文场景进行了优化，利用ChatGPT生了多样化、高质量的数据，包括日常对话、知识问答、文本生成等，有助于模型在各种中文场景中的表现。
模型：基于Bloom和LLAMA，训练了出具效果的对话模型，并完全开放了这些模型的参数，大大降低使用和科研的门槛
轻量化：开源了对话模型的量化版本，包括8bit, 4bit, 其中4bit版本模型checkpoint大小仅为6.9G，运行仅需8.4G显存。