OPENCHAT: ADVANCING OPEN-SOURCE LANGUAGE MODELS WITH MIXED-QUALITY DATA

本文是LLM系列文章，针对《OPENCHAT: ADVANCING OPEN-SOURCE LANGUAGE MODELS WITH MIXED-QUALITY DATA》的翻译。

OPENCHAT：利用混合质量数据推进开源语言模型

摘要
1 引言
2 前言
3 OpenChat
4 实验
5 分析
6 相关工作
7 结论与未来工作

摘要

如今，像LLaMA这样的开源大型语言模型已经出现。最近的发展结合了监督微调（SFT）和强化学习微调（RLFT），以使这些模型与人类目标保持一致。然而，SFT方法平等地对待具有混合质量的所有训练数据，而RLFT方法需要高质量的成对或基于排名的偏好数据。在这项研究中，我们提出了一个新的框架，名为OpenChat，用于推进具有混合质量数据的开源语言模型。具体来说，我们考虑一般的SFT训练数据，由少量专家数据和大量次优数据组成，没有任何偏好标签。我们提出了C（条件）-RLFT，它将不

相关阅读:
开源：一款基于.Net 6 和VUE3+Element+Plus的高颜值后台管理系统
阿里云短信服务设置操作项目
【Ubuntu】Windows远程Ubuntu系统
第七届NVIDIA Sky Hackathon项目报告书
SQLite下载与安装
Java 开发中的 Lombok 是什么？
合宙Air724UG LuatOS-Air LVGL API控件-图片（Gif）
闲话Python编程-集合set
【代码扫描修复】绝对路径遍历
【Rust日报】2022-07-30 Rust、C++ 和 Go 内存安全性的简洁比较

原文地址：https://blog.csdn.net/c_cpp_csharp/article/details/133990312