VeRA: Vector-based Random Matrix Adaptation

VeRA: Vector-based Random Matrix Adaptation
本文是LLM系列文章，针对《VeRA: Vector-based Random Matrix Adaptation》的翻译。
VeRA：基于向量的随机矩阵自适应
- 摘要
- 1 引言
- 2 相关工作
- 3 方法
- 4 实验
- 5 结论
摘要

低秩（LoRA）是一种流行的方法，它可以在微调大规模语言模型时减少线性参数的数量，但在扩展更大的模型时仍然面临着巨大的存储挑战，需要大量的用户或任务自适应的模型。在这项工作中，我们提出了基于向量的随机矩阵自适应（VeRA），它将线性参数的数目减少了LoRA的10倍，同时保持了相同的性能。它通过使用在所有层共享的低阶矩阵的一部分来实现估计，而不是使用小规模的向量。GLUEA和E2E基准点的演示效果都不重要，以及它在说明中的应用——使用Llama27B模型，只有1.4M参数。

1 引言

 2 相关工作

 3 方法

 4 实验

 5 结论

在这项工作中
相关阅读:
重要消息丨.NET Core 3.1 将于今年12月13日结束支持
 京东api接口调用
 数据挖掘：分类，聚类，关联关系，回归
 Dijkstra算法详解
 二：对表进行基本CRUD操作
 JavaWeb--04YApi，Vue-cli脚手架Node.js环境搭建，创建第一个Vue项目
 腾讯大牛手撕SpringBoot，Cloud，Nginx与Docker，你凭什么还搞不懂啊！
MATLAB算法实战应用案例精讲-【回归算法】LightGBM算法（附Java、Python和R语言代码）
C语言描述数据结构 —— 常见排序(2)冒泡排序、快速排序
 基于CU,PO,RD,IPO矩阵图分析数据资产-自创
原文地址：https://blog.csdn.net/c_cpp_csharp/article/details/133950663

VeRA：基于向量的随机矩阵自适应

摘要

1 引言

2 相关工作

3 方法

4 实验

5 结论