LLM大模型训练和预测如何计算算力需求？ - 码农知识堂 - 文章详情页

LLM大模型训练和预测如何计算算力需求？
文章目录
架构+数据+算力
1. 8*A100 微调大模型 lora工具微调
2. 内容审核:输入的审核生成的审核;
3. GPU并行处理能力
算力计算

一个LLaMA-6B的数据类型为Int8
模型参数 6B1bytes = 6GB
梯度 6B1bytes = 6GB
优化器参数 Adam 2倍模型参数:6GB*2 = 12GB
训练共24GB的显存

 推理算力

模型参数 6B*1bytes = 6GB
推理共6GB的显存

 Transformer

1, 多头注意力
2. Transformer可以取代CNN,也就是使用Transformer可以做视觉
相关阅读:
java毕业设计笔记交易平台mybatis+源码+调试部署+系统+数据库+lw
python模拟表格任意输入位置
 git使用方法
 二、数据链路层
 金蝶苍穹开发工程师初级学习第一节
 Linux网络编程系列之服务器编程——阻塞IO模型
 飞桨中国行落地广州共探企业智能化升级新路径
 学习才是测试猿的永动力！超详细的 pytest 钩子函数之初始钩子和引导钩子来啦
 【Canvas】js用Canvas绘制漩涡螺旋图动画效果
 【微机接口】中断的基本概念
原文地址：https://blog.csdn.net/weixin_32393347/article/details/132884788