Lost in the Middle: How Language Models Use Long Contexts

本文是LLM系列文章，针对《Lost in the Middle: How Language Models Use Long Contexts》的翻译。

迷失在中间：语言模型如何使用长上下文

摘要
1 引言
2 语言模型
3 多文档问答
4 语言模型如何从输入上下文中检索？
5 为什么语言模型很难使用它们的整个输入上下文？
6 更多的背景总是更好吗？开放领域QA案例研究
7 相关工作
8 结论

摘要

虽然最近的语言模型能够将长上下文作为输入，但人们对它们使用长上下文的情况知之甚少。我们分析了语言模型在两项任务中的性能，这两项任务需要在输入上下文中识别相关信息：多文档问答和键值检索。我们发现，当相关信息出现在输入上下文的开头或结尾时，性能通常最高，而当模型必须在长上下文的中间访问相关信息时，性能会显著降低。此外，即使对于显式长上下文模型，性能也会随着输入上下文的增长而显著降低。我们的分析提供了对语言模型如何

相关阅读:
Google DataFlow入门与（Pub/Sub-DataFlow-BigQuery解决方案）
学妹居然叫我帮她P证件照自拍，结果发现.........
随着年龄增长，我应该怎样对抗肌肉流失？
MAC glucuronide linker-1/MAC glucuronide linker-2蛋白降解酶
ZYNQ_project:key_led
k8s--基础--23.1--认证-授权-准入控制--介绍
邮箱哪家强？哪个牌子邮箱好用
kali 脚本应用（二）
FLINK的jar发布时报错 No suitable driver found for jdbc:mysql:/时，我的处理方法
angular抛出 ExpressionChangedAfterItHasBeenCheckedError错误分析

原文地址：https://blog.csdn.net/c_cpp_csharp/article/details/132802878