Thinking for Doing：让LLMs能推断他人心理状态来做出适当的行动。

LLMs通常能回答有关心理状态的问题，但往往不能将这些推断用于实际行动。例如，如果一个故事中的角色正在寻找他的背包，而模型知道背包在厨房里，那么模型应该能推断出最好的行动是建议角色去厨房查看。

T4D 的目的就是要求模型不仅要能回答有关其他人心理状态的问题（这是许多现有评估方法的焦点），还要能根据这些推断来选择最佳的行动方案。

论文：arxiv.org/abs/2310.03051
PDF：arxiv.org/pdf/2310.03051…

解决方案

为了解决这一问题，作者引入了一个零样本提示框架，名为“Foresee and Reflect”（FaR），该框架能显著提高LLMs在T4D上的性能。
工作原理

Foresee and Reflect”（FaR）主要由两个组件组成：预见（Foresee）和反思（Reflect）。

1. 预见（Foresee）
在这一阶段，模型被引导去预测或预见可能的未来事件或行动，并对它们进行初步的评估。这通常涉及到对故事或场景中角色的心理状态（如信念、意图等）的理解，并基于这些理解来预测他们可能会采取哪些行动。

2. 反思（Reflect）
在预见阶段之后，模型进入反思阶段。在这里，模型需要重新考虑其先前的预测和评估，以确定是否需要调整或优化。这可能涉及到更深入地理解角色的心理状态，或者考虑更多的环境因素和可能的结果。
FaR 在 T4D 中的应用

通过结合预见和反思两个阶段，FaR 框架能够引导模型进行更结构化、更深入的推理。这不仅有助于模型更准确地理解角色的心理状态，还使其能够更有效地将这些理解转化为适当的行动或决策。例如，如果在一个故事中，一个角色想找到他的背包，模型首先会在预见阶段预测角色可能会去哪里找。然后，在反思阶段，模型可能会考虑其他因素，如角色过去在哪里找到过背包，或者在当前环境中哪些地方最可能存放背包，从而优化其行动建议。

相关阅读:
windows下VS配置NISwGSP
Java-拼图小游戏
c语言---指针进阶（1）
【html5期末大作业】基于HTML+CSS+JavaScript管理系统页面模板
MYSQL--事务
【电源专题】案例：直接用LDO或Buck不香？为什么非要用Buck降压再转LDO？
GIS基础
python库-dotenv包 | .env配置文件
如何排版一篇优秀的公众号文章呢？
对时间强依赖的方法如何做单元测试

原文地址：https://blog.csdn.net/specssss/article/details/133680232