注意力机制

故名思意，研究这个机制就是为了
使用重要数据
不使用不重要的数据
对于一个模型而言（CNN、LSTM），很难决定什么重要，什么不重要
由此，注意力机制诞生。
在这里插入图片描述
科学家发现给这张图，眼睛重点聚集在红色区域。
这些红色区域可能包含更重要的信息。

我（查询对象 Q），这张图（被查询对象）
我看这张图，第一眼，去判断那些东西对我更重要，哪些对我更不重要（计算Q和V里的事物的重要程度）

在这里插入图片描述
进而可以知道哪个对Q而言更重要了。

还得进行汇总，找到这些目标后，Q已经失去了使用价值了，现在图片多了一些信息（于我而言更重要、更不重要的信息）。

v是源数据，Q和K共同组成了V，
在这里插入图片描述
通过上述变换，就得到一个新的V ，这个新的V 包含了，那些更重要，那些更不重要的信息在里面。

相关阅读:
解析Vue3源码（二）——ref
Bash脚本实现Linux开机自启Redis，Nginx，MySQL等服务
Python操作MongoDB数据库
【C++】-- STL之unordered_map/unordered_set详解
【数据库数据恢复】Oracle数据库文件出现坏块报错的数据恢复案例
LLM大语言模型(典型ChatGPT)入门指南
linux虚机新增加磁盘后在系统中查不到
HTML期末学生大作业基于HTML+CSS+JavaScript通用的后台管理系统ui框架模板
基于YOLOv5、YOLOv8的烟雾报警检测（超实用项目）
基于RoBERTa-wwm动态融合模型的中文电子病历命名实体识别

原文地址：https://blog.csdn.net/weixin_51162561/article/details/133276079