码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【科研】浅学Cross-attention?


    Cross-Attention in Transformer Architecture 

    最近,CrossViT让我所有思考,这种能过够跨膜态的模型构建?浅学一下吧!


    目录

    1.Cross attention概念

    2.Cross-attention vs Self-attention 

    3.Cross-attention算法 

    4.Cross-Attention 案例-感知器IO



    1.Cross attention概念

    • Transformer架构中混合两种不同嵌入序列的注意机制
    • 两个序列必须具有相同的维度
    • 两个序列可以是不同的模式形态(如:文本、声音、图像)
    • 一个序列作为输入的Q,定义了输出的序列长度,另一个序列提供输入的K&V
    • ps:不知道QKV的先去普及一下Attention的基础、更专业的学习资源here吧!

    2.Cross-attention vs Self-attention 

    Cross-attention的输入来自不同的序列,Self-attention的输入来自同序列,也就是所谓的输入不同,但是除此之外,基本一致。

    具体而言,

    self-attention输入则是一个单一的嵌入序列。

    Cross-attention将两个相同维度的嵌入序列不对称地组合在一起,而其中一个序列用作查询Q输入,而另一个序列用作键K和值V输入。当然也存在个别情况,在SelfDoc的cross-attention,使用一个序列的查询和值,另一个序列的键。总而言之,QKV是由两序列拼凑的,不单一。

    3.Cross-attention算法 

    softmax((W_{Q}S_{2})(W_{K}S_{1})^{T})W_{V}S_{1}

    • 拥有两个序列S1、S2
    • 计算S1的K、V
    • 计算S2的Q
    • 根据K和Q计算注意力矩阵
    • 将V应用于注意力矩阵
    • 输出的序列长度与S2一致

    4.Cross-Attention 案例-感知器IO

     感知器IO是一个通用的跨域架构,可以处理各种输入和输出,广泛使用交叉注意:

    • 将非常长的输入序列(如图像、音频)合并到低维潜在嵌入序列中
    • 合并“输出查询”或“命令”来解码输出值,例如我们可以让模型询问一个掩码词

    这样做的好处是,通常可以处理很长的序列。层次感知器能够处理更长的序列,将它们分解成子序列,然后合并它们。层次感知器也学习位置编码与一个单独的训练步骤,重建的损失。

  • 相关阅读:
    RK3399平台开发系列讲解(内存篇)ARM64虚拟地址空间布局
    企业微信自建应用开发流程
    ApiFox 基本使用教程(浅尝辄止,非广)
    面向对象的个人理解(封装/继承/多态实践)
    [论文笔记]SiameseNet
    开源后台管理系统 (go-vue-admin)
    人类认知的贝叶斯与机器的贝叶斯
    设计模式之代理模式
    无涯教程-Flutter - 安装步骤
    WiFi蓝牙模块促进传统零售数字化转型:智能零售体验再升级
  • 原文地址:https://blog.csdn.net/MengYa_Dream/article/details/126688503
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号