码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • PyTorch中torch.gather()函数


    一. torch.gather()函数

    官方文档:torch.gather函数,定义:从原tensor中获取指定dim和指定index的数据。
    看到这个核心定义,我们很容易想到gather()的基本想法其实就类似从完整数据中按索引取值般简单,比如下面从列表中按索引取值:

    lst = [1, 2, 3, 4, 5]
    value = lst[2]  # value = 3
    value = lst[2:4]  # value = [3, 4]
    
    • 1
    • 2
    • 3

    上面的取值例子是取单个值或具有逻辑顺序序列的例子,而对于深度学习常用的批量tensor数据来说,我们的需求可能是选取其中多个且乱序的值,此时gather()就是一个很好的tool,它可以帮助我们从批量tensor中取出指定乱序索引下的数据,因此其用途如下:
    用途:方便从批量tensor中获取指定索引下的数据,该索引是高度自定义化的,可乱序的。

    二. 举例

    找个3x3的二维矩阵做个实验:

    import torch
    tensor_0 = torch.arange(3, 12).view(3, 3)
    print(tensor_0)
    
    • 1
    • 2
    • 3

    输出结果:

    tensor([[ 3,  4,  5],
            [ 6,  7,  8],
            [ 9, 10, 11]])
    
    • 1
    • 2
    • 3

    2.1 输入行向量index,并替换行索引(dim=0)

    index = torch.tensor([[2, 1, 0]])
    tensor_1 = tensor_0.gather(0, index)
    print(tensor_1)
    
    • 1
    • 2
    • 3

    输出结果如下:

    tensor([[9, 7, 5]])
    
    • 1

    过程如图所示:
    torch.gather

    2.2 输入行向量index,并替换列索引(dim=1)

    index = torch.tensor([[2, 1, 0]])
    tensor_1 = tensor_0.gather(1, index)
    print(tensor_1)
    
    • 1
    • 2
    • 3

    输出结果

    tensor([[5, 4, 3]])
    
    • 1

    过程如图所示:
    torch.gather

    2.3 输入列向量index,并替换列索引(dim=1)

    index = torch.tensor([[2, 1, 0]]).t()
    tensor_1 = tensor_0.gather(1, index)
    print(tensor_1)
    
    • 1
    • 2
    • 3

    输出结果如下:

    tensor([[5],
            [7],
            [9]])
    
    • 1
    • 2
    • 3

    过程如图所示:
    torch.gather

    2.4 输入二维矩阵index,并替换列索引(dim=1)

    index = torch.tensor([[0, 2], 
                          [1, 2]])
    tensor_1 = tensor_0.gather(1, index)
    print(tensor_1)
    
    • 1
    • 2
    • 3
    • 4

    输出结果:

    tensor([[3, 5],
            [7, 8]])
    
    • 1
    • 2

    过程如上

    三. 总结

    从上面例子,可以归纳出torch.gather()的使用要点:

    1. 输入index的shape等于输出value的shape
    2. 输入index的索引值仅替换该index中对应dim的index值
    3. 最终输出为替换index后在原tensor中的值

    四. 一句话简单理解

    torch.gather的理解:
    index=[ [x1,x2,x2],
    [y1,y2,y2],
    [z1,z2,z3] ]
    
    如果dim=0
    填入方式
    [ [(x1,0),(x2,1),(x3,2)]
    [(y1,0),(y2,1),(y3,2)]
    [(z1,0),(z2,1),(z3,2)] ]
    
    如果dim=1
    [ [(0,x1),(0,x2),(0,x3)]
    [(1,y1),(1,y2),(1,y3)]
    [(2,z1),(2,z2),(2,z3)] ]
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    五. 参考链接

    https://zhuanlan.zhihu.com/p/352877584

  • 相关阅读:
    系统架构设计】计算机公共基础知识: 5 数学与经济管理
    DDD—分层架构、洋葱架构、六边形架构
    使用企业订货系统后的效果|软件定制开发|APP小程序搭建
    zabbix5 使用自动发现对端口进行监控
    关于一个git的更新使用流程
    学个Antenna:Matlab天线工具箱知多少(一)
    文举论金:非农到来!黄金原油全面走势分析策略独家指导
    Flink 物理执行图
    【数据结构与算法】时间复杂度和空间复杂度
    【场景化解决方案】北极星深度集成钉钉PaaS,让OKR管理更加敏捷高效
  • 原文地址:https://blog.csdn.net/flyingluohaipeng/article/details/128060091
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号