码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Pytorch数据集读出到transform全过程


    最近写代码又遇见了这个问题,又忘记了,于是写一篇博客记录一下。

    一般我们使用pytorch获取CIFAR10数据集,一般这样写:

    mean = [0.4914, 0.4822, 0.4465]
    std = [0.2023, 0.1994, 0.2010]
    transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize(mean=mean, std=std)])
    dst_train = datasets.CIFAR10(data_path, train=True, download=True, transform=transform)  
    dst_test = datasets.CIFAR10(data_path, train=False, download=True, transform=transform)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    最后出来的结果都是小数和xxx数。

    Q1. 数据从读入到处理结束

    如果使用了ToTensoer,那么会将原始数据都归一化到0~1的范围内,数据都将除以255。
    在这里插入图片描述在这里插入图片描述
    归一化之后,就是标准化,我们使用Normalize并传入mean和std,公式是:
    o u t p u t = i n p u t − m e a n s t d output = \frac{input -mean}{std} output=stdinput−mean​
    注意!input已经被除255了。
    这样就得到了最后的结果。

    Q.2 如何访问原始数据

    其实数据一直都没有被修改,当你使用

    dst_train = datasets.CIFAR10(data_path, train=True, download=True, transform=transform)
    
    • 1

    得到一个训练集的时候,原始数据并没有被transform,数据其实一直保存在dst_train.data里
    在这里插入图片描述
    在迭代或者通过下标获取数据时,才会使用transform来修改数据。
    在这里插入图片描述
    这个类维持一个data原始数据,因此有时候如果要修改数据,其实没必要去修改标准化后的数据,直接修改.data即可。

    如果有人做的是后门攻击,可以尝试一下重写CIFAR10数据集的类,重写__getitem__ 即可。

  • 相关阅读:
    跟着李老师学线代——矩阵(持续更新)
    【C++】函数参数扩展 ( 默认参数 | 默认参数定义规则 | 默认参数定义在参数列表末尾 )
    队列的基本操作(C语言实现)
    商城数据库设计说明书
    免费、强大的笔记软件推荐:Obsidian、Zettlr、Joplin、FlowUs
    Oracle触发器设置
    网站被大量cc攻击导致打不开怎么解决
    《财富》500 强企业要求 curl 开源工具作者提供免费及时的支持;基于Chromium的Edge浏览器正在整合文本预测功能 | 开源日报
    论文阅读记录--关于水文系统的传递函数
    图像处理之彩色图像处理
  • 原文地址:https://blog.csdn.net/huoshanshaohui/article/details/134407183
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号