码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • transformer 最简单学习3, 训练文本数据输入的形式


    1、输入数据中,源数据和目标数据的定义

    def get_batch(source,i):
        '''
        
        用于获取每个批数据合理大小的源数据和目标数据
        参数source 是通过batchfy   得到的划分batch个 ,的所有数据,并且转置列表示
        i第几个batch
        '''
        bptt = 15  #超参数,一次输入多少个batch 数据,现在数据矩阵,一行表示一个batch, 一共有n个行,  
    
        # len(source) - 1 - i  从大往小变化,知道小到bptt,所以seq_len,大部分时间都是bptt 个=15个,最后几个训练才越来越少
        seq_len = min(bptt, len(source) -1-i)  #一共是列的元素长度,30个,  行是10个,一共三个batch ,
        # 这是转置过的,现在,就变成30个batch,每个batch 长度是3
        
        # 行数错一位,目标数据是原数据向下一位,
        data = source[i:i+seq_len]
        # 这里最后会越界,使用view(-1) 保证形状正常
        target = source[i+1:i+1+seq_len]
        return data,target #
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    文本数据,是每个单词对应的索引,需要对数据进行切分成整块的batch, (n行,batch列), 变成竖着的,
    (batch行,n列)
    然后,横着一个一个 切分成一个个batch数据,下移一个索引获取目标数据,

    (n行,batch列)

    【 
         [A,B,C,D,E,F]
         [G,H,I,J,K,L]
         [M,N,O,P,Q,R],
         ……
     】
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    (batch行,n列)
    在这里插入图片描述

    横着看,每一位 AGMS 对应 BHNT, AB, GH, MN, ST, 是相邻的两个字
    在这里插入图片描述

  • 相关阅读:
    239. 滑动窗口最大值/76. 最小覆盖子串
    代数与逻辑:作业一 线性模型
    Windows10安装Docker(基于WSL2,包含WSL2安装教程)
    docker使用记录1:构建java、python、c++环境镜像
    Django数据删除方法
    Django实现音乐网站 (21)
    Docker 配置国内镜像加速器
    云原生Kubernetes:K8S集群版本升级(v1.20.6 - v1.20.15)
    go小知识2
    SPARKSQL3.0-Optimizer阶段源码剖析
  • 原文地址:https://blog.csdn.net/m0_37192554/article/details/138187429
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号