码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 论文笔记:Large Language Models Are Zero-Shot Time Series Forecasters


    2023 neurips

    完全是零样本(zero-shot)的,不需要微调

    1 方法

    1.1  Tokenization(分词和编码)

    • 现有的LLM(比如GPT3)的tokenizer不能直接用来编码时间序列的句子
      • 比如对数字42235630,tokenizer处理之后为三个token:[422,35,630]
      • 如果数字中某一位改变了,那tokenizer后的token可能完全不一样。
      • ——>论文为时间序列提出了特殊的tokenization方式

    • 对于GPT3来说,给数的每位之间加上空格,效果要比不加空格要好。
    • 对于LLaMA来说,它本身的tokenizer就已经会把每位数当成一个token,因此无需再加空格,加了反而损害性能。、

    1.2 minmaxscaler

    • 时间序列数值有可能非常大,要覆盖那么多数值需要很多的token。
    • 因此,在输入之前,会用MinMaxScaler将数值进行缩放,限制数值的范围

    1.3 Forecasting

    在每次预测时,都会多次实验采样很多组预测值,这么多组的预测值的中位数或均值可以作为点预测的结果,使结果更加鲁棒

    1.4 为什么LLM能做序列预测

    • 这是因为序列预测本质上就是对未来值的条件分布进行建模,简单的RNN都能拟合复杂的数字数据分布,更何况LLM

    2 实验

  • 相关阅读:
    刷题之路:1216 - 【基础】数塔问题(递推求解)题解
    玩转微服务-SonarQube
    部门来了个测试开发,听说是00后,上来一顿操作给我看呆了...
    【Azure 应用服务】NodeJS Express + MSAL 应用实现AAD集成登录并部署在App Service Linux环境中的实现步骤
    实战Docker未授权访问提权
    74道高级Java面试合集,java开发模式面试题
    【SA8295P 源码分析 (一)】48 - QNX 侧GPIO 配置方法、中断配置、调试工具 详解
    阳离子卟啉化合物修饰氯甲基化交联/聚乙烯基吡啶阳离子功能化聚苯乙烯微球的研究
    50.集群节点维护—升级前重建索引
    强强联合,波卡生态正成为物联网赛道关键入口
  • 原文地址:https://blog.csdn.net/qq_40206371/article/details/138079860
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号