码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 论文总结-交通预测(未完成)


    通过找文献、下载文献、精读文献,向好的文章学习,具体化、实例化的总结归纳每一篇文章!不要浪费时间在劣质文章和试读文章,要多多花费时间在精读文章上~~学会使用《中国计算机学会推荐国际学术会议和期刊目录》

    Sci论文期刊检索|文献检索求助互助 - Sci-Hub|Scidown

    dblp: computer science bibliography

    Sci-Hub:SciHub科研学术网址导航


    目录

    0.概况

    一、研究背景

    1.1目前方法的局限

    1.2研究的意义

    1.3本文主要贡献

    二、本文方法

    2.1两类方法

    具体化

    model

    2.2具体实现

    A参数回归和非参数回归

    参数回归:

    非参数回归:

    B深度学习

    C集成学习方法

    2.3方法论

    A问题描述

    B使用CNN进行时空表示     

    C对交通预测的集成学习

    ​算法: 

    三、实验分析

    A数据集和实验设置

    (1)数据集描述和数据预处理

    (2)模型架构

    B评价指标

    C结果和讨论

    实验对比

    成功项目展示

    四、文献拓展


    0.概况

    文献名称:Acting as a Decision Maker:Traffic-Condition-Aware Ensemble Learning for Traffic Flow Prediction

    本地位置:/Users/yueying/Desktop/others🧴/ml

    期刊:IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS

    发表时间:2020

    关键词:Traffic flow prediction,ensemble learning,deep learning

    数据集:Caltrans Performance Measurement System 网址:http://pems.dot.ca.gov/

    权威数据:交通领域科研常用数据集总结与分享

    真正意义上读懂一篇文献,是深入浅出,用最简单的语言讲述复杂的问题,具体的模型和方法远远没有弄懂这篇论文“在干什么”重要。


    一、研究背景

    由于交通流时间序列中复杂的不稳定的时间动态化&公路网络的空间依赖性(就是指当地理空间中某一点的值依赖于和它相邻的另一点的值时,就产生了空间依赖性,于是在这一个地理空间中各个点的值都会影响相邻的其他点的值。)目前没有很有优势的方法

    1.1目前方法的局限

    没有假设一个交通流量模型去描述交通系统的动态性;

    没有一个交通模型可以一直优于其他模型,在任意交通状况,对于任意数据集;原因:(1)由于交通流时间序列中复杂的不稳定的时间动态化&公路网络的空间依赖性难以建模(2)一个单独模型难以概括不同的交通状况

    1.2研究的意义

    有重要意义:for both proactive traffic control and traveler information service

    1.3本文主要贡献

    (1)设计出了一个集成学习框架:TCAE——Traffic-Condition-Aware-Ensemble 改善了交通预测的性能;

    (2)构造了CNN模型,通过提取时空特征,卷积操作提取时间特征,池化操作提取空间特征;

    (3)作者实验证明了TCAE的性能优于SVR,LSTM,HA,WR,GBRT

    二、本文方法

    2.1两类方法

    (1)基于模型的[例如macroscopic model, mesoscopic model, microscopic model]

    (2)大数据驱动的[建立一个mapping]   【作者集中讲述】

    具体化

    集成学习vs GBRT SVR LSTM HA

    公式:

    F是一个集成模型,f是基模型,\gamma是基模型的权重;

    上图展示:不同(SVR和LSTM)基模型的性能;

    (a)LSTM预测在目标值的上面,SVR预测在目标值的下面;

    (b)LSTM和SVR均在目标值的下面;

    (c)LSTM和SVR均在目标值的上面;                                                                      

    model

    本文使用CNN获取交通流中的spatiotemporal时空特征,提取高水平的特征,生成权重。

    2.2具体实现

    本文提出了一个集成学习框架:两个必不可少的模型分别是交通状况识别和动态权重生成

    A参数回归和非参数回归

    参数回归:

    ARIMA(Autoregressive Integrated Moving Average 时间序列自回归整合移动模型):预测交通容量 1980's  首先识别出3个模型参数,ARIMA(p,d,q) ,p 代表自回归项的数量, d 代表差分阶数, q代表移动平均项的数量。

    很多研究者提出了它的变体:Kohonen ARIMA, subsetARIMA, ARIMA with explanatory variables, and Seasonal ARIMA;

    vs ARIMA:卡尔曼滤波也是一种参数回归的方法;

    ARIMA(p,d,q)模型原理及其实现 --------python_English Chan的博客-CSDN博客_arima模型表达式怎么写

    参数回归不适合预测快速变化的样本 => 非参数回归。

    非参数回归:

    非参数回归的方法例如:SVR(support vector regression支持向量机回归),KNN(k-nearest neighbors最邻近分类) 

    机器学习笔记 - 什么是支持向量回归(SVR)?_坐望云起的博客-CSDN博客_支持向量机回归

    机器学习之KNN最邻近分类算法_pengjunlee的博客-CSDN博客_knn分类算法

    KNN算法(一) KNN算法原理_~风凌天下~的博客-CSDN博客_knn

    B深度学习

    DNN深度神经网络算法比传统的参数回归和非参数回归方法性能更高,主要使用的体系结构有:DFN深度前反馈网络,RNN循环神经网络,CNN卷积神经网络...

    C集成学习方法

    同质弱学习器:bagging(基础模型根据不同的训练实例集进行训练,然后对其输出直接取平均值进行回归或多数投票进行分类) & boosting(训练一系列基模型在同一时间计算出权重);

    异质弱学习器:stacking(先训练基模型,然后再训练一个高水平的模型或元模型,把基类模型的输出当作输入);

    集成学习方法可以减少模型种类,提高预测精度;

    列举最近的研究...

    2.3方法论

    A问题描述

    把观测到的交通数据(交通容量、行程时间)和外部信息(例如极端天气)映射到目标交通流量预测,定义一个交通流矩阵:

    x_{t}^{i} 代表探测器 i 在时间 t 的交通流,矩阵里面存放的是历史探测数据;\hat{y}_{t+1}^{j} 代表探测器 j 在时间 t+1 的交通流估计值;映射函数可以表示为 \Re :X^{i}\rightarrow \hat{y}_{t+1}^{j}    

    B使用CNN进行时空表示     

    把式(5)代入式(4)得到式(6) a_{p}^{I}=f(K^{T}x_{t-\tau +p:t-\tau +p +V-1}^{I}+b);

    我们重复迭代式(6)从p=1​​​​​​​ 至 p=\tau -V+1,我们得到卷积操作在特征向量 x_{t-\tau +1:t}^{i} 基础上的特征向量a^{i}=(a_{1}^{i},a_{2}^{i},\cdot \cdot \cdot, a_{\tau -V+1}^{i})^{T};如果有M 个探测器,输出特征的维度是:M *(\tau -V+1),写作A_{k}=(a^{1},\cdot \cdot \cdot,a^{M} )^{T}.

    一层filter卷积输出一个feature map,池化输出的 q-th 元素 在特征向量a_{j}=(a_{j}^{1},\cdot \cdot \cdot \cdot ,a_{j}^{M})^{T}是 o_{j}^{q}=f(\beta max[a_{j}^{q},\cdot \cdot \cdot ,a_{j}^{q+m-1}]+b),\beta是乘法的偏置,b是加法的偏置,m是池化窗口的尺寸。f是激活函数,池化的输出可以写作:

     卷积操作和池化操作之后,最新的输出map传递到全连接神经网络层,输出权重向量:(a_{i}\cdot \cdot \cdot a_{j})^{T} .

    C对交通预测的集成学习

    (1)增强精度;

    (2)减少误差;

    一个相加模型:

    \hat{y}_{t}=\Re (X_{t}-1)=\sum_{i}^{}\alpha _{t,i},\hat{y}_{t,i}

    \alpha _{t,i} 是使用CNN学习到的权重,\hat{y}_{t,i} 是i-th 交通预测器的输出;

    定义损失函数:

    L=L(y_{t},\sum \alpha _{t,i} \hat{y}_{t,i} )

    算法: 

    三、实验分析

    实验证明了作者预测的高性能:

    A数据集和实验设置

    (1)数据集描述和数据预处理

    作者使用交通领域科研常用数据集:Caltrans PeMS,是California的交通大数据系统,地图上显示的交通数据是从39000多个单独的探测器中实时收集的,这些传感器跨越了California所有主要都会区的高速公路,数据量非常之大、之全。

    147个机动车探测器,数据时间跨度:一年中363天,从上午6点到下午十点;

    用箱形图表示数据集,表示出最小值、上四分位数、中位数、下四分位数和最大值:

     对数据集进行z- score标准化处理,公式如下:y^{*}=\frac{y-\overline{y}}{\sigma } 

    前50个数据用来计算,147分数据用来当作输入,前80%用作训练集,后20%用作测试集。

    上图绘出了工作日和周末高速公路交通流;

    为充分利用时空特征,时间序列特征向量 x^{i}:由连续的6个交通流点组成,命名为(x_{t-5}^{i},...,x_{t-1}^{i},x_{t}^{i}),显示地显示出了机动车探测点位置的时间依赖性,数据集包含了147个机动车探测点位置(VDS i),交通矩阵X_{t} 包含了所有机动车探测点位置的特征向量,表示为:

    (x_{t-5:t}^{1},x_{t-5:t}^{2},\cdot \cdot \cdot \cdot, x_{t-5:t}^{147})^{T}

    (2)模型架构

    Pytorch & scikit-learn

    WRegression的预测值 \hat{y} 写作  \hat{y}=\sum_{i}^{}\omega _{i}\hat{y}_{i}  ,\hat{y}_{i}是基模型i的预测值,w_{i}是它的权重。

    B评价指标

    MAE

    RMASE

    MRE

    C结果和讨论

    实验对比

    成功项目展示

    四、文献拓展

    文献总结模版参考:文献Review:基于端元可变光谱分解的多时相遥感影像变化检测方法_harden1013的博客-CSDN博客

    机器学习 - Ensemble Model - 知乎

    自动回归移动模型 - 小司 - 博客园

    移动平均线研判(Moving average) - 道客巴巴

    Bagging与Boosting的区别与联系_我对算法一无所知的博客-CSDN博客_bagging和boosting的区别

    ​​​​​​常用的模型集成方法介绍:bagging、boosting、stacking


    集成学习方法之Bagging,Boosting,Stacking_天才厨师1号的博客-CSDN博客_bagging、boosting、stacking
     

    ImportError: cannot import name 'tqdm' from partially initialized module 'tqdm' (most likely due to a circular import) (/Users/yueying/coding2022/tqdm.py)

    解绝:ImportError: cannot import name XXX from partially initialized module XXX (most likely_沫小希的博客-CSDN博客

    python3中,socket使用send函数时出现的错误:TypeError: a bytes-like object is required, not 'str'_code的魅力的博客-CSDN博客

  • 相关阅读:
    异步复位的串联T触发器
    Jmeter接口自动化测试操作流程
    DOS路径与NT路径转换(Win32, C++)
    FM5889协议系列-识别加限流IC 多口USB超级充电器
    荐读 | 图计算的查询模式有哪些?
    【openGauss】如何在openGauss中实现类似Oracle中constructor function、member function的功能
    ORM框架,反射,泛型,注解,CRUD实现
    Vue路由介绍及使用
    记一次使用动态引入vue组件的经历
    小黑开组会呢的leetcode之旅:剑指 Offer 57. 和为s的两个数字
  • 原文地址:https://blog.csdn.net/m0_57656758/article/details/127166592
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号