• 数据集笔记:Pems 自行下载数据+python处理


    以下载District 4的各station每5分钟的车速为例

    1 PEMS网站下载数据

    点击红色的

    选择需要的station和区域,点击search,就是对应的数据,点击数据即可下载 (这个是station每5分钟的速度数据)

     2 pems 速度数据

    2.1 每一列的意义

    Timestamp

    间隔开始的日期和时间。例如,08:00:00的时间表明聚合包含在08:00:00到08:04:59之间收集的测量数据。

    请注意,五分钟聚合的秒值总是0。格式为MM/DD/YYYY HH24:MI:SS。

    Station独特的车站标识符。
    District区号
    Freeway高速公路号
    Direction

    行驶方向

    东南西北 ESWN

    车道类型

    表示车道类型的字符串。

    可能的值(及其含义)为:

    • CD(收集/分配)
    • CH(传统公路)
    • FF(高速公路-高速公路连接)
    • FR(下匝道)
    • HV(高占用车道)
    • ML(主线)
    • OR(上匝道)
    Station Length车站覆盖的路段长度,单位为英里/公里。
    Samples所有车道接收的样本总数
    % Observed在这个位置有observation的车道的百分比
    Total Flow所有车道5分钟内流量总和。
    Avg Occupancy5分钟内所有车道的平均占用率,以0到1之间的小数表示
    Avg Speed所有车道5分钟内的流量加权平均速度。如果流量为0,则为5分钟车速的数学平均值
    Lane N Samples车道N收到的良好样本数。
    Lane N Flow5分钟内车道N的总流量。
    Lane N Avg Occ5分钟内车道N的平均占有率
    Lane N
    Avg Speed
    5分钟内车道N的平均速度
    Lane N
    Observed
    车道N是否有观测值(1代表有,0代表没有)

    2.2 python 读取PEMS

    1. import numpy as np
    2. import pandas as pd
    3. #设置header
    4. new_headers = ['Timestamp', 'Station', 'District', 'Freeway', 'Direction',
    5. 'Lane Type', 'Station Length', 'Samples', '%Observed',
    6. 'Total Flow', 'Avg Occupancy', 'Avg Speed']
    7. for i in range(1, (pems04.shape[1]-12)//5+1):
    8. new_headers.extend([
    9. f'Lane {i} Samples', f'Lane {i} Flow', f'Lane {i} Avg Occ',
    10. f'Lane {i} Avg Speed', f'Lane {i} Observed'
    11. ])
    12. pems04=pd.read_csv('d04_text_station_5min_2023_01_02.txt',names=new_headers)
    13. pems04

     3 pems station 元数据

    3.1 每一列的意义

    IDstation 的标识
    Freeway高速公路编号
    Freeway Direction表示高速公路方向的字符串
    County Identifier县id
    City城市
    State Postmile州公里标
    Absolute Postmile绝对公里标
    Latitude,Longitude经纬度
    Length长度
    Type

    类型

    可能的值(及其含义)为:

    • CD(收集/分配)
    • CH(传统公路)
    • FF(高速公路-高速公路连接)
    • FR(下匝道)
    • HV(高占用车道)
    • ML(主线)
    • OR(上匝道)
    Lanes车道数
    Name名字
    User IDs用户输入的字符串标识符

    3.2 python读取

    1. import numpy as np
    2. import pandas as pd
    3. pems04=pd.read_csv('d04_text_meta_2022_12_13.txt',delimiter='\t')
    4. pems04

  • 相关阅读:
    PyTorch深度学习(30)OpenCV图像处理
    C++反转链表递归
    DolphinDB 四大因子库合集
    自学Python 56 多线程开发(六)使用 Process
    第34章_瑞萨MCU零基础入门系列教程之SR04超声波测距实验
    Python实现SSA智能麻雀搜索算法优化LightGBM分类模型(LGBMClassifier算法)项目实战
    如何在Sage X3 ERP中使用集装箱管理和物流跟踪
    PyTorch学习(11):PyTorch的形状变换(view, reshape)与维度变换(transpose, permute)
    QT串口通信
    彻底理解闭包实现原理
  • 原文地址:https://blog.csdn.net/qq_40206371/article/details/134527077