• R语言空气污染数据的地理空间可视化和分析:颗粒物2.5(PM2.5)和空气质量指数(AQI)...


    原文链接:http://tecdat.cn/?p=23800

    由于空气污染对公众健康的不利影响,人们一直非常关注。世界各国的环境部门都通过各种方法(例如地面观测网络)来监测和评估空气污染问题点击文末“阅读原文”获取完整代码数据)。

    介绍

    全球的地面站及时测量了许多空气污染物,例如臭氧、一氧化碳、颗粒物。EPA(环境保护署)提供了空气污染数据,本文选择了颗粒物2.5(PM2.5)和空气质量指数(AQI)这两个关键变量,以可视化和分析空气污染的趋势和模式。PM2.5代表直径小于2.5微米的颗粒物浓度,AQI是综合考虑所有主要污染物的空气污染状况的整体指标。具体来说,此工作的数据源列出如下:

    • 监测人员每天的PM 2.5浓度水平和AQI指数数据;

    • 县一级的AQI年度摘要。

    数据预处理

    每日站点数据包含每个地面站与PM2.5相关的各种属性。有关站信息,污染物的关键变量通过以下代码从原始数据中过滤掉。重命名过滤后的数据框的列名,以方便以下分析。

    1. #导入数据
    2. aqi <- read_csv("aqi.csv")

    852ff7173a29a48f65f5bdebbae15fb9.png

    daily<- read_csv("daily.csv")

    1f618f701a143c7416e37a1d46026b60.png

    1. names(data) <- c( "date"
    2.                      "pm25""aqi",  "long""lat")

    统计摘要

    对点级PM2.5浓度和县级AQI指数的基本统计描述可以帮助更好地理解这两个变量。在这里,直方图和箱形图用于可视化PM2.5浓度和AQI的分布特征。每日AQI指数可衡量空气污染的严重程度,可用于根据AQI的值将天数分为不同的类别。就空气污染水平而言,通常可以将天气分为四类,包括良好,中度,不健康和危险。

    本报告中使用的县级AQI数据包括四个类别变量,代表每个类别的天数。下面的代码直观地显示了四个类别变量的分布。根据直方图,大多数县在整年总体空气质量良好,这可以通过良好''分布的偏斜来表示,不健康''和危险''的0天左右的分布间隔非常窄。此外,良好''和中等''的分布显示出相反的偏斜,这表明空气质量中等的日子在全年并不典型,因为中等''的分布集中在50天以下,而``良好''的分布在250天以上。

    1. ## 县域内aqi的直方图
    2. vi <-
    3.   aqi %>% 
    4.   select(`好', `中等', `不健康'`危险') %>%
    5. ggplot(data = vi )

    5827bec226882647f804a807bf66d17e.png

    县级数据代表空气污染的平均水平。来自地面站的PM2.5和AQI的点级测量描述了空气污染的详细情况和当地情况。


    点击标题查阅往期内容

    3d40c08a60e07df6e096001db2dd1f01.png

    R语言空间可视化:绘制英国脱欧投票地图

    outside_default.png

    左右滑动查看更多

    outside_default.png

    01

    outside_default.png

    02

    outside_default.png

    03

    outside_default.png

    04

    outside_default.png

    站级的PM2.5和AQI的分布如下所示。两种分布都显示出正偏度,AQI聚集在50附近,而PM2.5低于25。在这一年中,很少出现两个变量都具有高值的站点。

    1. ## ##AQI和PM2.5的直方图
    2.   pmaqi  %>%
    3. ggplot(data) +
    4.   geom_histogram(aes(x = value), bins = 35) +

    outside_default.png

    1. ggplot(data) +
    2.   geom_boxplot(aes(x =class,  y = value))

    outside_default.png

    时间变化

    每日数据记录了2018年监测站点每天的观测时间序列,可用于探索PM2.5和AQI的趋势。首先,针对每种数据对每种状态下站点的测量值求平均。选择了七个州的时间序列以显示其一年中的变化,如下所示。从该图可以看出,南部和西部各州在年初就经历了严重的空气污染问题。趋势曲线的高峰表明,下半年的空气质量均较差。

    1. ##按州和日排列
    2. vis <- 
    3.   select(state, date, pm25, aqi) %>%
    4.   group_by(state, date) %>%
    5.   summarise(pm25 = mean(pm25), aqi = mean(aqi)) %>%
    6. ggplot(data = vis)

    outside_default.png

    为了显示总体变化,每天汇总来自所有监视的测量值。一年中的总体变化绘制如下。我们可以看到,AQI和PM2.5的变化趋势显示出相似的模式,而夏季和冬季的空气污染更为严重。

    1. ##按天数计算
    2.   select(date, pm25, aqi) %>%
    3.   group_by(date) %>%
    4.   summarise( mean(pm25), mean(aqi)) %>%
    5. ggplot(data = vis) +

    outside_default.png

    空间分布

    汇总了针对不同州的县级AQI指数,以探索每个州的空气质量的空间变化。下图通过渐变颜色绘制了变量良好天气的不同平均值。该地图显示了各州空气质量良好的日子。从地图上可以看出,北部和东部地区的空气条件比其他州更好。

    1. ##按州汇总aqi(区域水平)。
    2. vis <- 
    3.   aqi %>%
    4.   group_by(State) %>%
    5. ggplot() +
    6.   geom_polygon(aes(x = long, y = lat, group = group, fill = good)

    outside_default.png

    下面还绘制了不健康天数变量的平均值,这证实了以前的观察结果,即东部各州的空气条件较好。

    1. ggplot() +
    2.   geom_polygon(aes(x = long, y = lat, group ,  fill ),          
    3.   scale\_fill\_distiller

    outside_default.png

    每个站点的站点级别测量值汇总为年平均值。下图显示了美国年平均PM2.5浓度的空间分布。绿色点表示较低的PM2.5浓度。西部的测站测得的PM2.5浓度较高。

    1. ## 数据的汇总
    2. ###用于pm2.5
    3.   pmaqi %>%
    4.   summarise(pm25 = mean(pm25), aqi = mean(aqi), long = mean(long), lat = mean(lat)) %>%
    5. ggplot() +
    6.   geom_polygon(aes(x = long, y = lat, group = group)

    outside_default.png

    AQI可以提供更全面的空气状况度量。站点上的点级AQI映射如下。由于AQI考虑了许多典型污染物,因此与PM2.5的模式相比,AQI的分布显示出不同的模式。

    1. ###aqi指数
    2. vi<- vi\[class == "aqi", \]
    3. ggplot(vi) +
    4.   geom_polygon(aes(x = long, y = lat, group = group)

    fd7e111212dad56a087b68b2bb762cb4.png

    结论

    本报告利用了空气污染数据和R的可视化,从时空维度探讨了空气污染的分布和格局。从数据中可以识别出PM2.5和AQI的时空变化。夏季和冬季均遇到空气污染问题。西部和南部的州比北部和东部的州更容易遭受空气污染问题。

    c4465cf47157898dc7ca590d547a2f63.jpeg

    本文中分析的数据分享到会员群,扫描下面二维码即可加群!

    cf2e4cf44adb350f7fc7b4162bf6c2f0.png

    00234f75a87b42ebfecba8b7d9ac3a89.jpeg

    点击文末“阅读原文”

    获取全文完整资料。

    本文选自《R语言空气污染数据的地理空间可视化和分析:颗粒物2.5(PM2.5)和空气质量指数(AQI)》。

    84bd8eb439bf0d13c6b94fb90a8378bf.jpeg

    f570280bbec0f60ee5fbd0d4268f4312.png

    点击标题查阅往期内容

    上海无印良品地理空间分布特征与选址策略可视化研究

    R语言空间可视化:绘制英国脱欧投票地图

    R语言在地图上绘制散点饼图可视化 

    r语言空间可视化绘制道路交通安全事故地图

    在GIS中用ggmap地理空间数据分析

    tableau的骑行路线地理数据可视化

    R语言推特twitter转发可视化分析

    618电商大数据分析可视化报告

    用RSHINY DASHBOARD可视化美国投票记录

    python主题LDA建模和t-SNE可视化

    R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

    R语言动态图可视化:如何、创建具有精美动画的图

    Tableau 数据可视化:探索性图形分析新生儿死亡率数据

    R语言动态可视化:制作历史全球平均温度的累积动态折线图动画gif视频图

    e332c86271523883daaee3b3dd43775f.png

    731957f3ee1d5845d44b38248b3ceca3.jpeg

    f4bb1e80f5f9f77746fa536741608257.png

  • 相关阅读:
    docker 部署prometheus+grafana
    研究生常用工具
    面向对象【static关键字】
    从零开始教你dubbo自定义负载均衡策略
    Redis 数据迁移篇之redis-migrate-tool工具使用手册
    linux删除软件
    数学建模:运筹学中的主要问题(技术)
    电商行业:全链路监测广告投放效果,用数据驱动业务增长
    LINUX系统下多进程的创建与通信前后台进程设计
    如何用Redis实现分布式锁?
  • 原文地址:https://blog.csdn.net/tecdat/article/details/132704526