一、选题意义
随着我国经济的快速发展,我们国家的地铁事业正在快速发展,很多城市都拥有了地铁。自1969年北京开通第一条地铁线路建成通车,到2021年全国总线路总长达7253.73公里,我们只用了40年时间。这四十年里,地铁开通城市数量达到40个。地铁已经成为人们出行必不可少的交通工具,在缓解城市交通压力方面起着重要作用。此次分析就让我们通过我们所学工具了解全国主要城市地铁线路、站点的情况。
二、数据爬取
1、地铁线路信息获取
2、城市信息获取
三、数据可视化分析
que1:绘制地铁站名中带有大学的城市分布柱状图
que2:绘制每个城市站点数量最多的线路柱状图
que3:绘制中国地铁中最爱用的字
que4:绘制各城市地铁线路数量分布图
que5:全国各城市的总换乘站点数量分布统计
que6:北京,武汉,天津,上海四城的地铁各线路站点数量的分布
que7:所有城市线路站点数量前十的折线图
que8:绘制郑州、武汉、广州、长沙同名的线路1-线路6的站点数量分布的折线图
que9:各个城市的线路数量的饼状图分布
que10:各个城市的站点数量的饼状图分布
que11:统计各个城市的大学数量,然后利用回归图进行拟合(分析各个城市的大学数量与站点数量的关系)
que12:绘制各个城市的大学数量与站点数量的关系散点图
que13:绘制大学数量与站点数量的双变量图
que14:绘制已开通地铁城市分布情况热力图
que15:绘制各线路地铁站名的词云图
四、总结
通过高德地图爬取最新全国已开通地铁城市的共计5968条数据地铁站点进行数据分析,通过数据可视化分析对城市地铁站点、线路、站点名、线路名、站点数量与城市大学数量的关系等方面分析。分析方式主要是图表,通过matplotlib、pyecharts、wordcloud、seaborn等可视化方式实现。