在很早之前关于可视化的描述中,我们介绍过一款D-table的数据分析操作工具。和D-table的操作相似,还有一款pandasGUI的开源工具更加强势。
Pandasgui是一个开源的python模块,它为pandas创建了一个GUI界面,我们可以在其中使用pandas的功能分析数据和使用不同的功能,以便可视化和分析数据,并执行探索性数据分析。更重要的是 pandasGUI 的交互式数据绘图模块是值得一提的,主要包含几个特征:
支持DataFrames和Series数据
提供了交互式绘图
数据筛选、处理
统计摘要
数据编辑和复制/粘贴
拖放导入CSV文件
本文由技术群粉丝分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友
方式①、添加微信号:dkl88191,备注:来自CSDN +研究方向
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:加群
安装过程也比较顺利,使用pip的方式直接安装,这里默认使用了清华大学的镜像站。
pip install pandasgui -i https://pypi.tuna.tsinghua.edu.cn/simple
注意:请尽量采用windows10以上操作系统,使用windows7在安装时会出现问题,其中底层依赖用到的python非标准模块较多,请耐心等待安装完成。
启动pandasGUI的方式也比较简单,只需要几行代码并导入需要的python模块即可。
# Importing the pandas module and giving it the alias pd.
import pandas as pd
# Importing the `show` function from the `pandasgui` module.
from pandasgui import show
data_frame = pd.DataFrame()
show(data_frame)
这个时候直接启动pandasGUI发现缺少了win32api模块,就像下面这样。
import win32api
ModuleNotFoundError: No module named 'win32api'
我们再来使用pip的方式安装一下pywin32模块即可。
pip install pywin32 -i https://pypi.tuna.tsinghua.edu.cn/simple
这次我们再运行上面的代码块就可以直接启动pandasGUI了,启动之后出现一个桌面的小工具。
接下来,我们就可以直接使用pandasGUI来处理相关的数据了,主要支持了.json、.xlsx、.csv的数据格式。
在edit菜单下面直接使用import导入我们需要处理的数据文件。
在做文件数据导入的时候又发现了缺少openpyxl模块。
ModuleNotFoundError: No module named ‘openpyxl’
同样,使用pip的方式安装一下即可。
pip install openpyxl -i https://pypi.tuna.tsinghua.edu.cn/simple
由于是python的新环境,有些模块并没有自动安装,因此需要我们手动安装一下,安装完成之后重新启动一下。
再来导入一下我们准备好的数据文件。
数据筛选也比较简单,只需要输入字段对应的筛选条件即可,比如我们需要筛选年龄大于10的数据,添加如下筛选条件即可。
年龄 > 10
其他的使用方式都比较简单,这里就不多作介绍了,下面主要来看一下几种比较好的数据可视化操作。