大家好,我是阳哥。
有不少同学跟我提过,看看能不能出一系列 Pandas 数据处理的教程,之前一直也没来得及弄。
最近几个月,才开始陆陆续续的弄内容。
为了大家能够生动、形象的学习 Pandas,阳哥正在制作一系列 《图解Pandas》 的内容,当前已在微信视频号「Python数据之道」发布 30多 期视频,同时在公众号「Python数据之道」配套发布了 9 篇图文内容(图文中配套源代码以及在PC端观看的高清视频)。
《图解Pandas》主要跟大家以视频图解、动态图片等方式来讲解 Pandas 的基础知识,方便大家快速的掌握这些知识,相信《图解Pandas》会给大家带来一些不一样的视角。
视频内容:在微信视频号「Python数据之道」发布视频,是可以免费观看的。
图文内容:在微信公众号「Python数据之道」发布的图文内容,则是付费阅读内容,付费部分包括《图解Pandas》图文干货内容、可以在电脑端观看的高清视频以及配套的源代码等。对于打算深入学习Pandas的同学,相信会有诸多益处的。目前每次发布单篇的付费内容,后续会考虑出付费合集。
《图解Pandas》的视频内容一般如下:
扫描下面的二维码,关注视频号,可以观看《图解Pandas》已发布的所有视频以及及时推送最新的视频:
《图解Pandas》 系列,是一个不小的工程,目前进行过程中,算是半个期货吧,搞不好就是烂尾工程啦,大家的支持就是我持续分享的动力,嘿嘿~~
《图解Pandas》系列已发布的图文链接(点击下面链接前往围观)以及对应的视频编号,汇总如下:
图文链接 | 视频号对应编号 |
---|---|
《图解Pandas》内容框架介绍 | - |
图文01-数据结构介绍 | 001 |
图文02-创建数据对象 | 002 |
图文03-读取和存储Excel文件 | 003、004 |
图文04-常见的数据访问 | 005 |
图文05-常见的数据运算 | 006-008 |
图文06-常见的数学计算 | 009、010 |
图文07-常见的数据统计 | 011-015 |
图文08-常见的数据筛选 | 016-028 |
图文09-常见的缺失值处理 | 029-034 |
DataFrame (中文翻译“数据框”)介绍:
图解数据框轴方向:
DataFrame 与 Series 之间的关联:
从Excel读取数据时,有时需要跳过数据文件末尾部分数据行:
通过 df.T
可以实现数据框的行列转置:
如何获取 Series 中最小值或最大值对应的索引位置以及索引值。
通过 argmin()
函数来获取最小值对应的索引位置,如红色标注所示,结果为数字 1
,如下:
通过 idxmin()
函数来获取最小值对应的索引值,如红色标注所示,结果为字母 e
,如下:
默认情况下,shift()
函数中 axis=0
,将数据框沿 0轴方向
向下偏移一个位置,结果如下:
详细的实现过程动态演示如下:
在Pandas中,可以通过多种方法进行数据筛选,在视频号「Python数据之道」第16-28期视频中 ,对数据筛选进行了比较详细的介绍。
这里分享一个条件筛选的案例。
应用 loc 函数实现条件筛选,相当于loc后面第一部分是条件判断,逗号后面是选取列。如下图蓝色标注2所示:
可以通过字典的方式,对数据框每列填充不同的常数。
字典的 key
值对应数据框的列索引名称。
这里,对于缺失值,a列填充数字11,b列填充数字22,c列填充数字33,动态图演示如下:
dropna
函数有一个参数 subset
可以设置,subset
参数表示的是其他轴方向对应的索引标签。
设置 axis=1
,此时,subset
里的"a" 指的是行索引标签中的 a 行。这里的操作,表示的是将数据框a行中含有缺失值的数据列进行删除操作。因此,结果中删除了a列和b列。动态图演示如下:
考虑到《图解Pandas》系列内容在不断更新过程中,大家可以通过下面的专题来找到最新发布的内容。
同时考虑到,以后如果文章数量较多(比如超过50篇文章),可能在专题中也不好快速的找到所需要的内容,我会以文章汇总的形式,将《图解Pandas》系列的文章进行手动汇总,并形成 图解Pandas汇总
的专题,最新的汇总文章,可以点击下面专题,找到最新的文章即可。
学习 Pandas,最难的还在于坚持,希望《图解Pandas》能给大家带来一些乐趣,一起加油吧!
大家读完顺手点下右下角的 “在看” ,就是最大的鼓励和支持了。