码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Pandas常用操作命令(四)——数据切片、筛选


    文章目录

    • 🏳️‍🌈 4. 数据切片、筛选
      • 4.1 输出城市为上海的行
      • 4.2 输出城市为上海或广州的行
      • 4.3 输出城市名称中含有‘海’字的行
      • 4.4 输出城市名称以‘海’字开头的行
      • 4.5 输出城市名称以‘海’字结尾的行
      • 4.6 输出所有姓名,缺失值用Null填充
      • 4.7 重置索引
      • 4.8 前两行
      • 4.9 后两行
      • 4.10 2-8行
      • 4.11 每隔3行读取
      • 4.12 2-8行,步长为2,即第2/4/6行
      • 4.13 选取'语文','数学','英语'列
      • 4.14 学号为'001'的行,所有列
      • 4.15 学号为'001'或'003'的行,所有列
      • 4.16 学号为'001'至'009'的行,所有列
      • 4.17 列索引为'姓名',所有行
      • 4.18 列索引为'姓名'至‘城市’,所有行
      • 4.19 语文成绩大于80的行
      • 4.20 语文成绩大于80的人的姓名和城市
      • 4.21 输出'赵四'和'周七'的各科成绩
      • 4.22 iloc选取第2行
      • 4.23 iloc选取前3行
      • 4.24 选取第2行、第4行、第6行
      • 4.25 选取第2列
      • 4.26 选取前3列
      • 4.27 选取第3行的第3列
      • 4.28 选取第1列、第3列和第4列
      • 4.29 选取第2行的第1列、第3列、第4列
      • 4.30 选取前3行的前3列
    • 推荐阅读

    大家好,我是 👉【Python当打之年(点击跳转)】

    本期为大家带来 《 Pandas常用操作命令》 的 第四篇 ,主要介绍在数据处理可视化过程中经常用到的一些指令,本系列在后期会不断进行补充更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。


    🏳️‍🌈 4. 数据切片、筛选

    示例数据:
    在这里插入图片描述

    4.1 输出城市为上海的行

    df[df['城市']=='上海']
    
    • 1

    在这里插入图片描述

    4.2 输出城市为上海或广州的行

    df[df['城市'].isin(['上海','广州'])]
    
    • 1

    在这里插入图片描述

    4.3 输出城市名称中含有‘海’字的行

    df[df['城市'].str.contains("海", na=False)]
    
    • 1

    在这里插入图片描述

    4.4 输出城市名称以‘海’字开头的行

    df[df['城市'].str.startswith("海", na=False)]
    
    • 1

    在这里插入图片描述

    4.5 输出城市名称以‘海’字结尾的行

    df[df['城市'].str.endswith("海", na=False)]
    
    • 1

    在这里插入图片描述

    4.6 输出所有姓名,缺失值用Null填充

    df['姓名'].str.cat(sep='、',na_rep='Null')
    
    • 1

    ‘001-张三、002-李四、003-赵四、004-王五、005-陈六、006-孙五、007-周七、Null、009-王二、010-刘八、011-郑九、012-赵十、013-郭一’

    4.7 重置索引

    df2 = df1.set_index('学号')
    df2
    
    • 1
    • 2

    在这里插入图片描述

    4.8 前两行

    df2[:2]
    
    • 1

    在这里插入图片描述

    4.9 后两行

    df2[-2:]
    
    • 1

    在这里插入图片描述

    4.10 2-8行

    df2[2:8]
    
    • 1

    在这里插入图片描述

    4.11 每隔3行读取

    df2[::3]
    
    • 1

    在这里插入图片描述

    4.12 2-8行,步长为2,即第2/4/6行

    df2[2:8:2]
    
    • 1

    在这里插入图片描述

    4.13 选取’语文’,‘数学’,'英语’列

    df2[['语文','数学','英语']]
    
    • 1

    在这里插入图片描述

    4.14 学号为’001’的行,所有列

    df.loc只能使用标签索引,不能使用整数索引,通过便签索引切边进行筛选时,前闭后闭.

    df2.loc['001', :]
    
    • 1

    在这里插入图片描述

    4.15 学号为’001’或’003’的行,所有列

    df2.loc[['001','003'], :]
    
    • 1

    在这里插入图片描述

    4.16 学号为’001’至’009’的行,所有列

    df2.loc['001':'009', :]
    
    • 1

    在这里插入图片描述

    4.17 列索引为’姓名’,所有行

    df2.loc[:, '姓名']
    
    • 1

    在这里插入图片描述

    4.18 列索引为’姓名’至‘城市’,所有行

    df2.loc[:, '姓名':'城市']
    
    • 1

    在这里插入图片描述

    4.19 语文成绩大于80的行

    # 方法一
    df2.loc[df2['语文']>80,:]
    
    # 方法二
    df2.loc[df2.loc[:,'语文']>80, :]
    
    # 方法三
    df2.loc[lambda df2:df2['语文'] > 80, :]
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述

    4.20 语文成绩大于80的人的姓名和城市

    df2.loc[df2['语文']>80,['姓名','城市']]
    
    • 1

    在这里插入图片描述

    4.21 输出’赵四’和’周七’的各科成绩

    df2.loc[df2['姓名'].isin(['赵四','周七']),['姓名','语文','数学','英语']]
    
    • 1

    在这里插入图片描述

    df.iloc[]只能使用整数索引,不能使用标签索引,通过整数索引切边进行筛选时,前闭后开

    4.22 iloc选取第2行

    df2.iloc[1, :]
    
    • 1

    在这里插入图片描述

    4.23 iloc选取前3行

    df2.iloc[:3, :]
    
    • 1

    在这里插入图片描述

    4.24 选取第2行、第4行、第6行

    df2.iloc[[1,3,5],:]
    
    • 1

    在这里插入图片描述

    4.25 选取第2列

    df2.iloc[:, 1]
    
    • 1

    在这里插入图片描述

    4.26 选取前3列

    df2.iloc[:, :3]
    
    • 1

    在这里插入图片描述

    4.27 选取第3行的第3列

    df2.iloc[3, 3]
    
    • 1

    4.28 选取第1列、第3列和第4列

    df2.iloc[:, [0,2,3]]
    
    • 1

    在这里插入图片描述

    4.29 选取第2行的第1列、第3列、第4列

    df2.iloc[1, [0,2,3]]
    
    • 1

    在这里插入图片描述

    4.30 选取前3行的前3列

    df2.iloc[:3, :3]
    
    • 1

    在这里插入图片描述

    未完待续。。。


    文章首发:微信公众号 “Python当打之年” ,Python编程技巧推送,希望大家可以喜欢。

    以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。

    推荐阅读

    • 👨‍🎓 【Pandas+Pyecharts | 山东省高考考生数据分析可视化】
    • 🚗 【Pandas+Pyecharts | 40000+汽车之家数据分析可视化】
    • 🛒 【Pandas+Pyecharts | 20000+天猫订单数据可视化】
    • 🏠 【Pandas+Pyecharts | 广州市已成交房源信息数据可视化】
    • 🏫 【Pandas+Pyecharts | 考研信息数据可视化】
    • 💸 【Pandas+Pyecharts | 某平台招聘信息数据可视化】
    • 🏥 【Pandas+Pyecharts | 医院药品销售数据可视化】
    • 💰️ 【Pyecharts | 比特币每日价格动态可视化】
    • 🥮 【可视化 | Python中秋月饼销量分析,这些口味才是yyds!】
    • 🎦 【Pyecharts | 《白蛇2:青蛇劫起》20000+数据分析可视化】
    • 💑 【Pyecharts | 历年全国各地民政局登记数据分析+可视化】
    • 🌏 【Pandas+Pyecharts | 全国热门旅游景点数据分析+可视化】
    • 🏆 【Pandas+Pyecharts | 2020东京奥运会奖牌数据可视化】
    • 🏹 【Pandas常用基础操作指令汇总 】
    • 🎯 【pandas + pyecharts | ADX游戏广告投放渠道综合分析】
    • 🕔 【Schedule + Pyecharts | 时间序列图(动态轮播图)】
    • 🏠 【Pandas+Pyecharts | 北京某平台二手房数据分析+可视化】
    • 🏫 【Pandas+Pyecharts | 2021中国大学综合排名分析+可视化】
    • 🎦 【爬虫 | Python爬取豆瓣电影Top250 + 数据可视化】
    • 📡 【技巧 | Python创建自己的高匿代理IP池】

  • 相关阅读:
    《研发效能(DevOps)工程师》课程简介(三)丨IDCF
    PyQt5可视化编程-图形界面开发工具QtDesigner和PyUIC
    Minikube Mac安装使用
    【On Nacos】SpringCloud 方式使用 Nacos
    【解刊】IEEE(Trans)系列,CCF-A类顶刊,国人友好,无需版面费!
    uniapp map polygons 区域填充色(fillColor)在ios显示正常,但在安卓手机显示是黑色的,怎么解决?
    C++ 语法基础课 习题4 —— 数组
    中职 网络搭建与应用 DCN无线常用配置
    次方计数的拆贡献法(考虑组合意义)+限定类问题善用值域与位置进行ds:1006T3
    CSS3新增特性(一)
  • 原文地址:https://blog.csdn.net/weixin_42152811/article/details/125423190
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号