码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【pandas小技巧】--修改列的名称


    重命名 pandas 数据中列的名称是一种常见的数据预处理任务。
    这通常是因为原始数据中的列名称可能不够清晰或准确。例如,列名可能包含空格、大写字母、特殊字符或拼写错误。

    使用 pandas 的 rename函数可以帮助我们更改列名,从而使数据更加清晰和易于理解。
    此外,重命名列名还可以确保您的代码在维护和共享时更加易于交流和重用。

    1. 列名中的特殊字符

    比如如下测试数据:

    import pandas as pd
    
    df = pd.DataFrame(
        {
            "col name": ["name1", "name2", "name3"],
            "#num@$": [1, 1, 2],
            "坐标A": [1.2, 1.3, 2.3],
            "坐标B": [2.3, 3.3, 5.7],
        },
    )
    df
    

    image.png

    1.1. rename函数

    使用rename函数消除列名中的空格和特殊符号:

    df.rename({"col name": "col_name", "#num@$": "num"}, axis=1)
    

    image.png
    需要修改的列名不多时,用这种方式比较直观。

    1.2. columns属性

    使用columns修改列名时,需要设置所有的列名,哪怕不需要修改的列名也要列出来。

    df.columns = ["col_name", "num", "坐标A", "坐标B"]
    df
    

    image.png
    当需要修改的列名比较多,或者所有列名都需要修改时,用这种方式。

    1.3. replace方法

    df.columns = df.columns.str.replace(" ", "_")
    df.columns = df.columns.str.replace("[#@$]", "", regex=True)
    df
    

    image.png
    这种方式还支持通过正则表达式的方式替换,适合复杂替换的场景。
    使用正则替换时,设置参数:regex=True

    2. 列名的前缀

    当遇到来自不同系统的同类数据时,合并之后会发现很多同样的列名,难以区分。
    比如:

    df1 = pd.DataFrame(
        {
            "坐标X": [1.2, 1.3, 2.3],
            "坐标Y": [2.3, 3.3, 5.7],
        },
    )
    df2 = pd.DataFrame(
        {
            "坐标X": [2.2, 3.3, 7.3],
            "坐标Y": [1.3, 4.3, 3.7],
        },
    )
    
    df = pd.concat([df1, df2], axis=1)
    df
    

    image.png

    这时,我们可以在合并前给不同数据来源的数据的列名上加一个前缀(add_prefix)。

    df1 = df1.add_prefix("A_")
    df2 = df2.add_prefix("B_")
    
    df = pd.concat([df1, df2], axis=1)
    df
    

    image.png

    3. 列名的后缀

    除了添加前缀,也可以用添加后缀的方式(add_suffix)来区分不同数据源的数据。

    df1 = df1.add_suffix("_A")
    df2 = df2.add_suffix("_B")
    
    df = pd.concat([df1, df2], axis=1)
    df
    

    image.png

  • 相关阅读:
    两小时带你进入软件测试行业风口(附全套软件测试学习路线)
    商品分类,手机云进销存ERP门店零售批发仓库开单APP软件,文具五金服装鞋帽酒店烟酒饰品批发条码管理
    敲几年代码了,还讲不清楚设计模式的七大原则?
    Jupyter、Numpy、Pandas(1)
    【光流估计】——gmflow中self attention,cross attention的比较
    【毕业设计】天气数据分析系统 - python 大数据
    【SpringSecurity】九、Base64与JWT
    web前端课程设计 HTML+CSS+JavaScript旅游风景云南城市网页设计与实现 web前端课程设计代码 web课程设计 HTML网页制作代码
    2022CTF培训(三)windows&linux&安卓平台调试机制原理
    90%测试人不知道的快速入门秘籍——接口自动化神器 apin(一)
  • 原文地址:https://www.cnblogs.com/wang_yb/p/17593674.html
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号