• 18.Pandas的数据转换函数map、apply、applymap


    简介

    1.map:只用于Series,实现每个值-》值的映射
    2.apply:用于Series实现每个值的处理,用于DataFrame实现某个轴的Series的处理
    3.applymap:只能用于DataFrame,用于处理该DataFrame的每个元素

    1.map用于Series值的转换

    实例:将股票代码英文转换成中文名字
    Series.map(dict) or Series.map(function) 均可
    在这里插入图片描述

    import pandas as pd
    stocks = pd.read_excel("../data/gs.xlsx")
    # print(stocks.head())
    print(stocks['公司'].unique())
    # ['BAIDU' 'BABA']
    
    • 1
    • 2
    • 3
    • 4
    • 5
    # 公司股票代码到中文的映射,注意这里的是小写
    dict_company_name = {
        "baidu": '百度',
        'baba': '阿里巴巴',
        'iq': '爱奇艺',
        'jd': '京东'
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    # 方法1 Series.map(dict)
    stocks['中文公司1'] = stocks['公司'].str.lower().map(dict_company_name)
    print(stocks.head())
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    # 方法2, 使用Series.map(function)
    # function参数是Series每个元素的值
    stocks['中文公司2'] = stocks['公司'].map(lambda x: dict_company_name[x.lower()])
    
    • 1
    • 2
    • 3

    2.apply用于Series和dataFrame转换

    1. Series.apply(function),函数的参数是每个值
    2. DataFrame.apply(function),函数的参数是Series

    Series.apply(function)

    函数的参数是Series的每个值

    stocks['中文公司3'] = stocks['公司'].apply(lambda x: dict_company_name[x.lower()])
    print(stocks.head())
    
    • 1
    • 2

    DataFrame.apply(function)

    函数的参数是对称轴的Series

    stocks['中文公司4'] = stocks.apply(lambda x: dict_company_name[x['公司'].lower()], axis=1)
    print(stocks.head())
    
    • 1
    • 2

    注意:

    1. apply在stocks这个DataFrame上调用
    2. lambda x的x是一个Series,因为制定了axis=1,所以Series的key是列名,可以用x[‘公司’]获取
      在这里插入图片描述

    3.applymap用于DataFrame所有值的转换

    sub_df = stocks[['收盘', '开盘', '高', '低', '交易量']]
    # 将这些数字取整,应用于所有元素
    sub_df.applymap(lambda x: int(x))
    # 直接修改源df的这几列
    stocks.loc[:, ['收盘', '开盘', '高', '低', '交易量']] = sub_df.applymap(lambda x: int(x))
    print(stocks.head())
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述

  • 相关阅读:
    Flutter中实现交互式Webview的方法
    aarch64 arm64 部署 stable diffusion webui 笔记 【3】
    0907进程
    第四次线上面试总结(2022.9.15 三面)
    【JavaSE】抽象类与接口(上篇)
    Maven 换源 & Mybatis 开启 Log4j 日志框架
    sparksql明明插入了但是表里数据是null
    流式数据湖平台Hudi核心概念三:索引
    如何安装Jmeter监控服务器资源插件(JMeterPlugins + ServerAgent 方法二)?
    接口自动化测试分层设计与实践总结01
  • 原文地址:https://blog.csdn.net/technologist_28/article/details/126357937