• 【python数据分析刷题】-N07.合并



    活动地址:CSDN21天学习挑战赛

    在这里插入图片描述

    📢📢📢📣📣📣
    哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10年DBA工作经验
    一位上进心十足的【大数据领域博主】!😜😜😜
    中国DBA联盟(ACDU)成员,目前从事DBA及程序编程
    擅长主流数据Oracle、MySQL、PG 运维开发,备份恢复,安装迁移,性能优化、故障应急处理等。
    ✨ 如果有对【数据库】感兴趣的【小可爱】,欢迎关注【IT邦德】💞💞💞
    ❤️❤️❤️感谢各位大可爱小可爱!❤️❤️❤️

    前言

    Python实际针对数据分析的学习是库,用库来解决一系列的数据分析问题

    🐴 DA37 统计运动会项目报名人数

    🚀 描述

    某公司计划举办一场运动会,现有运动会项目数据集items.csv。 包含以下字段:
    
    item_id:项目编号;
    item_name:项目名称;
    location:比赛场地。
    有员工报名情况数据集signup.csv。包含以下字段:
    
    employee_id:员工编号;
    name:员工姓名;
    sex:性别;
    department:所属部门;
    item_id:报名项目id
    请你统计各类型项目的报名人数。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    📖 输入描述

    数据集可以从当前目录下items.csv、signup.csv读取。
    items.csv
    在这里插入图片描述
    signup.csv
    在这里插入图片描述
    📖 输出描述:
    只输出报名人数不为0的项目及其对应的报名人数。以上数据集的输出如下:

    在这里插入图片描述
    🍌🍌 答案

    import pandas as pd
    signup = pd.read_csv('signup.csv')
    items = pd.read_csv('items.csv')
    
    new=pd.merge(items,signup, on='item_id')
    print(new.groupby('item_name').employee_id.count())
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述

    🐴 DA38 统计运动会项目报名人数(二)

    🚀 描述

    某公司计划举办一场运动会,现有运动会项目数据集items.csv。 包含以下字段:
    
    item_id:项目编号;
    item_name:项目名称;
    location:比赛场地。
    有员工报名情况数据集signup.csv。包含以下字段:
    
    employee_id:员工编号;
    name:员工姓名;
    sex:性别;
    department:所属部门;
    item_id:报名项目id
    请你统计各类型项目的报名人数。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    📖 输入描述

    数据集可以从当前目录下items.csv、signup.csv读取。
    items.csv
    在这里插入图片描述
    signup.csv
    在这里插入图片描述
    📖 输出描述:

    输出items.csv中所有项目的报名人数(没有人报名的项目的报名人数输出为0即可)。
    以上数据集的输出如下:

    在这里插入图片描述
    🍌🍌 答案

    import pandas as pd
    signup = pd.read_csv('signup.csv')
    items = pd.read_csv('items.csv')
    
    a=pd.merge(items,signup,on='item_id',how='left')
    print(a.groupby('item_name')['employee_id'].count())
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述

    🐴 DA39 多报名表的运动项目人数统计

    🚀 描述

    某公司计划举办一场运动会,现有部分运动会项目数据集items.csv。 包含以下字段:
    
    item_id:项目编号;
    item_name:项目名称;
    location:比赛场地。
    有员工报名情况数据集signup.csv。包含以下字段:
    
    employee_id:员工编号;
    name:员工姓名;
    sex:性别;
    department:所属部门;
    item_id:报名项目id。
    另有signup1.csv,是education部门的报名情况,包含字段同signup.csv。
    
    请你将signup.csv与signup1.csv的数据集合并后,统计各类型项目的报名人数。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    📖 输入描述

    数据集可以从当前目录下items.csv、signup.csv、signup1.csv读取。
    items.csv
    在这里插入图片描述
    signup.csv
    在这里插入图片描述
    signup1.csv
    在这里插入图片描述
    📖 输出描述:
    只输出报名人数不为0的项目及其对应的报名人数。
    以上数据集的输出如下:

    在这里插入图片描述

    🍌🍌 答案

    import pandas as pd
    signup = pd.read_csv('signup.csv')
    signup1 = pd.read_csv('signup1.csv')
    items = pd.read_csv('items.csv')
    
    signup2=pd.concat([signup,signup1],axis=0)
    result1=pd.merge(items,signup2,how='inner',on='item_id')
    result=result1.groupby('item_name')
    print(result.size())
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    在这里插入图片描述

    🐴 DA40 统计职能部分运动会某项目的报名信息

    🚀 描述

    某公司计划举办一场运动会,现有运动会项目数据集items.csv。 包含以下字段:
    
    item_id:项目编号;
    item_name:项目名称;
    location:比赛场地。
    有员工报名情况数据集signup.csv。包含以下字段:
    
    employee_id:员工编号;
    name:员工姓名;
    sex:性别;
    department:所属部门;
    item_id:报名项目id
    请你统计职能部门(functional)中报名标枪(javenlin)的所有员工的员工编号(employee_id)、姓名(name)及性别(sex)。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    📖 输入描述

    数据集可以从当前目录下items.csv、signup.csv读取。
    items.csv
    在这里插入图片描述
    signup.csv
    在这里插入图片描述
    📖 输出描述:
    输出职能部门(functional)中报名标枪(javenlin)的所有员工的员工编号(employee_id)、姓名(name)及性别(sex)。
    以上数据集的输出如下(注意:结果中行标签从0开始顺序排序):

    在这里插入图片描述
    🍌🍌 答案

    import pandas as pd
    signup = pd.read_csv('signup.csv')
    items = pd.read_csv('items.csv')
    
    df = pd.merge(signup,items,on="item_id")
    df1 = df[(df["department"] == "functional") & (df["item_name"] == "javelin")]
    df2 = df1[["employee_id","name","sex"]]
    print(df2)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述

    在这里插入图片描述

  • 相关阅读:
    HTML介绍及第一次编写网页
    小猴吃苹果-第12届蓝桥杯Scratch选拔赛真题精选
    CSDN: ABTest流量分层分桶机制
    DAPP开发(一)——web3.0和智能合约
    八大时态-英语中的八个基本时态
    MySQL8.0爬坑二三事
    什么是窃听攻击、XSS攻击、CSRF攻击?
    SwiftUI Swift iOS iPadOS 实现更改 App 图标
    时态图根据时间轴动态播放热力图
    全国双非院校考研信息汇总整理 Part.6
  • 原文地址:https://blog.csdn.net/weixin_41645135/article/details/126353550