• Python每日一练(牛客数据分析篇新题库)——第34天:数据清洗


    1. 牛客网不同语言使用人数

    描述: 现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
    Nowcoder_ID:用户ID
    Level:等级
    Achievement_value:成就值
    Num_of_exercise:刷题量
    Graduate_year:毕业年份
    Language:常用语言
    刚刚发现牛客网想要学习编程的小白,不知道优先学习什么语言,刷什么题单,你能帮助他从这个csv文件中找到牛客网各种语言使用的用户分别有多少吗?

    在这里插入图片描述

    实现代码:

    import pandas as pd
     
    Nowcoder = pd.read_csv('Nowcoder.csv', sep=',')
     
    print(Nowcoder['Language'].value_counts())
    
    • 1
    • 2
    • 3
    • 4
    • 5

    运行结果:

    在这里插入图片描述



    2. 牛客网用户最近的最长与最短连续签到天数

    描述: 现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
    Nowcoder_ID:用户ID
    Level:等级
    Achievement_value:成就值
    Num_of_exercise:刷题量
    Graduate_year:毕业年份
    Language:常用语言
    Continuous_check_in_days:最近连续签到天数
    Number_of_submissions:提交题目数量
    Last_submission_time:最后一次提交题目日期
    运营同学想要统计牛客网的用户的最近的连续签到情况,他想知道最长的用户已经连续签到了多久,最短的用户又连续签到了多久,请帮他输出一下。

    在这里插入图片描述

    实现代码:

    import pandas as pd
     
    Nowcoder = pd.read_csv('Nowcoder.csv', sep=',')
     
    # 最长
    day_max = Nowcoder['Continuous_check_in_days'].max()
    # 最短
    day_min = Nowcoder['Continuous_check_in_days'].min()
     
    print(day_max, '\n', day_min)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    运行结果:
    在这里插入图片描述



    3. Python用户的平均提交次数

    描述: 现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
    Nowcoder_ID:用户ID
    Level:等级
    Achievement_value:成就值
    Num_of_exercise:刷题量
    Graduate_year:毕业年份
    Language:常用语言
    Continuous_check_in_days:最近连续签到天数
    Number_of_submissions:提交代码次数
    Last_submission_time:最后一次提交题目日期
    打算学习Python的小白同学打开了牛客网,他想知道Python到底难不难,于是他想从牛客网Python用户都平均提交了多少次代码来认识,请你帮他找一找。

    在这里插入图片描述

    实现代码:

    import pandas as pd
     
    Nowcoder = pd.read_csv('Nowcoder.csv', sep=',')
     
    print((Nowcoder.query("Language == 'Python'")['Number_of_submissions'].mean().round(1)))
    
    • 1
    • 2
    • 3
    • 4
    • 5

    运行结果:

    在这里插入图片描述



    4. 牛客网用户等级的中位数

    描述: 现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
    Nowcoder_ID:用户ID
    Level:等级
    Achievement_value:成就值
    Num_of_exercise:刷题量
    Graduate_year:毕业年份
    Language:常用语言
    Continuous_check_in_days:最近连续签到天数
    Number_of_submissions:提交代码次数
    Last_submission_time:最后一次提交题目日期
    牛客网运营同学有一个活动,需要统计所有用户等级的中位数,但是为了去掉一些非常不活跃的账号,于是他们只统计刷题数量不低于10题的那部分用户。

    在这里插入图片描述

    实现代码:

    import pandas as pd
     
    Nowcoder = pd.read_csv('Nowcoder.csv', sep=',')
    Nowcoder_1 = Nowcoder.loc[Nowcoder['Num_of_exercise'] >= 10,:]
    Level_M = int(Nowcoder_1.Level.median())
    print(Level_M)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    运行结果:

    在这里插入图片描述


    《100天精通Python》专栏推荐白嫖80g Python全栈视频

    《100天精通Python从入门到就业》:本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html

    • 优点订阅限时9.9付费专栏进入千人全栈VIP答疑群,作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会)!
    • 专栏福利简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等
      在这里插入图片描述
      在这里插入图片描述
  • 相关阅读:
    Python毕业设计选题推荐
    【SpringMVC】提问问题汇总
    最新5G部署测试测量解决方案
    Unreal Engine虚幻游戏引擎素材资源汇总目录
    工程中局部计时与全局计时的方法
    3年测试经验,去面试连25K都拿不到了吗?现在测试这么坑?
    如何编辑图片合成图片?让我们来看看这些合成方法
    十个经典java开发项目及其描述-马上写到你的简历中去吧,祝你升职加薪
    【STM32 IIC通信与温湿度传感器AHT20(I2C_AHT20)】
    SSM+停车管理系统 毕业设计-附源码171046
  • 原文地址:https://blog.csdn.net/yuan2019035055/article/details/126850450