码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Pandas | value_counts() 的详细用法


    value_counts() 函数得作用

    用来统计数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据指定得参数返回排序后结果。
    返回得是Series对象

    value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)
    
    • 1
    • sort=True: 是否要进行排序;默认进行排序
    • ascending=False: 默认降序排列;
    • normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。
    • bins=None: 可以自定义分组区间,默认是否
    • dropna=True:是否删除缺失值nan,默认删除

    数据集
    在这里插入图片描述
    要求:统计不同lable出现得次数

    任何参数都不带

    train_df['label'].value_counts() 
    
    • 1

    默认统计个数并降序返回
    在这里插入图片描述

    • ascending=True
      在这里插入图片描述
    • normalize=True
      数据标准化:在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。
      数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
    train_df['label'].value_counts(ascending=False,normalize=True) 
    
    • 1

    数据标准化以后,所有得项得和为1(可能因为计算机存储数据而有误差)
    常用来计算各数据占的比例
    在这里插入图片描述

    • bins分组统计
      对于数值型的可以进行分组,分组以后返回结果
      在这里插入图片描述

    几种使用方式

    • 先取出列(Series对象),然后调用函数这时候相当于
    train_df['label'].value_counts() 
    
    • 1
    • DataFrame
      对每一列都进行统计
    train_df.apply(pd.value_counts)  
    
    • 1
    • 直接使用Pandas调用
    pd.value_counts(train_df['label'],ascending=True)
    
    • 1

    同样的统计还可以使用 groupby,这个的过程是先按‘label’分组然后再统计每组的值,这样的效率较低,不建议使用

    train_df.groupby('label').count()
    
    • 1
  • 相关阅读:
    叮咚!请互联网人签收这份工作技能攻略
    小程序的宿主环境、组件、API、协同工作和发布
    奇迹MU架设常见问题解决
    Open3D(C++) 点到平面的ICP算法实现点云精配准
    今天刚下jdk11和netbeans12,在打开github的一个文件的时候没有任何反应,我看别人是可以打开的
    数据安全常用术语表 V0.1 附下载地址
    iceoryx源码阅读(三)——共享内存通信(一)
    超市结算系统|Springboot+Vue通用超市结算收银系统
    (附源码)计算机毕业设计SSM基于的英语学习网站的设计与实现
    如何在报表开发工具 FastReport Online Designer 中处理报表的 5 个函数
  • 原文地址:https://blog.csdn.net/qq_52007481/article/details/126507920
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号