关于Pandas count()与values_count()的用法及区别
作者:Elvirangel 发布时间:2021-09-25 08:28:20
Pandas count()与values_count()用法
count()
values_count()在指定的统计的列名上
结果多了该列:
对比:
对比:
Pandas:count()与value_counts()对比
1. Series.value_counts(self, normalize=False, sort=True, ascending=False, bins=None, dropna=True)
返回一个包含所有值及其数量的 Series。 且为降序输出,即数量最多的第一行输出。
参数含义如下:
Parameters: | normalize : boolean, default False If True then the object returned will contain the relative frequencies of the unique values. sort : boolean, default True Sort by frequencies. ascending : boolean, default False Sort in ascending order. bins : integer, optional Rather than count values, group them into half-open bins, a convenience for pd.cut, only works with numeric data. dropna : boolean, default True Don’t include counts of NaN. |
---|---|
Returns: | Series |
举例如下:
import pandas as pd
index = pd.Index([3, 1, 2, 3, 4, np.nan])
index.value_counts()
"""
输出为:
3.0 2
4.0 1
2.0 1
1.0 1
dtype: int64
"""
如果 normalize 为 True的话,统计的结果会相加 = 1:
import pandas as pd
s = pd.Series([3, 1, 2, 3, 4, np.nan])
s.value_counts(normalize=True)
"""
输出为:
3.0 0.4
4.0 0.2
2.0 0.2
1.0 0.2
dtype: float64
"""
2. Series.count(self, level=None)
返回非空值的数量。若是在 CSV 文件中可用来统计行数,如:
import pandas as pd
file = pd.read_csv('test.csv')
print(file['A'].count())
# 此时输出的即是 A 列的行数
参数含义如下:
Parameters: | level : int or level name, default None If the axis is a MultiIndex (hierarchical), count along a particular level, collapsing into a smaller Series. |
---|---|
Returns: | int or Series (if level specified) Number of non-null values in the Series. |
举例如下:
import pands as pd
s = pd.Series([0.0, 1.0, np.nan])
s.count()
# 此时输出为 2
这就是两者的区别和各自的用途。
来源:https://blog.csdn.net/Elvirangel/article/details/104556394


猜你喜欢
- 简单的‘Hello World!'Python命令行假设你已经安装好了Python, 那么在Linux命令行输入:$python将直
- 本文实例为大家分享了python实现端口扫描的具体代码,供大家参考,具体内容如下今天老师上课说的内容,使用多线程+socket写一个端口扫描
- 近期做那个python的开发,今天就来简单的写一下Django安装配置mysql的方法步骤安装mysql首先安装pymysqlpip ins
- 1,目标环境Windows 7 64位2,材料(1)VC++2010 发布包(64位)(2)MySQL 5.6.36 Windows x64
- 前言在做项目的时候一些配置文件都会写在settings配置文件中,今天在研究"州的先生"开源文档写作系统-MrDoc的时
- TensorFlow修改变量值后,需要重新赋值,assign用起来有点小技巧,就是需要需要弄个操作子,运行一下。下面这么用是不行的impor
- 关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系,最早是为了发现超
- python 使用get_argument获取url query参数ornado的每个请求处理程序,我们叫做handler,handler里
- 本人曾经用过的备份方式有:mysqldump、mysqlhotcopy、BACKUP TABLE 、SELECT INTO OUTFILE,
- 在 Python 中也可以像 gcc/gdb 那样调试程序,只要在运行 Python 程序时引入 pdb 模块(假设要调试的程序名为 d.p
- 本文实例讲述了PHP对象克隆clone用法。分享给大家供大家参考,具体如下:浅克隆:只是克隆对象中的非对象非资源数据,即对象中属性存储的是对
- 本文介绍用python实现的搜索本地文本文件内容的小程序。从而学习Python I/O方面的知识。代码如下:import os#根据文件扩展
- 在传统的递归中,典型的模式是,你执行第一个递归调用,然后接着调用下一个递归来计算结果。这种方式中途你是得不到计算结果,知道所有的递归调用都返
- 要写出一个五子棋游戏,我们最先要解决的,就是如何下子,如何判断已经五子连珠,而不是如何绘制画面,因此我们先确定棋盘五子棋采用15*15的棋盘
- 一、图示上面为pdf截图内容,下面为转化后的word截图内容接下来,我们试试自己动作写这个工具吧!二、前期准备由于我们采用的是python进
- 代码如下所示:$num = 10.4567; //第一种:利用round()对浮点数进行四舍五入 &n
- 每次安装总是有些不同,这次用这种方式尝试一下,也记录一下。1、首先需要去下载rpm包:镜像地址:http://mysql.mirrors.p
- 为何选Nuxt.js?在前后端分离出现之前,传统的web页面都是服务端渲染的,如JSP、PHP、Python Django,还有各种模板技术
- Redo LogREDO LOG称为重做日志 ,当MySQL服务器意外崩溃或者宕机后,保证已经提交的事务持久化到磁盘中(持久性)。InnoD
- 表复制: 1. INSERT INTO SELECT语句 语句形式为:Insert into Table2(field1,field2,..