python pandas中的agg函数用法
作者:python小工具 发布时间:2023-07-20 09:40:08
标签:python,pandas,agg
pandas中的agg函数
python中的agg函数通常用于调用groupby()函数之后,对数据做一些聚合操作,包括sum,min,max以及其他一些聚合函数
如下所示:
>>> df = pd.read_excel(r"D:/myExcel/1.xlsx")
>>> df
A B C
0 bob 12 45
1 millor 15 23
2 bob 34 88
3 bob 98 23
(1)获取按A分组后B列的最大值
>>> df.groupby(by='A').agg({'B':'max'})
B
A
bob 98
millor 15
(2)获取按A分组后B列的最大值和最小值
>>> df.groupby(by='A').agg({'B':['max','min']})
B
max min
A
bob 98 12
millor 15 15
(3)获取按A分组后B列的最大值和最小值以及C列的最大值
>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'})
B C
max min min
A
bob 98 12 23
millor 15 15 23
(4)默认是以函数名称命名的,可以修改
>>> df.groupby(by='A').agg(
b_min=pd.NamedAgg(column='B', aggfunc='min'),
b_max=pd.NamedAgg(column='B', aggfunc='max'))
b_min b_max
A
bob 12 98
millor 15 15
通常在调用完agg函数后需要reset_index,因为pandas会默认将groupby()的列也做为index传到结果中
>>> df.groupby('A').B.agg(['min', 'max'])
min max
A
bob 12 98
millor 15 15
>>> df.groupby('A').B.agg(['min', 'max']).reset_index()
A min max
0 bob 12 98
1 millor 15 15
这就是python小工具关于agg函数的介绍,挺有用 的一个函数。
pandas详解 聚合运算agg()
在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()很方便进行聚合操作。
1. 创建DataFrame对象
import pandas as pd
df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})
grouped = df1.groupby(['sex','smoker'])
# sex有 F M 二值,smoker有 Y N 二值,故分成四组。
2. 单列聚合
grouped['age'].agg('mean')
sex smoker
F N 30.0
Y 28.0
M N 40.0
Y 17.5
Name: age, dtype: float64
3. 多列聚合
grouped.agg('mean')
4. 多种聚合运算
grouped['age'].agg(['min','max'])
5. 多种聚合运算并更改列名
grouped['age'].agg([('A','mean'),('B','max')])
6. 不同的列运用不同的聚合函数
grouped.agg({'age':['sum','mean'], 'weight':['min','max']})
7. 使用自定义的聚合函数
def Max_cut_Min(group):
return group.max()-group.min()
grouped.agg(Max_cut_Min)
8. 方便的descibe
grouped.describe()
来源:https://blog.csdn.net/weixin_45144170/article/details/105008350


猜你喜欢
- 简介imgaug:机器学习实验中的图像增强库,特别是卷积神经网络。支持以多种不同方式增强图像、关键点/地标、边界框、热图和分割图。安装在an
- PHP观察者模式(Observer Pattern)观察者模式是一种行为设计模式,它定义了一种订阅机制,让一个或多个对象(观察者)自动被通知
- 通过valuelist的queryMap传递过来的参数默认都为string类型,在valuelist配置文件的hql中,如果直接将该值赋给整
- 模块的相关概念 1. 什么是模块模块就好比是工具包,要想使用这个工具包中的工具(就好比函数),就需要导入这个模块模块的英文名叫:
- wxPython是Python语言的一套优秀的GUI图形库。允许Python程序员很方便的创建完整的、功能键全的GUI用户界面。wxPyth
- 本文研究的主要是Django开发中的signal 的相关内容,具体如下。前言在web开发中, 你可能会遇到下面这种场景:在用户完成某个操作后
- 刚在网上查了一圈,好家伙,全都是那一篇文章,而且用的pycharm是老版本的,下边介绍的是pycharm2019专业版的,直接切入正题:(1
- 基本设置class Map3D( # 初始化配置项,参考 `global_options.InitOpts` &n
- 引言“ 这是MySQL系列笔记的第七篇,文章内容均为本人通过实践及查阅资料相关整理所得,可用作新手入门指南,或
- 生命游戏的算法就不多解释了,百度一下介绍随处可见。因为网上大多数版本都是基于pygame,matlab等外部库实现的,二维数组大多是用num
- 一、推荐方法 CURL获取<?php$c = curl_init();$url = 'www.jb51.net';cu
- 1、Matplotlib 简介Matplotlib 简介:Matplotlib 是一个python的 2D绘图库,它以各种硬拷贝格式和跨平台
- 阅读上一篇:微软建议的ASP性能优化28条守则(4)技巧 13:避免重新确定数组的维数 应尽量避免 Redim 数组。就性能而言,如果计算机
- 我就废话不多说了,大家还是直接看代码吧~func main() { var a chan string a =mak
- Mutex的4种易错使用场景1.Lock/Unlock 不成对出现Lock/Unlock 没有成对出现,就可能会出现死锁或者是因为Unloc
- 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。以下文章来源于数据STUDIO,作者龙哥
- 对Python字符串,除了比较老旧的%,以及用来替换掉%的format,及在python 3.6中加入的f这三种格式化方法以外,还有可以使用
- 先来看javascript的直接写在了input上 <input name="pwuser" type="
- 1.OUPUT参数返回值CREATE PROCEDURE [dbo].[nb_order_insert](@o_buyerid int ,@
- 动态规划(Dynamic Programming,DP)是一种常用的算法思想,通常用于解决具有重叠子问题和最优子结构性质的问题。动态规划算法