位置：首页>> 网络编程>> Python编程>> pandas 实现分组后取第N行

pandas 实现分组后取第N行

作者：NoOne-csdn　　发布时间：2023-02-09 11:11:40　

标签：pandas,分组,N行

目的：

把question_id 对应的user_answer转成ABCD

solution

dfa=df.groupby('question_id').nth(0).reset_index()
dfa['flag']='A'
dfb=df.groupby('question_id').nth(1).reset_index()
dfb['flag']='B'
dfc=df.groupby('question_id').nth(2).reset_index()
dfc['flag']='C'
dfd=df.groupby('question_id').nth(3).reset_index()
dfd['flag']='D'

resdf=dfa.append([dfb,dfc,dfd])
resdf.sort_values(by='question_id')

result：

focus：

g.nth(0)
#同
g.first()
g.head(1)
g.last()

g.nth(2)
g.nth(-1)

g.nth(0,dropna='any')
g.B.nth(0,dropna='all')
g.groups
g.get_group(134429)
g.discribe()
g.agg([np.mean,np.sum.np,std])

补充：pandas的分组取最大多行并求和函数nlargest()

在pandas库里面，我们常常关心的是最大的前几个，比如销售最好的几个产品，几个店，等。之前讲到的head(), 能够看到看到DF里面的前几行，如果需要看到最大或者最小的几行就需要先进行排序。max()和min()可以看到最大或者最小值，但是只能看到一个值。

所以我们可以使用nlargest()函数，nlargest()的优点就是能一次看到最大的几行，而且不需要排序。缺点就是只能看到最大的，看不到最小的。

我们来看看单价排在前十的数据：

单价排在前十的数据

nlargest()的第一个参数就是截取的行数。第二个参数就是依据的列名。

这样就可以筛选出单价最高的前十行，而且是按照单价从最高到最低进行排列的，所以还是按照之前的索引。

还可以按照total_price来进行排名：

按照total_price排名

nlargest还有一个参数，keep='first'或者'last'。当出现重复值的时候，keep='first',会选取在原始DataFrame里排在前面的，keep='last'则去排后面的。

由于nlagerst()不能去最小的多个值，如果我们一定要使用这个函数进行选取也是可以的.

先设置一个辅助列：

先设置一个辅助列

然后在进行选取：

以辅助列进行选取

当然了，也可以通过head()加上排序进行选取的。

那以前这些操作都可以通过其它函数来进行替代的话，nlargest()有什么必要介绍吗？或者说学不学这个函数有什么关系吗？

这就是我们今天要重点介绍的，如果说要选择不同location_road下的前五名要怎么操作呢？

很多人可能第一反应会想到先分组然后进行max()操作，但是这样的操作只能选择最大的一列：

使用max()

但是使用max有一个问题，就是选取的是每一列的最大值，而不是选取最大值的那一行，也就是说只能在选取单列的最大值的时候才是准确的。

这个时候我们就要想到apply和lambda的自定义函数了：

选取多个指标的TOP(N)

这样就选出了不同loaction_road的price排在前五的行了。

nlargest()函数在这种场景下使用是非常方便的，而且结果也已经默认排好顺序了。

还有一些场景下需要计算分组的前几名，然后在进行求和的，这个我们也可以使用nlargest进行操作：

分组之后进行求和

使用这种方法会出现报错提示，这个因为在列和索引都存在loaction_road，有重复，系统有警告，在实际使用时可以先改列名再操作。我们也可以换一种方式直接按照索引进行求和，这样就没有警告了：

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

来源：https://blog.csdn.net/weixin_40161254/article/details/90598574

0

投稿

猜你喜欢

python 获取文件下所有文件或目录os.walk()的实例
在python3.6版本中去掉了os.path.walk()函数os.walk()函数声明：walk(top,topdown=True,on
图片完美缩放
在公司的工作经常要为客户作产品展示的页面，由于客户上传的图片格式大小不一，缩放后会导致变形，于是在星期天抽了点时间，写了一段JS代码，支持图
MySQL中的全表扫描和索引树扫描的实例详解
引言在学习mysql时，我们经常会使用explain来查看sql查询的索引等优化手段的使用情况。在使用explain时，我们可以观察到，ex
Golang编译器介绍
cmd/compile 包含构成 Go 编译器主要的包。编译器在逻辑上可以被分为四个阶段，我们将简要介绍这几个阶段以及包含相应代码的包的列表
讲解Python中for循环下的索引变量的作用域
我们从一个测试开始。下面这个函数的功能是什么？ def foo(lst): a = 0 for i in
Mysql入门系列：MYSQL日志文件维护
在MySQL服务器启动时，它检查其命令行的操作，来查看它是否应该执行登录并打开相应的日志文件（如果应该的话）。可以让服务器生成两种主要类型的
python数字图像处理实现图像的形变与缩放
skimage的transform模块图像的形变与缩放，使用的是skimage的transform模块，函数比较多，功能齐全。1、改变图片尺
Mysql WorkBench安装配置图文教程
本文为大家分享了Mysql WorkBench安装配置图文教程，供大家参考，具体内容如下workbench下载地址下载到workbench下
Python使用plt.boxplot() 参数绘制箱线图
Python 绘制箱线图主要用 matplotlib 库里 pyplot 模块里的 boxplot() 函数。plt.boxplot() 参
Python配置文件解析模块ConfigParser使用实例
一、ConfigParser简介ConfigParser 是用来读取配置文件的包。配置文件的格式如下：中括号“[ ]”内包含的为sectio
Ceph分布式存储集 * ool资源池简介及使用小结
1.Pool资源池的概念Pool资源池的官方文档：https://docs.ceph.com/en/pacific/rados/operat
Python input函数使用实例解析
这篇文章主要介绍了Python input函数使用实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋
关于python中map函数的使用
1. 概念map函数也是python中的一个内置函数，用法同之前讲过的filter函数类似。map在这里的意思是映射的意思，会根据提供的函数
javascript 屏蔽鼠标键盘的几段代码
//屏蔽鼠标右键、Ctrl+n、shift+F10、F5刷新、退格键 function KeyDown(){
MySQL定时备份之使用Linux下的crontab定时备份实例
1. Mysql备份某个数据库的命令####################################################
python:按行读入,排序然后输出的方法
题目描述给定n个字符串，请对n个字符串按照字典序排列。输入描述:输入第一行为一个正整数n(1≤n≤1000),下面n行为n个字符串(字符串长
python随机模块random的22种函数(小结)
前言随机数可以用于数学，游戏，安全等领域中，还经常被嵌入到算法中，用以提高算法效率，并提高程序的安全性。平时数据分析各种分布的数据构造也
用Flash来作浏览历史功能
很多网站都有“浏览历史”这个功能，通常都是显示在页面的一侧，特别是一些购物网站，这个功能会让用户使用网站的体验好一些；例如当当网或淘宝网都有
视觉直观感受若干常用排序算法
直观感受几种常用排序算法，具体内容如下1 快速排序介绍：快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下，排序 n 个项目要Ο(n
什么是gzip，人肉gzip？
gzip 是什么东东呢？百科跟我们说gzip是GNU zip的缩写，它是一个 GNU 自由软件的文件压缩程序。…gzip 的基础是 DEFL

如何在Django配置文件里配置session链接

Pandas把dataframe或series转换成list的方法

python由已知数组快速生成新数组的方法

Django REST framework 如何实现内置访问频率控制

Python PIL图片如何按比例裁剪

详解Python中常用的激活函数(Sigmoid、Tanh、ReLU等)

通过淘宝数据爬虫学习python scrapy requests与response对象

python中列表的常见操作梳理总结(一)

PyCharm上安装Package的实现(以pandas为例)

Python Pandas 获取列匹配特定值的行的索引问题

找到老婆的私房钱3第12关如何通关?第12关通关流程图文分享

如何管理 Windows 10 预装应用

Netty分布式高性能工具类异线程下回收对象解析

Win11文件夹打不开怎么办?Win11文件夹打不开的解决方法

Python中几种导入模块的方式总结

win10游戏在哪里

TipRanks评选出人工智能顶尖公司微软居榜首

python matplotlib绘图实现删除重复冗余图例的操作

python3.6实现学生信息管理系统

python实现彩色图转换成灰度图

手机版 网络编程 asp之家 www.aspxhome.com