python pandas 数据排序的几种常用方法
作者:soulsoul_god 发布时间:2021-10-02 06:25:01
前言:
pandas中排序的几种常用方法,主要包括sort_index和sort_values。
基础数据:
import pandas as pd
import numpy as np
data = {
'brand':['Python', 'C', 'C++', 'C#', 'Java'],
'B':[4,6,8,12,10],
'A':[10,2,5,20,16],
'D':[6,18,14,6,12],
'years':[4,1,1,30,30],
'C':[8,12,18,8,2]
}
index = [9,3,4,5,2]
df = pd.DataFrame(data=data, index = index)
print("df数据:\n", df, '\n')
out:
df数据:
A B C D brand years
9 10 4 8 6 Python 4
3 2 6 12 18 C 1
4 5 8 18 14 C++ 1
5 20 12 8 6 C# 30
2 16 10 2 12 Java 30
按行索引排序:
print("按行索引排序:\n", df.sort_index(), '\n')
out:
按行索引排序:
A B C D brand years
2 16 10 2 12 Java 30
3 2 6 12 18 C 1
4 5 8 18 14 C++ 1
5 20 12 8 6 C# 30
9 10 4 8 6 Python 4
通过设置参数ascending可以设置升序或者降序排序,默认情况下ascending=True,为升序排序。
设置ascending=False时,为降序排序。
print("按行索引降序排序:\n", df.sort_index(ascending=False), '\n')
out:
按行索引降序排序:
A B C D brand years
9 10 4 8 6 Python 4
5 20 12 8 6 C# 30
4 5 8 18 14 C++ 1
3 2 6 12 18 C 1
2 16 10 2 12 Java 30
按列的名称排序:
设置参数axis=1实现按列的名称排序:
print("按列名称排序:\n", df.sort_index(axis=1), '\n')
out:
按列名称排序:
A B C D brand years
9 10 4 8 6 Python 4
3 2 6 12 18 C 1
4 5 8 18 14 C++ 1
5 20 12 8 6 C# 30
2 16 10 2 12 Java 30
同样,也可以设置ascending参数:
print("按列名称排序:\n", df.sort_index(axis=1, ascending=False), '\n')
out:
按列名称排序:
years brand D C B A
9 4 Python 6 8 4 10
3 1 C 18 12 6 2
4 1 C++ 14 18 8 5
5 30 C# 6 8 12 20
2 30 Java 12 2 10 16
按数值排序:
sort_values()是pandas中按数值排序的函数:
1、按单个列的值排序
sort_values()中设置单个列的列名,可以对单个列进行排序,通过设置ascending可以设置升序或者降序。
print("按列名称A排序:\n", df.sort_values('A'), '\n')
out:
按列名称排序:
A B C D brand years
3 2 6 12 18 C 1
4 5 8 18 14 C++ 1
9 10 4 8 6 Python 4
2 16 10 2 12 Java 30
5 20 12 8 6 C# 30
设置ascending=False进行降序排序:
print("按列名称A降序排序:\n", df.sort_values('A', ascending=False), '\n')
out:
按列名称A降序排序:
A B C D brand years
5 20 12 8 6 C# 30
2 16 10 2 12 Java 30
9 10 4 8 6 Python 4
4 5 8 18 14 C++ 1
3 2 6 12 18 C 1
按多个列的值排序:
先按year列的数据进行升序排序,year列相同的再看B列进行升序排序
print("按多个列排序:\n", df.sort_values(['years', 'B']), '\n')
out:
按多个列排序:
A B C D brand years
3 2 6 12 18 C 1
4 5 8 18 14 C++ 1
9 10 4 8 6 Python 4
2 16 10 2 12 Java 30
5 20 12 8 6 C# 30
也可以分别设置列的升序、降序来排序:
years列为升序,B列为降序。
print("按多个列排序:\n", df.sort_values(['years', 'B'], ascending=[True, False]), '\n')
out:
按多个列排序:
A B C D brand years
4 5 8 18 14 C++ 1
3 2 6 12 18 C 1
9 10 4 8 6 Python 4
5 20 12 8 6 C# 30
2 16 10 2 12 Java 30
inplace使用:
inplace=True:不创建新的对象,直接对原始对象进行修改;默认是False,即创建新的对象进行修改,原对象不变,和深复制和浅复制有些类似。
df.sort_values('A', inplace=True)
print("按A列排序:\n", df, '\n')
out:
按A列排序:
A B C D brand years
3 2 6 12 18 C 1
4 5 8 18 14 C++ 1
9 10 4 8 6 Python 4
2 16 10 2 12 Java 30
5 20 12 8 6 C# 30
缺失值:
含有nan值的数据排序:
data = {
'brand':['Python', 'C', 'C++', 'C#', 'Java'],
'B':[4,6,8,np.nan,10],
'A':[10,2,5,20,16],
'D':[6,18,14,6,12],
'years':[4,1,1,30,30],
'C':[8,12,18,8,2]
}
index = [9,3,4,5,2]
df = pd.DataFrame(data=data, index = index)
print("df数据:\n", df, '\n')
out:
df数据:
A B C D brand years
9 10 4.0 8 6 Python 4
3 2 6.0 12 18 C 1
4 5 8.0 18 14 C++ 1
5 20 NaN 8 6 C# 30
2 16 10.0 2 12 Java 30
B列含有nan值,对B列进行排序,缺失值排在最前面:
print("按B列排序:\n", df.sort_values('B', na_position='first'), '\n')
按B列排序:
A B C D brand years
5 20 NaN 8 6 C# 30
9 10 4.0 8 6 Python 4
3 2 6.0 12 18 C 1
4 5 8.0 18 14 C++ 1
2 16 10.0 2 12 Java 30
包含缺失值,缺失值排在最后:
print("按B列排序:\n", df.sort_values('B', na_position='last'), '\n')
out:
按B列排序:
A B C D brand years
9 10 4.0 8 6 Python 4
3 2 6.0 12 18 C 1
4 5 8.0 18 14 C++ 1
2 16 10.0 2 12 Java 30
5 20 NaN 8 6 C# 30
来源:https://blog.csdn.net/xiadeliang1111/article/details/126831607


猜你喜欢
- 引包引入对应的包,和原来一样写一个打印文字的方法import sys, random, pygamefrom pygame.lo
- 如果 replaceText 为函数,对于每一个匹配的子字符串,调用该函数时带有下面的 m+3 个参数,此处 m 是在 rgExp 中捕获的
- 简介:单例模式可以保证一个类仅有一个实例,并提供一个访问它的全局访问点。适用性于当类只能有一个实例而且客户可以从一个众所周知的访问点访问它,
- 这是通过博主写的英雄联盟下载器下载的部分的英雄皮肤,可以看一下效果。每个英雄的皮肤的会自动根据英雄名称创建相应的文件夹存放。实现思路比较简单
- <% Function cutbadchar(str) badstr="不|文|明
- 本文实例讲述了php实现转换html格式为文本格式的方法。分享给大家供大家参考,具体如下:有时候需要转换html格式的字符串为文本,但又需要
- 段时间作项目中,遇到使用视图的问题,以前的工作中很少遇到视图,认为直接用表就ok了,何须视图呢?下面我来讲述一下它的功用:以往当我们查询数据
- 先来看一个老掉牙的故事:福特说,我在设计汽车之前,到处去问人们“需要一个什么样的更好的交通工具?”,几乎所有人的答案都是 ── 一匹“更快的
- 如何编写CSS代码才能更有效率?这是许多网页制作者与开发者都关心的问题。大概没有什么魔法,可以保证一下就把你的样式表缩小到百分之多少,但合理
- 本文实例讲述了JavaScript设计模式之原型模式。分享给大家供大家参考,具体如下:从设计模式的角度讲,原型模式是用于创建对象的一种模式,
- 如下所示:#encoding=utf-8import xlrdfrom xlwt import *#------------------读数
- 设想这样一种情况,你在一个平台上操作你的工程,但你希望在另外一个平台上完善并运行它,这就是为什么Pycharm做了很多工作来支持远程调试。在
- 最近刚接触了公司的服务器,使用的是Windows 2003 server + IIS 6.0 服务器,在使用无组件上传文件时产生这个错误时:
- 1.requests库简介requests 是 Python 中比较常用的网页请求库,主要用来发送 HTTP 请求,在使用爬虫或测试服务器响
- 1. 前沿移动均线是股票最进本的指标,本文采用numpy.convolve计算股票的移动均线2. numpy.convolvenumpy.c
- 我的操作系统为centos6.51 首先选择django要使用什么数据库。django1.10默认数据库为sqlite3,本人想
- 问题描述给出一个整数数组 nums,请返回其中位数为偶数的数字的个数。示例 1:输入:nums = [12,345,2,6,7896]输出:
- 当我们开始精通编程语言时,我们不仅希望实现最终目标,而且希望使我们的程序高效。在这个教程中,我们将学习一些Ipython的命令,这些命令可以
- python实现四舍五入""" 四舍五入 :param
- 前言最近遇到一个临时需求,需要将客户环境中一个服务每天的日志进行一系列复杂处理,并生成数据报表。由于数据处理逻辑复杂,且需要存入数据库,在客