pandas多层索引的创建和取值以及排序的实现
作者:蓝小白1024 发布时间:2023-07-09 23:12:54
多层索引的创建
普通-多个index创建
在创建数据的时候加入一个index列表,这个index列表里面是多个索引列表
Series多层索引的创建方法
import pandas as pd
s = pd.Series([1,2,3,4,5,6],index=[['张三','张三','李四','李四','王五','王五'],
['期中','期末','期中','期末','期中','期末']])
# print(s)
s
张三 期中 1
期末 2
李四 期中 3
期末 4
王五 期中 5
期末 6
dtype: int64
利用 numpy中的随机数
import numpy as np
data = np.random.randint(0,100,size=(6,3))
# np.random.randint(0,100,size=(6,3))是使用numpy中的随机模块random中,生成随机整数方法randint,
# 里面的参数size是指定生成6行3列的数据,并且每个数字的范围在0到100之间
data
array([[44, 66, 67],
[82, 52, 0],
[34, 78, 23],
[38, 4, 43],
[60, 62, 40],
[57, 9, 11]])
Dataframe多层索引创建
import pandas as pd
import numpy as np
data = np.random.randint(0,100,size=(6,3))
df = pd.DataFrame(data,index=[['张三','张三','李四','李四','王五','王五'],
['期中','期末','期中','期末','期中','期末']],
columns=['Java','Web','Python'])
df
Java | Web | Python | ||
---|---|---|---|---|
张三 | 期中 | 68 | 4 | 90 |
期末 | 33 | 63 | 73 | |
李四 | 期中 | 30 | 13 | 68 |
期末 | 14 | 18 | 48 | |
王五 | 期中 | 34 | 66 | 26 |
期末 | 89 | 10 | 35 |
简化创建-from_product()
import pandas as pd
import numpy as np
data = np.random.randint(0,100,size=(6,3))
names = ['张三','李四','王五']
exam = ['期中','期末']
index = pd.MultiIndex.from_product([names,exam])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
# print(df)
df
Java | Web | Python | ||
---|---|---|---|---|
张三 | 期中 | 51 | 78 | 47 |
期末 | 39 | 53 | 36 | |
李四 | 期中 | 33 | 60 | 83 |
期末 | 90 | 55 | 3 | |
王五 | 期中 | 37 | 45 | 66 |
期末 | 6 | 82 | 71 |
from_product()在这个里面的列表中位置不同, 产生的索引页会不同
index = pd.MultiIndex.from_product([exam, names])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
# print(df)
df
Java | Web | Python | ||
---|---|---|---|---|
期中 | 张三 | 51 | 78 | 47 |
李四 | 39 | 53 | 36 | |
王五 | 33 | 60 | 83 | |
期末 | 张三 | 90 | 55 | 3 |
李四 | 37 | 45 | 66 | |
王五 | 6 | 82 | 71 |
from_product([exam,names])会将列表中第一个元素作为最外层索引,依次类推
多层索引的取值
获取到我们想要的数据
获取多层索引Series中的数据
创建数据
import pandas as pd
s = pd.Series([1,2,3,4,5,6],index=[['张三','张三','李四','李四','王五','王五'],
['期中','期末','期中','期末','期中','期末']])
print(s)
张三 期中 1
期末 2
李四 期中 3
期末 4
王五 期中 5
期末 6
dtype: int64
可以直接使用[]的方式取最外面的一个层级 s[‘张三']
s['李四']
# 注意:[]取值方式,不可直接使用最外层以外的其他层级,例如:s['期末']
期中 3
期末 4
dtype: int64
使用['外索引', '内索引'], 获取某个数据
注意:[‘张三',‘期末']他们的顺序不能变。剥洋葱原则,从外到内一层一层的剥。
s['李四', '期中'] # 李四期中分值
# 注意:['张三','期末']他们的顺序不能变。剥洋葱原则,从外到内一层一层的剥。
3
使用[]的切片,获取数据s[:,‘期中']
s[:,'期中'] # 第一个值为全部的外索引
张三 1
李四 3
王五 5
dtype: int64
使用 loc
loc 使用的是标签suoyin
iloc使用的是位置索引
# loc 使用方式与 [] 的方式基本一样
s.loc['张三']
s.loc['张三','期中']
s.loc[:,'期中']
# iloc 的取值并不会受多层索引影响,只会根据数据的位置索引进行取值, 不推荐
张三 1
李四 3
王五 5
dtype: int64
多层索引DataFrame的取值
在对多层索引DataFrame的取值是,推荐使用 loc() 函数
import pandas as pd
import numpy as np
#size参数是指定生成6行3列的数组
data = np.random.randint(0,100,size=(6,3))
names = ['张三','李四','王五']
exam = ['期中','期末']
index = pd.MultiIndex.from_product([names,exam])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
df
Java | Web | Python | ||
---|---|---|---|---|
张三 | 期中 | 3 | 40 | 52 |
期末 | 74 | 38 | 85 | |
李四 | 期中 | 7 | 28 | 16 |
期末 | 9 | 25 | 0 | |
王五 | 期中 | 13 | 24 | 8 |
期末 | 49 | 46 | 1 |
三种方式都可以获取张三期中各科成绩
# df.loc['张三','期中']
# df.loc['张三'].loc['期中']
# df.loc[('张三','期中')]
注意:DataFrame中对行索引的时候和Series有一个同样的注意点,就是无法直接对二级索引直接进行索引,必须让二级索引变成一级索引后才能对其进行索引
多层索引的排序
使用sort_index() 排序
level参数可以指定是否按照指定的层级进行排列
第一层索引值为0, 第二层索引的值为1
创建数据
import pandas as pd
data = np.random.randint(0,100,size=(9,3))
key1 = ['b','c','a']
key2 = [2,1,3]
index = pd.MultiIndex.from_product([key1,key2])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
df
Java | Web | Python | ||
---|---|---|---|---|
b | 2 | 56 | 82 | 81 |
1 | 84 | 16 | 55 | |
3 | 35 | 25 | 86 | |
c | 2 | 76 | 1 | 76 |
1 | 36 | 28 | 94 | |
3 | 79 | 70 | 97 | |
a | 2 | 25 | 17 | 30 |
1 | 38 | 38 | 78 | |
3 | 41 | 75 | 90 |
排序
DataFrame按行索引排序的方法是sort_index()
如果直接使用的话,不传参数, 会把每一层索引根据值进行升序排序
df.sort_index()
Java | Web | Python | ||
---|---|---|---|---|
a | 1 | 18 | 60 | 74 |
2 | 66 | 87 | 27 | |
3 | 96 | 18 | 64 | |
b | 1 | 72 | 58 | 52 |
2 | 22 | 31 | 22 | |
3 | 31 | 12 | 83 | |
c | 1 | 6 | 54 | 96 |
2 | 9 | 47 | 18 | |
3 | 31 | 63 | 4 |
# 当level=0时,ascending=False, 会根据第一层索引值进行降序排序
df.sort_index(level=0,ascending=False)
Java | Web | Python | ||
---|---|---|---|---|
c | 3 | 79 | 70 | 97 |
2 | 76 | 1 | 76 | |
1 | 36 | 28 | 94 | |
b | 3 | 35 | 25 | 86 |
2 | 56 | 82 | 81 | |
1 | 84 | 16 | 55 | |
a | 3 | 41 | 75 | 90 |
2 | 25 | 17 | 30 | |
1 | 38 | 38 | 78 |
# 当level=1时,会根据第二层索引值进行降序排序
df.sort_index(level=1,ascending=False)
# 数据会根据第二层索引值进行相应的降序排列,
# 如果索引值相同时会根据其他层索引值排列
Java | Web | Python | ||
---|---|---|---|---|
c | 3 | 79 | 70 | 97 |
b | 3 | 35 | 25 | 86 |
a | 3 | 41 | 75 | 90 |
c | 2 | 76 | 1 | 76 |
b | 2 | 56 | 82 | 81 |
a | 2 | 25 | 17 | 30 |
c | 1 | 36 | 28 | 94 |
b | 1 | 84 | 16 | 55 |
a | 1 | 38 | 38 | 78 |
通过level设置排序的索引层级,其他层索引也会根据其排序规则进行排序
来源:https://blog.csdn.net/lxb_wyf/article/details/114273989


猜你喜欢
- 本文讲述的内容基于 Django 1.11摘要Django 中的中间件(middleware),是一个镶嵌到Django的request/r
- 1、变量的定义定义变量语法格式:variable_name = variable_namevariable_name表示变量名;variab
- 在使用SQL Server 的过程,中由于经常需要从多个不同地点将数据集中起来或向多个地点复制数据,所以数据的导出,导入是极为常见的操作.我
- 现在小编已经学习语言程序良久,但是在了解以后,如果让小编再去学习语言要入手入口,一定是先从掌握函数开始了解,原因很简单,任何一个代码串都是有
- 说起交叉熵损失函数「Cross Entropy Loss」,脑海中立马浮现出它的公式:我们已经对这个交叉熵函数非常熟悉,大多数情况下都是直接
- 有时候我们会需要从网络上爬取一些图片,来满足我们形形色色直至不可描述的需求。一个典型的简单爬虫项目步骤包括两步:获取网页地址和提取保存数据。
- 如果需要一个简单的Web Server,而不是安装那些复杂的HTTP服务程序,比如:Apache,Nginx等。那么可以使用Python自带
- 概述数据分析 (Data Analyze) 可以在工作中的各个方面帮助我们. 本专栏为量化交易专栏下的子专栏, 主要讲解一些数据分析的基础知
- 前言scikit-learn是Python中最流行的机器学习库之一,它提供了各种各样的机器学习算法和工具,包括分类、回归、聚类、降维等。sc
- Request Payload 和 Form Data 请求头上的参数差别在于:Content-TypeForm DataPost表单请求代
- 最近常有厦门的客户通过网站上的联系方式加我QQ,询问网站改版的情况。几乎每日都要针对客户网站存在的问题做一番分析,然后客户以价格等其他因素结
- Python编写一个简易银行账户系统,供大家参考,具体内容如下文章中主要涉及的方法是Python中的open(filename, ‘r
- asp+js做的一个dig程序中的投票(有的叫顶一下,踩一下),由于代码较长,只贴出核心部分:投票中的代码相关文章推荐:ajax +asp
- 将无权点文件转化成邻接矩阵目前点文件是两列Excel代码,在进行复杂网络运算时需要转化成邻接矩阵。我在网上找了一个代码,稍微修改了下,亲测可
- 目录一、前端控制1、在router.js文件(把静态路由和动态路由分别写在router.js)2、store/permission.js(在
- Pyqt5安装并配置到pycharm方法:教你如何用pycharm安装pyqt5及其相关配置一、简介QLabel是界面中的标签类,继承自QF
- 版本更新,原来user里的password字段已经变更为authentication_string版本更新 缘故,好多网上的教程都不适用了,
- 一. SQL2008卸载。1.从控制面板卸载1)点击计算机右下角“开始”,点击“控制面板”2)点击“卸载
- 手写数字识别(小白入门)今早刚刚上了节实验课,关于逻辑回归,所以手有点刺挠就想发个博客,作为刚刚入门的小白,看到代码运行成功就有点小激动,这
- 【JS对象属性的查询和设置】可以通过点(.) 或 方括号([]) 运算符来获取属性的值。运算符左侧应当是一个表达式,它返回一个对象。对于点(