pandas学习之df.set_index的具体使用
作者:非昨 发布时间:2021-11-12 07:35:20
标签:pandas,df.set,index
处理数据时,经常需要对索引进行处理,那么可以通过set_index和reset_index来进行处理
官方文档
DataFrame.set_index(self, keys, drop=True, append=False, inplace=False, verify_integrity=False)
参数解释
构建实例
import pandas as pd
df = pd.DataFrame(data={'height':[178,171,185,196],'weight':[156,90,140,142],
'name':['小王','小明','小绿','小红']})
df
height weight name
0 178 156 小王
1 171 90 小明
2 185 140 小绿
3 196 142 小红
key:label array-like or list of label/arrays
需要设置成索引的数据,可以使一个标签,数组,或者标签或数组的列表
df.set_index('name')#指定某一列为索引
height weight
name
小王 178 156
小明 171 90
小绿 185 140
小红 196 142
drop:bool,default True
是否删除作为索引使用的列,默认True,即删除做为索引的列
df.set_index('name',drop=False)
height weight name
name
小王 178 156 小王
小明 171 90 小明
小绿 185 140 小绿
小红 196 142 小红
append:bool default False
将序列添加到索引中,形成多级序列
df.set_index(df['name'],append = True)
height weight name
name
0 小王 178 156 小王
1 小明 171 90 小明
2 小绿 185 140 小绿
3 小红 196 142 小红
# 前两列都为索引
inplace:bool default False
将结果返回为原变量
df#原df
height weight name
0 178 156 小王
1 171 90 小明
2 185 140 小绿
3 196 142 小红
df.set_index(df['name'],append = True,inplace = True)
height weight name
name
0 小王 178 156 小王
1 小明 171 90 小明
2 小绿 185 140 小绿
3 小红 196 142 小红
df#无需对df重新赋值,df即为上边代码的结果
height weight name
name
0 小王 178 156 小王
1 小明 171 90 小明
2 小绿 185 140 小绿
3 小红 196 142 小红
verify_integrity:bool default False
检查索引是否重复。默认是False。
来源:https://blog.csdn.net/lisnyuan/article/details/107086094
0
投稿
猜你喜欢
- 简单的一个例子,是以前用Dephi写的,前不久刚实现了一个在Python中使用Delphi控件来编写界面程序,于是趁热写一个类似的的查询方案
- Python的property属性的功能是:property属性内部进行一系列的逻辑计算,最终将计算结果返回。使用property修饰的实例
- 好久没写技术相关的文章,这次写篇有意思的,关于一个有意思的游戏——QQ找茬,关于一种有意思的语言——Python,关于一个有意思的库——Qt
- 1、正则表达式包括两部分①定义正则表达式的规则;②正则表达式的模式(i/g/m);2、声明正则表达式① 字面量声明: var reg = /
- 一、手指触屏,利用touchstart和touchend计算前后滑动距离,判断是上拉还是下滑。二、js中距离:pageY、clientY、o
- 不久前因业务需要,我在自己的笔记本中安装了搜霸。当时一个做平面的朋友过来和我做一些设计交流,我在笔记本前准备输入一个网址,他靠近我的电脑,大
- 目录Logging模块的使用简单使用指定日志输出样式日志记录到文件中自定义日志配置准备日志配置信息准备日志配置信息加载日志配置信息使用日志配
- 今天发现了一个显示ORACLE语法的好网站。内容太多,就不一一摘录了,记在这里,也方便自己查找。http://ss64.com/ora/ 目
- 本文实例讲述了django框架模板中定义变量的方法。分享给大家供大家参考,具体如下:总有一些情况,你会想在django template中设
- DBScan 算法解释说明DBScan 是密度基于空间聚类,它是一种基于密度的聚类算法,其与其他聚类算法(如K-Means)不同的是,它不需
- 新手,看到很多网页上有显示/隐藏的菜单,可以显示隐藏层的同时控制FLASH的播放与停止。找了好久都找不到这个功能。。。还望高人指点当点击时就
- 给浏览器绑定事件有时候是非常痛苦的事情,不同的浏览器提供不尽相同的功能的同时,也提供了不同的事件。例如,IE 系列的浏览器支持 mousee
- 开篇先明义:lambda是表达式,而def函数是语句代码块所以lambda其实就是一个稍微高级一点的式子而已,只不过这个式子比较长,而且还会
- 以下是IE7中新支持的属性:min-height,max-height,min-width,max-width这个hack还可以使最大高度兼
- 在oracle中有很多关于日期的函数,如:1、add_months()用于从一个日期值增加或减少一些月份date_value:=add_mo
- Tag,直译标签,是一种由用户自定义的、用于描述信息 [1]的关键词。Tagging是用户为信息赋予Tag的行为。Delicious,Fli
- show parameter processes; 然后 更改系统连接数 alter system set processes=1000 s
- 下载编译器protoc两种方式:1、使用google官方protoc下载地址:https://github.com/google/proto
- Go 中接口也是一个使用得非常频繁的特性,好的软件设计往往离不开接口的使用,比如依赖倒置原则(通过抽象出接口,分离了具体实现与实际使用的耦合
- 网络开发的在分页上要是遇到数(几十)万以上的数据还是用ADO那样的分页会速度很慢的。有了存储过程速度就快多了。下面是本人用50万的数据进行的