十分钟轻松掌握dataframe数据选择
作者:达达爱吃肉 发布时间:2021-03-03 11:11:40
数据初始化
import pandas as pd
import numpy as np
a=np.array([['北京','北方','一线','非沿海'],['杭州','南方','二线','非沿海'],['深圳','南方','一线','沿海'],['烟台','北方','三线','沿海']])
df=pd.DataFrame(a,index=['一','二','三','四'],columns=['城市','地理','级别','是否沿海'])
城市 地理 级别 是否沿海
一 北京 北方 一线 非沿海
二 杭州 南方 二线 非沿海
三 深圳 南方 一线 沿海
四 烟台 北方 三线 沿海
选择某一行
通过loc选择某一行
loc标签是轴标签,也就是我们的索引名,使用也非常简单
df.loc['二']
城市 杭州
地理 南方
级别 二线
是否沿海 非沿海
Name: 二, dtype: object
通过iloc选择某一行
iloc为整数标签,类似我们使用的元组列表的索引。比如我们想选择第二行的数据,第二行的索引则为1.
df.iloc[1]
城市 杭州
地理 南方
级别 二线
是否沿海 非沿海
Name: 二, dtype: object
选择某一列
最简单的方法选择某一列
如果我们知道列索引,那么选择某一列则变得十分简单
df['级别']
一 一线
二 二线
三 一线
四 三线
Name: 级别, dtype: object
通过iloc选则某一列
正如我们上述使用iloc的方法,我们只需传入行或者列的索引即可。其实iloc的中括号里可以输入两个参数。前面为行,后面为列中间用逗号隔开。(如果省略了逗号,则默认取选择行)
比如现在我们想选择第二列,我们只需在逗号钱输入: 代表所有的行,后面则输入1代表第二列
df.iloc[:, 1]
一 北方
二 南方
三 南方
四 北方
Name: 地理, dtype: object
通过loc选择某一列
和iloc的使用相似,只不过在数据筛选中我们不再使用行整数索引,而是具体的索引值。
df.loc[:, '是否沿海']
一 非沿海
二 非沿海
三 沿海
四 沿海
Name: 是否沿海, dtype: object
选择某一行的某几列或某一列的某一行
其实loc与iloc是dataframe中选择数据最高效的方式,他的功能也十分强大。我们可以随意组合。
选择某一行的某几列
比如我们现在选择第二行的中间两列
df.iloc[1,1:3]
地理 南方
级别 二线
Name: 二, dtype: object
当然我们也可以不使用整数索引
df.loc['二':,'地理':'级别']
地理 级别
二 南方 二线
三 南方 一线
四 北方 三线
通过行列自由组合去选择数据
比如我们想选择第二到三行的第二列和第三列
df.iloc[2:4:, 2:4]
级别 是否沿海
三 一线 沿海
四 三线 沿海
同样十分简单,通过loc使用效果相同,这里不过多描述
选择某几列或者某几行
选择某几列
df.iloc[:,2:4]
级别 是否沿海
一 一线 非沿海
二 二线 非沿海
三 一线 沿海
四 三线 沿海
选择某几行
城市 地理 级别 是否沿海
二 杭州 南方 二线 非沿海
三 深圳 南方 一线 沿海
获取单个标量值
如果把dataframe看做一个表格,这里可以看成获得表格里某个单元格的值
通过iat去获取
iat即为整数标签
df.iat[2,2]
'一线'
通过at去获取
at即为具体的索引值去获取
df.at['三','级别']
'一线'
来源:https://blog.csdn.net/weixin_44706915/article/details/115368105
猜你喜欢
- 需要在 ~/.pip/pip.conf 配置文件中加入下面的语句,避免这类警告:没有目录或没有配置文件需要自己新建mkdir ~/.pip/
- 本文实例讲述了Python常见字符串操作函数。分享给大家供大家参考,具体如下:str.split(' ')1.按某一个字符分
- 本文实例讲述了python在控制台输出进度条的方法。分享给大家供大家参考。具体实现方法如下:进度条效果如下所示:|#############
- 这个是用python实现的基本的增删改查的学生管理系统吧,其中主要是对输入的数据进行合法性检测的问题,这次又对函数进行了练习!掌握函数更加熟
- 导语:近年来,全世界都纷纷投身网络热潮。从小企业到大公司,再到网络学校和大学,大家都在努力提升自己的网络影响力,这样既免费为自身品牌做广告,
- 1、手上目前拥有数据集是一大坨,没有train,test,val的划分如图所示2、目录结构:|---data |
- 由于系统自带的MySQL默认字符集不是gbk,因此给数据库的推广应用以及中文程序的开发带来极大的不便,在没完没了的GBK和UTF8的转换过程
- 情景是这样的:在C#中调用python脚本进行post请求,python脚本中使用了requests包。Python的开发环境我们有比较多的
- 本文将介绍 5 种基于 Plotly 的可视化方法,你会发现,原来可视化不仅可用直方图和箱形图,还能做得如此动态好看甚至可交互。那么,Plo
- 可变长参数GO语言允许一个函数把任意数量的值作为参数,GO语言内置了**...操作符,在函数的最后一个形参才能使用...**操作符,使用它必
- 初识项目打开VS2015,创建Web项目,选择ASP.NET Web Application,在弹出的窗口里选择ASP.NET 5 Webs
- 1. 关于列表更多的内容Python 的列表数据类型包含更多的方法。这里是所有的列表对象方法:list.``append(x)把一个元素添加
- 1.sp_helpsort SELECT SERVERPROPERTY ('Collation') 查看你的排序规则. 不过
- 本文实例为大家分享了python定时提取实时日志的具体代码,供大家参考,具体内容如下这是一个定时读取 实时日志文件的程序。目标文件是targ
- 本文实例讲述了pymongo实现多结果进行多列排序的方法。分享给大家供大家参考。具体分析如下:这里多列排序即指定多个排序字段。集合查询结果排
- 我将图形编辑程序分为两类:一类(是)绘图程序,利用这种程序可以一个像素一个像素(地)绘制图像;另外一类(是)制图程序,这种程序提供了一组对象
- reader.html<html><head><meta http-equiv=&quo
- 关于高性能的分布式内存对象缓存系统Memcached,我们在另一篇文章中有提到过“在windows系统下如何安装memcached的讲解”,
- 首先,创建一个存储过程 get_clob:t_name:要查询的表名;f_name:要查询的字段名;u_id:表的主键,查询条件;l_pos
- 如果值没有重复的情况,可以先用array_flip()来交换键和值,然后krsort(),最后再array_flip()交换回来,就可以比较