如何利用Pandas删除某列指定值所在的行
作者:DonngZH 发布时间:2023-10-29 11:49:39
标签:pandas,删除,指定值
前言
使用pandas对数据操作,筛选数据时,根据任务要求有时不仅要某列中存在空值的行,并且要删除某列中指定值所在行。
1.data.dropna()
默认参数:
data.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
1-1 axis确定删除存在缺失值的行或者是列
#删除含有缺失值的行
axis=0或axis='index'
#删除含有缺失值的列
axis=1或axis='columns'
1-2 how 确定存在缺失值时,是否删除行或者列
how='all'或how=‘any'。
how='all'时表示删除全是缺失值的行(列)
how='any'时表示删除只要含有缺失值的行(列)
1-3 thresh=n表示保留至少含有n个非na数值的行
data.dropna(thresh=2)
1-4 subset确定要在哪些列中查找缺失值
#在source和target两列中查找缺失值
data.drop(subset = ["source","target"])
1-5 inplace确定是否直接在原DataFrame修改
#删除缺失值后不在原data上修改
inplace = False
#删除缺失值后在原data上修改
inplace = True
2.data.drop
默认参数:
data.drop(
labels=None,
axis=0,
index=None,
columns=None,
level=None,
inplace=False,
errors='raise',
)
2-1 labels 指定行或者列的名称
#参数axis为0表示在0轴(列)上搜索名为“姓名”的对象,然后删除对象“姓名”对应的行。
data.drop("姓名",axis = 0)
#参数axis为0表示在1轴(行)上搜索名为“姓名”的对象,然后删除对象“姓名”对应的列。
data.drop("姓名",axis = 1)
2-2 index 指定要删除的行
#删除data中索引为0和1的行
data.drop(index = [0,1])
2-3 columns 指定要删除的列
#删除data中列名为“source”和“target”的列
data.drop(columns=['source', 'target'])
3.实例
任务需求:删掉“ZH_Term_len”列中值为0的全部行。
3-1 统计0的数量
#统计“ZH_Term_len”一列中有多少个0
data["ZH_Term_len"].value_counts()
3-2 找出0的索引
data[(data.ZH_Term_len == 0)].index.tolist()
3-3 使用drop函数以及index参数删除所在的行
data = data.drop(index = data[(data.ZH_Term_len == 0)].index.tolist())
3-4 查看数据
data.info()
3-5 将索引重新排序
#会将标签重新从零开始顺序排序,使用参数设置drop=True删除旧的索引序列
data = data.reset_index(drop=True)
3-6 统计“ZH_Term_len”列中值的数量
统计后发现,“ZH_Term_len”列中值为0的行已经全部被删除掉。
来源:https://blog.csdn.net/weixin_44750512/article/details/122436249


猜你喜欢
- 首先导入包含apriori算法的mlxtend库,pip install mlxtend调用apriori进行关联规则分析,具体代码如下,其
- 前言python学习之路任重而道远,要想学完说容易也容易,说难也难。很多人说python最好学了,但扪心自问,你会用python做什么了?刚
- 下面这段代码,不会替换ld<sad中间的<,所以内容仍然是正常的 <% function nohtml(str) dim
- pytorch中的gather函数pytorch比tensorflow更加编程友好,所以准备用pytorch试着做最近要做的一些实验。立个f
- 本文已经收录于最新版的 《PyCharm中文指南》更多 PyCharm 使用技巧,可前往在线文档学习:《PyCharm 中文指南》2.0 在
- 当我们使用传统的 mysql_connect 、mysql_query方法来连接查询数据库时,如果过滤不严,就有SQL注入风险,导致网站被攻
- xlwt与xlrd只能针对xls格式的excel进行操作,如果想对xlsx格式进行操作请使用openpyxl模板对excel进行操作xlwt
- V5.0之后,我们总结了一些得失。首先要说的是改版的动力。产品设计或产品升级的驱动力只有两个:用户需求和网站目标。之前的我们的多次改版,其驱
- 首先看一下目标的验证形态是什么样子的是一种通过验证推理的验证方式,用来防人机破解的确是很有效果,但是,But,这里面已经会有一些破绽,比如:
- 镜像使用方法(三种办法任意一种都能解决问题,建议使用第三种,将配置写死,下次用的时候配置还在):1.通过config命令npm config
- 什么是Flyway?转载:https://blog.waterstrong.me/flyway-in-practice/Flyway is
- 不同的色彩空间中对图片的色彩体现有很大不同#色彩空间的相互转换:最常见的是HSV与RGB,YUV与RGB的相互转换#常见色彩空间有:#RGB
- 数据读取与保存Text文件对于 Text文件的读取和保存 ,其语法和实现是最简单的,因此我只是简单叙述一下这部分相关知识点,大家可以结合de
- 看了下网上有很多关于模拟登录淘宝,但是基本都是使用scrapy、pyppeteer、selenium等库来模拟登录,但是目前我们还没有讲到这
- 如下所示:>>> import numpy as np>>> a = np.arange(12).res
- 问题你需要将数字格式化后输出,并控制数字的位数、对齐、千位分隔符和其他的细节。解决方案格式化输出单个数字的时候,可以使用内置的 format
- 在我们有时需要迁移或部署项目时,需要知道项目所依赖的三方包和版本,下面就来一看一看该如何获取吧:1、首先安装pipreqs库使用pip命令,
- 我以前一直用这个preg_match('~[\x7f-\xff]+~is', $string, $tmp);今天才发现,上面
- 已经11月了,不知道还有没有人看华强买瓜。。。要把华强卖瓜做成字符视频,总共分为三步读取视频把每一帧转为字符画把字符画表现出来 读
- 一:导入pmo.xm配置包mysql库连接、druid连接池、mybatis组件<!-- 使用MySQL数据库--> <d