Python Pandas 修改表格数据类型 DataFrame 列的顺序案例
作者:菜鸟实战 发布时间:2023-02-27 17:47:37
一、修改表格数据类型 DataFrame 列的顺序
实战场景:Pandas 如何修改表格数据类型 DataFrame 列的顺序
1.1主要知识点
文件读写
基础语法
数据构建
Pandas
Numpy
实战:
1.2创建 python 文件
import numpy as np
import pandas as pd
np.random.seed(66)
df = pd.DataFrame(np.random.rand(10, 4), columns=list('ABCD'))
print(df)
df = df[["D", "A", "B", "C"]]
print(df)
1.3运行结果
A B C D
0 0.154288 0.133700 0.362685 0.679109
1 0.194450 0.251210 0.758416 0.557619
2 0.514803 0.467800 0.087176 0.829095
3 0.298641 0.031346 0.678006 0.903489
4 0.514451 0.539105 0.664328 0.634057
5 0.353419 0.026643 0.165290 0.879319
6 0.067820 0.369086 0.115501 0.096294
7 0.083770 0.086927 0.022256 0.771043
8 0.049213 0.465223 0.941233 0.216512
9 0.361318 0.031319 0.304045 0.188268
D A B C
0 0.679109 0.154288 0.133700 0.362685
1 0.557619 0.194450 0.251210 0.758416
2 0.829095 0.514803 0.467800 0.087176
3 0.903489 0.298641 0.031346 0.678006
4 0.634057 0.514451 0.539105 0.664328
5 0.879319 0.353419 0.026643 0.165290
6 0.096294 0.067820 0.369086 0.115501
7 0.771043 0.083770 0.086927 0.022256
8 0.216512 0.049213 0.465223 0.941233
9 0.188268 0.361318 0.031319 0.304045
二、Pandas 如何统计某个数据列的空值个数
实战场景:Pandas 如何统计某个数据列的空值个数
2.1主要知识点
文件读写
基础语法
Pandas
numpy
实战:
2.2创建 python 文件
"""
对如下DF,设置两个单元格的值
·使用iloc 设置(3,B)的值是nan
·使用loc设置(8,D)的值是nan
"""
import numpy as np
import pandas as pd
np.random.seed(66)
df = pd.DataFrame(np.random.rand(10, 4), columns=list('ABCD'))
df.iloc[3, 1] = np.nan
df.loc[8, 'D'] = np.nan
print(df)
print(df.isnull().sum())
2.3运行结果
A B C D
0 0.154288 0.133700 0.362685 0.679109
1 0.194450 0.251210 0.758416 0.557619
2 0.514803 0.467800 0.087176 0.829095
3 0.298641 NaN 0.678006 0.903489
4 0.514451 0.539105 0.664328 0.634057
5 0.353419 0.026643 0.165290 0.879319
6 0.067820 0.369086 0.115501 0.096294
7 0.083770 0.086927 0.022256 0.771043
8 0.049213 0.465223 0.941233 NaN
9 0.361318 0.031319 0.304045 0.188268
A 0
B 1
C 0
D 1
dtype: int64
三、Pandas如何移除包含空值的行
实战场景:Pandas如何移除包含空值的行
3.1主要知识点
文件读写
基础语法
Pandas
numpy
实战:
3.2创建 python 文件
"""
对如下DF,设置两个单元格的值
·使用iloc 设置(3,B)的值是nan
·使用loc设置(8,D)的值是nan
"""
import numpy as np
import pandas as pd
np.random.seed(66)
df = pd.DataFrame(np.random.rand(10, 4), columns=list('ABCD'))
df.iloc[3, 1] = np.nan
df.loc[8, 'D'] = np.nan
print(df)
df2 = df.dropna()
print(df2)
3.3运行结果
A B C D
0 0.154288 0.133700 0.362685 0.679109
1 0.194450 0.251210 0.758416 0.557619
2 0.514803 0.467800 0.087176 0.829095
3 0.298641 NaN 0.678006 0.903489
4 0.514451 0.539105 0.664328 0.634057
5 0.353419 0.026643 0.165290 0.879319
6 0.067820 0.369086 0.115501 0.096294
7 0.083770 0.086927 0.022256 0.771043
8 0.049213 0.465223 0.941233 NaN
9 0.361318 0.031319 0.304045 0.188268
A B C D
0 0.154288 0.133700 0.362685 0.679109
1 0.194450 0.251210 0.758416 0.557619
2 0.514803 0.467800 0.087176 0.829095
4 0.514451 0.539105 0.664328 0.634057
5 0.353419 0.026643 0.165290 0.879319
6 0.067820 0.369086 0.115501 0.096294
7 0.083770 0.086927 0.022256 0.771043
9 0.361318 0.031319 0.304045 0.188268
四、Pandas如何精确设置表格数据的单元格的值
实战场景:Pandas如何精确设置表格数据的单元格的值
4.1主要知识点
文件读写
基础语法
Pandas
numpy
实战:
4.2创建 python 文件
"""
对如下DF,设置两个单元格的值
·使用iloc 设置(3,B)的值是nan
·使用loc设置(8,D)的值是nan
"""
import numpy as np
import pandas as pd
np.random.seed(66)
df = pd.DataFrame(np.random.rand(10, 4), columns=list('ABCD'))
print(df)
df.iloc[3, 1] = np.nan
df.loc[8, 'D'] = np.nan
print(df)
4.3运行结果
A B C D
0 0.154288 0.133700 0.362685 0.679109
1 0.194450 0.251210 0.758416 0.557619
2 0.514803 0.467800 0.087176 0.829095
3 0.298641 0.031346 0.678006 0.903489
4 0.514451 0.539105 0.664328 0.634057
5 0.353419 0.026643 0.165290 0.879319
6 0.067820 0.369086 0.115501 0.096294
7 0.083770 0.086927 0.022256 0.771043
8 0.049213 0.465223 0.941233 0.216512
9 0.361318 0.031319 0.304045 0.188268
A B C D
0 0.154288 0.133700 0.362685 0.679109
1 0.194450 0.251210 0.758416 0.557619
2 0.514803 0.467800 0.087176 0.829095
3 0.298641 NaN 0.678006 0.903489
4 0.514451 0.539105 0.664328 0.634057
5 0.353419 0.026643 0.165290 0.879319
6 0.067820 0.369086 0.115501 0.096294
7 0.083770 0.086927 0.022256 0.771043
8 0.049213 0.465223 0.941233 NaN
9 0.361318 0.031319 0.304045 0.188268
来源:https://blog.csdn.net/qq_39816613/article/details/126135559
猜你喜欢
- 1.官网下载MySQL下载Mysql点击下载mysql. 或点击这里下载下载完成后解压到某一个文件夹(记住这个路径,一会要用到)2.配置初始
- 1.编写python flask代码,简单写一个加法的接口,命名为sum.pyimport jsonfrom flask import Fl
- 相信学Python的小伙伴肯定有这样的尴尬局面,给一个函数不会用,原因是:不知道参数列表中的类型是什么意思,比如初学者都会疑问的:*args
- 一、前言最近忙着在服务器上跑代码学习积累了一些经验技巧这里用来记录分享给大家二、创建虚拟环境用来跑代码下面我会以一个实例为模板,学习完之后,
- 我是用来移动图片的,其他格式的文档也是可以的,改下后缀列表就可以了import os,shutilimport datetime
- 简介pandas中的DF数据类型可以像数据库表格一样进行groupby操作。通常来说groupby操作可以分为三部分:分割数据,应用变换和和
- 我最近也在研究MySQL性能优化的路上,那么今天也算个学习笔记吧!在小伙伴们开发的项目中,对于MySQL排查问题找出性能瓶颈来说,最容易发现
- 最近想抢冰墩墩的手办和钥匙圈,但是同志们抢的速度太快了,无奈,还是自己写脚本吧。添加火狐浏览器插件Omnibug是一个插件,可以简化web度
- 一、简单使用入门小案例import logginglogging.basicConfig(level=logging.DEBUG, &nbs
- 文件下载1.通过a标签点击直接下载<a href="https:xxx.xlsx" rel="exter
- 一、背景说明以前就感觉进步的速度和博客的数量成正比,所以很长一段时间内想不通为什么很多博客为什么到最后很少甚至不在更新了,直到最近自己也快成
- train_comb 为Dataframe数据:train_comb= train_comb.as_matrix() #得到values的n
- 最近去公司,连续几天被保安查健康码,觉得他们效率有点慢,排了长队,回到家就来兴致,写了个简易的健康码识别系统(主要是针对上海的健康码 随申码
- redis模块的使用1.安装模块pip3 install redis2.导入模块import redis3.连接方式严格连接模式:r=red
- 本文实例为大家分享了JavaScript实现秒杀时钟倒计时的具体代码,供大家参考,具体内容如下功能介绍:1.时/分/秒倒计时直至为零所有代码
- mysql中replace函数替换字符串介绍下mysql的REPLACE()函数语法:REPLACE()函数的语法如下:REPLACE(st
- 老实说,这个东西有点折腾人,主要是书上的表述很晦涩,其实搞懂不难。 our,"把名字限于某个范围“,其实就是明确声明一个
- js原生获取css样式,并且设置,看似简单,其实并不简单,我们平时用的ele.style.样式,只能获取内嵌的样式,但是我们写的样式基本都在
- 1、MySQL下载1.1下载MySQL8.0.26安装与卸载的完整步骤记录MySQL关是一种关系数据库管理系统,所使用的 SQL 语言是用于
- 在页面中使用window全局变量main.js中定义:window.xxx=[];在data中定义:data() {? ? return {