Pandas中DataFrame的常用用法分享
作者:小小鸟爱吃辣条 发布时间:2022-08-10 01:17:49
Pandas是Python中最流行的数据分析和处理工具之一,它提供了一个名为DataFrame的数据结构,可以被认为是一个二维表格或电子表格,其中包含行和列。在本文中,我们将深入探讨Pandas中DataFrame的各种常用的用法,包括创建DataFrame、选择数据、修改数据、数据排序、数据统计、数据合并、数据分组和数据透视表等。
1.创建DataFrame
要创建DataFrame,可以使用Pandas中的DataFrame()函数。下面是一个例子:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
输出:
name age gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M
2.选择数据
在DataFrame中选择数据有几种方法。可以使用loc[]和iloc[]函数,也可以使用布尔索引。下面是一些例子:
# 使用loc[]函数选择数据
print(df.loc[0]) # 选择第一行
print(df.loc[0:2]) # 选择前三行
print(df.loc[0:2, 'name'])# 选择前三行的name列
# 使用iloc[]函数选择数据
print(df.iloc[0]) # 选择第一行
print(df.iloc[0:2]) # 选择前两行
print(df.iloc[0:2, 0]) # 选择前两行的第一列
# 使用布尔索引选择数据
print(df[df['age'] > 30]) # 选择年龄大于30的行
3.修改数据
要修改DataFrame中的数据,可以使用loc[]或iloc[]函数。下面是一个例子:
# 修改数据
df.loc[0, 'age'] = 26
print(df)
# 添加新数据
df.loc[4] = ['Eve', 29, 'F']
print(df)
# 删除数据
df = df.drop(4)
print(df)
4.数据排序
要对DataFrame中的数据进行排序,可以使用sort_values()函数。下面是一个例子:
# 按年龄升序排序
df = df.sort_values('age')
print(df)
# 按年龄降序排序
df = df.sort_values('age', ascending=False)
print(df)
5.数据统计
要对DataFrame中的数据进行统计,可以使用describe()函数和其他函数,例如mean()、median()和std()。下面是一个例子:
# 描述数据
print(df.describe())
# 计算平均年龄
print(df['age'].mean())
# 计算年龄中位数
print(df['age'].median())
# 计算年龄标准差
print(df['age'].std())
6.数据合并
要合并两个DataFrame,可以使用concat()函数。下面是一个例子:
# 创建第二个DataFrame
data2 = {'name': ['Frank', 'Grace'],
'age': [39, 28],
'gender': ['M', 'F']}
df2 = pd.DataFrame(data2)
# 合并两个DataFrame
df = pd.concat([df, df2])
print(df)
7.数据分组
要按某些标准对DataFrame中的数据进行分组,可以使用groupby()函数。下面是一个例子:
# 按性别分组并计算平均年龄
print(df.groupby('gender')['age'].mean())
8.数据透视表
要创建数据透视表,可以使用pivot_table()函数。下面是一个例子:
# 创建数据透视表
print(pd.pivot_table(df, values='age', index='gender', columns='name'))
来源:https://juejin.cn/post/7221969436885008441


猜你喜欢
- 世界疫情数据下载请点击》》:疫情数据下载注:此数据是2022年3月12号的结果,其中透明的地方代表确诊人数小于10万人,白色的地方代表无该国
- 简单的Python代码:用户登录注册利用业余时间,写了一个用户进行登录注册的代码,非常简单。主要实现的功能是:1、可以进行用户登录,在用户进
- 介绍本文将讨论如何快速地从图像中删除文本,作为图像分类器的预处理步骤。删除文本可能有多种或多种原因,例如,我们可以使用无文本图像进行数据增强
- 一、自定义分页1、基础版自定义分页data = []for i in range(1, 302): tmp = {"i
- 列表生成式语法:[x*x for x in range(0,10)] //列表生成式,这里是中括号//结果 [0, 1, 4, 9, 16,
- SQL JOIN 连接SQL JOIN 子句用于把来自两个或多个表的行结合起来,基于这些表之间的共同字段。最常见的 JOIN 类型:SQL
- 本来是想从网上找找有没有现成的爬取空气质量状况和天气情况的爬虫程序,结果找了一会儿感觉还是自己写一个吧。主要是爬取北京包括北京周边省会城市的
- 除了数字,Python中最常见的数据类型就是字符串,无论那种编程语言,字符串无处不在。例如,从用户哪里读取字符串,并将字符串打印到屏幕显示出
- Python Logging原来真的远比我想象的要复杂很多很多,学习路线堪比git。但是又绕不过去,alternatives又少,所以必须要
- 官网:https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads我的系统
- 游标(Cursor)是处理数据的一种方法,为了查看或者处理结果集中的数据,游标提供了在结果集中一次以行或者多行前进或向后浏览数据的能力。我们
- 一、概述在日常使用数据库中,80%的数据请求都是查询,而余下的20%是更新或者增加数据。如何提升查询性能,便是提高数据库处理能力的关键。二、
- 本文实例讲述了python异常和文件处理机制。分享给大家供大家参考,具体如下:1 异常处理Python的异常用tryexceptfinall
- 最近在折腾验证码识别。最终的脚本的识别率在92%左右,9000张验证码大概能识别出八千三四百张左右。好吧,其实是验证码太简单。下面就是要识别
- 引言在Python中但凡提到的赋值运算符其实讲的就是等号=,在编程语言中的等号含义再也不是数学中的1+1=2的这种等号,真实含义是将=右侧的
- pytorch部署到jupyter中在安装Aconda的同时,会将jupyter notebook一起安装,不过这里的jupyter not
- 如下所示:pd.to_datetime(data[data['last_O_XLMC']==data['O_XLMC
- 项目内容:用Python写的糗事百科的网络爬虫。使用方法:新建一个Bug.py文件,然后将代码复制到里面后,双击运行。程序功能:在命令提示行
- 平时再用js写函数的时候,一般都是以惯例 function fn () {} 的方式来声明一个函数,在阅读一些优秀插件的时候又不免见到 va
- 加班时抽空弄的,javascript图片链接定时轮换,自适应图片大小,支持预载,进行了简单封装,方便调用。发现自己还是菜得很,一个简单效果被