Pandas中DataFrame的常用用法分享
作者:小小鸟爱吃辣条 发布时间:2022-08-10 01:17:49
Pandas是Python中最流行的数据分析和处理工具之一,它提供了一个名为DataFrame的数据结构,可以被认为是一个二维表格或电子表格,其中包含行和列。在本文中,我们将深入探讨Pandas中DataFrame的各种常用的用法,包括创建DataFrame、选择数据、修改数据、数据排序、数据统计、数据合并、数据分组和数据透视表等。
1.创建DataFrame
要创建DataFrame,可以使用Pandas中的DataFrame()函数。下面是一个例子:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
输出:
name age gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M
2.选择数据
在DataFrame中选择数据有几种方法。可以使用loc[]和iloc[]函数,也可以使用布尔索引。下面是一些例子:
# 使用loc[]函数选择数据
print(df.loc[0]) # 选择第一行
print(df.loc[0:2]) # 选择前三行
print(df.loc[0:2, 'name'])# 选择前三行的name列
# 使用iloc[]函数选择数据
print(df.iloc[0]) # 选择第一行
print(df.iloc[0:2]) # 选择前两行
print(df.iloc[0:2, 0]) # 选择前两行的第一列
# 使用布尔索引选择数据
print(df[df['age'] > 30]) # 选择年龄大于30的行
3.修改数据
要修改DataFrame中的数据,可以使用loc[]或iloc[]函数。下面是一个例子:
# 修改数据
df.loc[0, 'age'] = 26
print(df)
# 添加新数据
df.loc[4] = ['Eve', 29, 'F']
print(df)
# 删除数据
df = df.drop(4)
print(df)
4.数据排序
要对DataFrame中的数据进行排序,可以使用sort_values()函数。下面是一个例子:
# 按年龄升序排序
df = df.sort_values('age')
print(df)
# 按年龄降序排序
df = df.sort_values('age', ascending=False)
print(df)
5.数据统计
要对DataFrame中的数据进行统计,可以使用describe()函数和其他函数,例如mean()、median()和std()。下面是一个例子:
# 描述数据
print(df.describe())
# 计算平均年龄
print(df['age'].mean())
# 计算年龄中位数
print(df['age'].median())
# 计算年龄标准差
print(df['age'].std())
6.数据合并
要合并两个DataFrame,可以使用concat()函数。下面是一个例子:
# 创建第二个DataFrame
data2 = {'name': ['Frank', 'Grace'],
'age': [39, 28],
'gender': ['M', 'F']}
df2 = pd.DataFrame(data2)
# 合并两个DataFrame
df = pd.concat([df, df2])
print(df)
7.数据分组
要按某些标准对DataFrame中的数据进行分组,可以使用groupby()函数。下面是一个例子:
# 按性别分组并计算平均年龄
print(df.groupby('gender')['age'].mean())
8.数据透视表
要创建数据透视表,可以使用pivot_table()函数。下面是一个例子:
# 创建数据透视表
print(pd.pivot_table(df, values='age', index='gender', columns='name'))
来源:https://juejin.cn/post/7221969436885008441
猜你喜欢
- 首先,先确认一下你的字段值是不是乱码,如果是,按照以下方法:我的字段值是来自于一个geojson字符串,我在对它解析时做了如下处理:prop
- 一、代码注释介绍注释就是对代码的解释和说明,其目的是让人们能够更加轻松地了解代码。注释是编写程序时,写程序的人给一个语句、程序段、函数等的解
- 这篇文章主要介绍了python重要函数eval多种用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要
- 本文实例讲述了Python3.4列表、数组操作。分享给大家供大家参考,具体如下:python列表,数组类型要相同,python不需要指定数据
- 最近在学习tensorflow框架,在ubuntu下用到python的一个ide --spyder,以下是常用快捷键Ctrl+1:注释/撤销
- 一、安装环境gym是用于开发和比较强化学习算法的工具包,在python中安装gym库和其中子场景都较为简便。安装gym:pip instal
- 记录下Django关于日期的配置,以及如何根据日期滚动切割日志的问题。配置的源码在githun上 https://github.com/bl
- 一、property的装饰器用法先简单上个小栗子说明:class property(fget=None,fset=None,fdel=Non
- 第一招、mysql服务的启动和停止net stop mysqlnet start mysql第二招、登陆mysql语法如下: mysql -
- SQL Server 2005的新功能为动态管理对象,它们是在指定时间返回某个数据库实例的特殊状态信息的数据库视图或函数。这些对象允许数据库
- 本文实例为大家分享了python实现学生信息管理系统的具体代码,供大家参考,具体内容如下学生管理系统的开发步骤:1、显示学生管理系统的功能菜
- 如下所示:import numpy as npimport pandas as pdfrom pandas import Sereis, D
- 在php中获取数组长度方法很简单,php为我们提供了两个函数可以计算一维数组长度,如count,sizeof都可以直接统计数组长度哦,下面我
- 详解Python 模拟实现生产者消费者模式的实例散仙使用python3.4模拟实现的一个生产者与消费者的例子,用到的知识有线程,队列,循环等
- 生成txt文件:mesg = "hello world"with open("test.txt",
- 一、背景 今天闲着无事,写了一个小小的Python脚本程序,然后给同学炫耀的时候,发现每次都得拉着其他人过来看着自己的电脑屏幕,感觉不是很爽
- 简介:记录一下关于 Python 环境软件包的一些安装步骤1、升级 Python 到 2.7.10( 默认 2.6.6 )shell >
- 以下是涉及到插入表格的查询的5种改进方法:1)使用LOAD DATA INFILE从文本下载数据这将比使用插入语句快20倍。2)使用带有多个
- 1.什么是局部视图局部视图是在其他视图中呈现的视图。通过执行局部视图生成的HTML输出呈现在调用视图中。与视图一样,局部视图使用 .csht
- HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送WWW方式的数据,关于HTTP协议的详细内容