网络编程
位置:首页>> 网络编程>> Python编程>> Pandas数据查询的集中实现方法

Pandas数据查询的集中实现方法

作者:柒月烈阳  发布时间:2021-08-17 10:32:27 

标签:Pandas,数据查询

Pandas查询数据的几种方法

  • df.loc方法,根据行、列的标签值查询

  • df.iloc方法,根据行、列的数字位置查询

  • df.where方法

  • df.query方法

.loc既能查询,又能覆盖写入,强烈推荐!

Pandas使用df.loc查询数据的方法

  • 使用单个label值查询数据

  • 使用值列表批量查询

  • 使用数值区间进行范围查询

  • 使用条件表达式查询

  • 调用函数查询

以上查询方法,既使用与行,也适用于列

降维:DataFrame>Series>值

0、进行数据预处理

import pandas as pd

df = pd.read_csv("E:\Python\dataAnalysis\spider\dataFile\weatherData.csv")
# 设置索引为日期
df.set_index("日期", inplace=True)
# print(df.index)
print(df.head())
# 对最高气温和最低气温进行数值改变
try:
   df.loc[:, "最高气温"] = df["最高气温"].str.replace("℃", "").astype("int32")
   df.loc[:, "最低气温"] = df["最低气温"].str.replace("℃", "").astype("int32")
   print(df.head())
except Warning as dw:
   # print(dw)
   pass

Pandas数据查询的集中实现方法

1、使用单个label值查询数据

行或者列,都可以只传入单个值,实现精确匹配

# 使用单个label值查询数据
print(df.loc['2022-12-05 星期一', ['天气', '风向']])
print(type(df.iloc[12]))

Pandas数据查询的集中实现方法

2、使用值列表批量查询

# 使用值列表批量查询
print(df.loc[['2022-12-04 星期日', '2022-12-05 星期一']])

Pandas数据查询的集中实现方法

3、使用数值区间进行范围查询

区间:包含开始,也包含结束

# 使用数值区间进行范围查询
print(df.loc['2022-12-04 星期日':'2022-12-07 星期二', '最高气温':'天气'])

Pandas数据查询的集中实现方法

4、使用条件表达式查询

bool列表的长度得等于行数或者列数

# 使用条件表达式查询
print(df.loc[df["最高气温"] > 7, :])

Pandas数据查询的集中实现方法

5、调用函数查询

# 调用函数查询
print(df.loc[lambda df: (df["最高气温"] < 20) & (df["最低气温"] >= 0), :])

来源:https://blog.csdn.net/qq_42765393/article/details/129231401

0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com