Python seaborn barplot画图案例
作者:qq_45759229 发布时间:2023-11-07 00:50:55
标签:Python,seaborn,barplot,画图
默认barplot
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
sns.set_theme(style="whitegrid")
df = sns.load_dataset("tips")
#默认画条形图
sns.barplot(x="day",y="total_bill",data=df)
plt.show()
#计算平均值看是否和条形图的高度一致
print(df.groupby("day").agg({"total_bill":[np.mean]}))
print(df.groupby("day").agg({"total_bill":[np.std]}))
# 注意这个地方error bar显示并不是标准差
total_bill
mean
day
Thur 17.682742
Fri 17.151579
Sat 20.441379
Sun 21.410000
total_bill
std
day
Thur 7.886170
Fri 8.302660
Sat 9.480419
Sun 8.832122
使用案例
# import libraries
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
# load dataset
tips = sns.load_dataset("tips")
# Set the figure size
plt.figure(figsize=(14, 8))
# plot a bar chart
ax = sns.barplot(x="day", y="total_bill", data=tips, estimator=np.mean, ci=85, capsize=.2, color='lightblue')
修改capsize
ax=sns.barplot(x="day",y="total_bill",data=df,capsize=1.0)
plt.show()
显示error bar的值
import seaborn as sns
import matplotlib.pyplot as plt
sns.set_theme(style="whitegrid")
df = sns.load_dataset("tips")
#默认画条形图
ax=sns.barplot(x="day",y="total_bill",data=df)
plt.show()
for p in ax.lines:
width = p.get_linewidth()
xy = p.get_xydata() # 显示error bar的值
print(xy)
print(width)
print(p)
[[ 0. 15.85041935]
[ 0. 19.64465726]]
2.7
Line2D(_line0)
[[ 1. 13.93096053]
[ 1. 21.38463158]]
2.7
Line2D(_line1)
[[ 2. 18.57236207]
[ 2. 22.40351437]]
2.7
Line2D(_line2)
[[ 3. 19.66244737]
[ 3. 23.50109868]]
2.7
Line2D(_line3)
annotata error bar
fig, ax = plt.subplots(figsize=(8, 6))
sns.barplot(x='day', y='total_bill', data=df, capsize=0.2, ax=ax)
# show the mean
for p in ax.patches:
h, w, x = p.get_height(), p.get_width(), p.get_x()
xy = (x + w / 2., h / 2)
text = f'Mean:\n{h:0.2f}'
ax.annotate(text=text, xy=xy, ha='center', va='center')
ax.set(xlabel='day', ylabel='total_bill')
plt.show()
error bar选取sd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set_theme(style="whitegrid")
df = sns.load_dataset("tips")
#默认画条形图
sns.barplot(x="day",y="total_bill",data=df,ci="sd",capsize=1.0)## 注意这个ci参数
plt.show()
print(df.groupby("day").agg({"total_bill":[np.mean]}))
print(df.groupby("day").agg({"total_bill":[np.std]}))
total_bill
mean
day
Thur 17.682742
Fri 17.151579
Sat 20.441379
Sun 21.410000
total_bill
std
day
Thur 7.886170
Fri 8.302660
Sat 9.480419
Sun 8.832122
设置置信区间(68)
import seaborn as sns
import matplotlib.pyplot as plt
sns.set_theme(style="whitegrid")
df = sns.load_dataset("tips")
#默认画条形图
sns.barplot(x="day",y="total_bill",data=df,ci=68,capsize=1.0)## 注意这个ci参数
plt.show()
设置置信区间(95)
import seaborn as sns
import matplotlib.pyplot as plt
sns.set_theme(style="whitegrid")
df = sns.load_dataset("tips")
#默认画条形图
sns.barplot(x="day",y="total_bill",data=df,ci=95)
plt.show()
#计算平均值看是否和条形图的高度一致
print(df.groupby("day").agg({"total_bill":[np.mean]}))
total_bill
mean
day
Thur 17.682742
Fri 17.151579
Sat 20.441379
Sun 21.410000
dataframe aggregate函数使用
#计算平均值看是否和条形图的高度一致
df = sns.load_dataset("tips")
print("="*20)
print(df.groupby("day").agg({"total_bill":[np.mean]})) # 分组求均值
print("="*20)
print(df.groupby("day").agg({"total_bill":[np.std]})) # 分组求标准差
print("="*20)
print(df.groupby("day").agg({"total_bill":"nunique"})) # 这里统计的是不同的数目
print("="*20)
print(df.groupby("day").agg({"total_bill":"count"})) # 这里统计的是每个分组样本的数量
print("="*20)
print(df["day"].value_counts())
print("="*20)
====================
total_bill
mean
day
Thur 17.682742
Fri 17.151579
Sat 20.441379
Sun 21.410000
====================
total_bill
std
day
Thur 7.886170
Fri 8.302660
Sat 9.480419
Sun 8.832122
====================
total_bill
day
Thur 61
Fri 18
Sat 85
Sun 76
====================
total_bill
day
Thur 62
Fri 19
Sat 87
Sun 76
====================
Sat 87
Sun 76
Thur 62
Fri 19
Name: day, dtype: int64
====================
dataframe aggregate 自定义函数
import numpy as np
import pandas as pd
df = pd.DataFrame({'Buy/Sell': [1, 0, 1, 1, 0, 1, 0, 0],
'Trader': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C']})
print(df)
def categorize(x):
m = x.mean()
return 1 if m > 0.5 else 0 if m < 0.5 else np.nan
result = df.groupby(['Trader'])['Buy/Sell'].agg([categorize, 'sum', 'count'])
result = result.rename(columns={'categorize' : 'Buy/Sell'})
result
Buy/Sell Trader
0 1 A
1 0 A
2 1 B
3 1 B
4 0 B
5 1 C
6 0 C
7 0 C
dataframe aggregate 自定义函数2
df = sns.load_dataset("tips")
#默认画条形图
def custom1(x):
m = x.mean()
s = x.std()
n = x.count()# 统计个数
#print(n)
return m+1.96*s/np.sqrt(n)
def custom2(x):
m = x.mean()
s = x.std()
n = x.count()# 统计个数
#print(n)
return m+s/np.sqrt(n)
sns.barplot(x="day",y="total_bill",data=df,ci=95)
plt.show()
print(df.groupby("day").agg({"total_bill":[np.std,custom1]})) # 分组求标准差
sns.barplot(x="day",y="total_bill",data=df,ci=68)
plt.show()
print(df.groupby("day").agg({"total_bill":[np.std,custom2]})) #
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pkCx72ui-1658379974318)(output_24_0.png)]
total_bill
std custom1
day
Thur 7.886170 19.645769
Fri 8.302660 20.884910
Sat 9.480419 22.433538
Sun 8.832122 23.395703
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GFyIePmW-1658379974318)(output_24_2.png)]
total_bill
std custom2
day
Thur 7.886170 18.684287
Fri 8.302660 19.056340
Sat 9.480419 21.457787
Sun 8.832122 22.423114
seaborn显示网格
ax=sns.barplot(x="day",y="total_bill",data=df,ci=95)
ax.yaxis.grid(True) # Hide the horizontal gridlines
ax.xaxis.grid(True) # Show the vertical gridlines
seaborn设置刻度
fig, ax = plt.subplots(figsize=(10, 8))
sns.barplot(x="day",y="total_bill",data=df,ci=95,ax=ax)
ax.set_yticks([i for i in range(30)])
ax.yaxis.grid(True) # Hide the horizontal gridlines
使用其他estaimator
#estimator 指定条形图高度使用相加的和
sns.barplot(x="day",y="total_bill",data=df,estimator=np.sum)
plt.show()
#计算想加和看是否和条形图的高度一致
print(df.groupby("day").agg({"total_bill":[np.sum]}))
'''
total_bill
sum
day
Fri 325.88
Sat 1778.40
Sun 1627.16
Thur 1096.33
'''
来源:https://blog.csdn.net/qq_45759229/article/details/125905921
0
投稿
猜你喜欢
- 最近被“模块化”缠身,又是文章又是PPT的,被逼着想了很多相关的东西。整理下我这段时间对于“模块化”的思考,大多都是我自己从事页面重构这份工
- SqlBulkCopy 来自数据源的 String 类型的给定值不能转换为指定目标列的类型 nvarchar。 在网上找了下,大都说是因为数
- Function closeUBB(strContent) '*************************
- 下表列出 SQL Server 查询分析器提供的所有键盘快捷方式。活动 快捷方式 书签:清除所有书签。 CTRL-SHIFT-F2
- Macromedia StandardMacromedia Dreamweaver MXMenu Commandsphotoshop快捷键大
- <!--这是一个主页文件--><html><head><meta http-equiv="
- 1、很多B2C或者淘宝的卖家反应,下单了但没有支付的占有率超过30%,有的甚至到40%。对于冲动性消费的商品来说,这个70%左右的转化率其实
- 原文地址:30 Days of Mootools 1.2 Tutorials - Day 22 - Fx.Elements通过
- 如何阻止别人非法链接你网站的图片,防盗链?getimage.asp<% Option ExplicitDim&nb
- 这篇文章主要介绍了python numpy数组中的复制知识解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,
- 一、数据可视化1.pyecharts介绍官方网址:https://pyecharts.org/#/zh-cn/intro📣 概况:Echar
- 代码如下:<%@ Language=VBScript %> <% Dim 
- WordPress 的插件机制实际上只的就是这个 Hook 了,它中文被翻译成钩子,允许你参与 WordPress 核心的运行,是一个非常棒
- 我认为多选列表具有完美的功能——只需按下Ctrl键,同时点击鼠标从列表中选择多个项目。以下是一个典型的多选列表框:选出你最喜爱的快餐:&nb
- 概要说明:自动更新程序主要负责从服务器中获取相应的更新文件,并且把这些文件下载到本地,替换现有的文件。达到修复Bug,更新功能的目的。本文作
- 我从11岁开始编程,并且一直都很喜欢技术和编程。这些是我一直以来获得的经验教训。作为一个程序员,你可能需要这样的忠告。我更希望每个人在获取这
- 一般用 createProcessingInstruction 方法创建处理指令指定参数为 "xml","ve
- write2vin 的 PPT原文路宛兮写的简介:本文解释了以下问题: 1.什么是用户体验? 2.谁发明了这个术语?他想表达什么意思? 3.
- 方法来源于土豆网的导航,在这里纪录一下实现的思路。主要是利用 position 属性的 absolute 和 relative 配
- 兼容当前HTML/XHTML文档是否有DTD声明:以下为程序代码:var xtop = document.documentElement.s