Python编程使用matplotlib挑钻石seaborn画图入门教程
作者:微小冷 发布时间:2021-04-12 18:28:17
挑钻石第二弹
seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()
进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache
设为True
。
scatter_plot
官方的示例就很不错,绘制了diamonds
数据集中的钻石数据。diamonds
中总共包含十项数据,分别是重量/克拉、切割水平、颜色、透明度、深度、table、价格以及x、y、z方向的尺寸。
我们可以先来看看x
和y
方向的尺寸是否有一定的相关性
import seaborn as sns
import matplotlib.pyplot as plt
# 本地加载数据集
dia = sns.load_dataset("diamonds",data_home="seaborn-data", cache=True)
# 以上几行代码后面不再重复书写
sns.scatterplot(x=dia['x'],y=dia['y'],size=5)
plt.show() #用于显示图片,后文就不写了
其中x
,y
分别代表x轴和y轴数据,可见一般钻石还是比较规则的。
官方画廊绘制的图像如下
这个图的横坐标是重量(克拉),纵坐标是价格,我们发现钻石商人大多有强迫症,因为2.0克拉、1.5克拉、1.0克拉这种整十整五的钻石比周围重量的钻石更多。。。
f, ax = plt.subplots(figsize=(6.5, 6.5))
sns.set_theme(style="whitegrid")
sns.despine(f, left=True, bottom=True)
clarity = ["I1", "SI2", "SI1", "VS2", "VS1", "VVS2", "VVS1", "IF"] #颜色深浅的顺序
sns.scatterplot(x="carat", y="price", #声明x轴和y轴的值
hue="clarity", size="depth", #clarity和depth分别调控颜色和尺寸
palette="ch:rot=-.2,d=.3_r", #调色板
style_order=clarity,sizes=(1,10), #颜色标识的顺序和尺寸范围
linewidth=0,data=dia, ax=ax)
plt.show()
首先,set_theme
用于设置主题,其中style
可以输入字符串或者字典,可调整主题风格。
其次,palette
代表颜色映射,当其输入值为字符串时,其含义为
缩写 | 取值范围 | ||
---|---|---|---|
start | s | [0,3] | 渐变始点颜色 |
rot | r | 用于调控色相 | |
gamma | g | 不小于0 | 小于1时,提高暗部;大于1时,加强高光 |
hue | h | [0,1] | Saturation of the colors. |
dark | d | [0,1] | 最暗处的强度 |
light | l | [0,1] | 最亮处颜色的强度 |
sizes
用于调整点的尺寸,当设置size
时,将size
中的值对应到ssizes
中从而绘图。
我们注意到钻石属性中有一个是切割水平,那么接下来绘制一下切割水平和价格的关系。
fig, ax = plt.subplots(figsize=(6.5, 6.5))
sns.set_theme(style="whitegrid")
sns.despine(fig, left=True, bottom=True)
sns.scatterplot(data = dia, x="carat", y="price",
style="cut",hue='cut',
linewidth=0)
plt.show()
果然把渐变颜色去掉之后颜值狂掉,但同时可以发现,这个very good
显然不是最好的切割等级,毕竟在3.0克拉级别的钻石中,有一颗very good级别的钻石买到了最低价。GIA评估的钻石等级为Excellent,Very Good,Good,Fair到最差Poor,可能在这个数据集中,ideal
就代表了Excellent
吧。
lmplot
如果想更准确地观察cut
对钻石价格的影响,可以通过lmplot
在散点图的基础上绘制一个趋势线出来。
sns.lmplot(data=dia, x="carat", y="price",hue='cut',markers = '.')
plt.show()
这样一看就发现果然ideal
的钻石是最好的。
jointplot
以上诸图,都是消费者最关心的问题——价格、尺寸以及透明度等。但商家最关心的可能是价格、重量与销售量的关系,这就涉及到一个分布的问题。而seaborn提供了一个非常好的双变量关系图——jointplot,效果如下
可见,还是便宜的钻石比较火爆,代码分别为
# 左图代码
sns.jointplot(data=dia, x="carat", y="price",xlim=(0,3),ylim=(0,17500), ratio=10,kind='hex',color="#4CB391")
# 右图代码
sns.jointplot(data=dia, x="carat", y="price",hue='cut', xlim=(0,3),ylim=(0,17500), ratio=10,marker='.')
其中,kind
用于更改图像的风格,sns
提供了六种风格:"scatter
" "kde
" "hist
" "hex
" "reg
" "resid
"。
来源:https://blog.csdn.net/m0_37816922/article/details/120884878


猜你喜欢
- 昨天群里介绍了一个专门帮你PS图片的网站。吐司网。网站在图片的预览处理上有点意思。当鼠标经过图片,显示为处理过的图片。这样大家能很清晰的对比
- 问:假如我的一个表里含有(a,b,c,d)和(a,b)形成组合键。我能在列值中写这个查询吗?例如: select a,c,d from my
- 一、问题描述最近遇到一个问题,也就是使用分区表进行数据查询/加载的时候比普通表的性能下降了约50%,主要瓶颈出现在CPU,既然是CPU瓶颈理
- 1969年8月8日,在北京协和医院降生了一个漂亮的小女孩。接生的阿姨说,她的声音这么大,好象想要全世界的人都听到。后来,她的父亲为她取了一个
- "^/d+$" //非负整数(正整数 + 0)"^[0-9]*[1-9][0-9]*$" //正整数
- 本文实例讲述了python使用urlparse分析网址中域名的方法。分享给大家供大家参考。具体如下:这里给定网址,通过下面这段python代
- SQL中的单记录函数 1.ASCII 返回与指定的字符对应的十进制数; SQL> select ascii('A')
- 在cmd输入:python -m django --version来源:https://blog.csdn.net/ShellDawn/ar
- Python3的 元组(Tuple)Python 的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号 ( ),列表使用方括号
- 如下所示:screen.widthscreen.heightscreen.availHeight //获取去除状态栏后的屏幕高度screen
- Python能够干嘛?可以做日常任务,比如自动备份你的MP3;可以做网站,很多著名的网站像知乎、YouTube就是Python写的;可以做网
- 这些导航菜单来自于Dribbble网站,出自于世界各地的优秀设计师之手,涵盖了各种不同的风格,个个都非常精美。这里我将这些导航菜单展示出来,
- 本文从树数据结构说到二叉堆数据结构,再使用二叉堆的有序性对无序数列排序。1. 树树是最基本的数据结构,可以用树映射现实世界中一对多的群体关系
- 先建立2个测试表,在id列上创建unique约束。 mysql> create table test1(id int,name var
- 介绍今天有个不正经的需求,就是要快速做一个restful api的性能测试,要求测试在海量作业数据的情况下客户端分页获取所有作业的性能。因为
- 用Python实现学生信息管理系统,供大家参考,具体内容如下系统功能有:1.录入,查找,删除,修改学生信息2.学生成绩排名3.显示全部学生信
- 下面有python教程栏目为大家建立一个完美的python项目,希望可以帮助到大家,一起讨论进步~当开始一个新的 Python 项目时,大家
- 冒泡的表现近期用vue做了一个需求,大概是同一个区域,点击不同位置有不同的响应函数,还有个总的响应函数,好吧,如下图所示:他们的DOM结构如
- 本文实例讲述了Python构建XML树结构的方法。分享给大家供大家参考,具体如下:1.构建XML元素#encoding=utf-8from
- 使用python写爬虫时,优选selenium,由于PhantomJS因内部原因已经停止更新,最新版的selenium已经使用headles