python之 matplotlib和pandas绘图教程
作者:layman2016 发布时间:2021-07-16 01:50:11
不得不说使用python库matplotlib绘图确实比较丑,但使用起来还算是比较方便,做自己的小小研究可以使用。这里记录一些统计作图方法,包括pandas作图和plt作图。
前提是先导入第三方库吧
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
然后以下这两句用于正常显示中文标签什么的。
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
当然还有一些最基本的步骤:
plt.xticks(x,xtk,size=12,rotation=50) #设置字体大小和字体倾斜度
plt.xlabel(u'城市') # x轴标签
plt.ylabel(u'数量')
plt.title(u'朋友所在城市') # 图的名称
plt.legend() # 正常显示标题
plt.show() # 显示图像
plt.close() # 绘图后养成习惯性的关掉
对于pandas中的二维数据框,可以直接作图(Series类型),简单的折线图或者曲线图如下:
sdata.plot(color='r', style='-o')
plt.show()
如果没有用pandas,直接作曲线图,可以这样写:
plot(x,y, color ='blue', linewidth=2.5, linestyle="--")
1,柱状图
rects1=plt.bar( #(x,data) 就是所要画的二维数据
left=x, #x 是X坐标轴数据,即每个块的x轴起始位置
height=data, #data是Y坐标轴的数据,即每个块的y轴高度
width=[0.1,0.2,0.3], #每一个块的显示宽度
bottom=[1,2,3], #每一个块的底部高度
color='y', #块的颜色
edgecolor='g', #块的边界颜色
linewidth=2, #块的线条宽度
xerr=1, #x轴误差bar
yerr=1, #y轴误差bar
ecolor='r', #误差bar的颜色
capsize=1, #误差bar的线条宽度
orientation='vertical', #块的方向 (horizontal,vertical)
align="center", #块的位置 (center, left, right)
hold=None
)
plt.show()
2,饼图
plot2=plt.pie(data, # 每个饼块的实际数据,如果大于1,会进行归一化,计算percentage
explode=[0.0,0.1,0.2], # 每个饼块离中心的距离
colors=['y','r','g'], # 每个饼块的颜色
labels=['women','men','unknown'], # 每个饼块的标签
labeldistance=1.2, # 每个饼块标签到中心的距离
autopct='%1.1f%%', # 百分比的显示格式
pctdistance=0.4, # 百分比到中心的距离
shadow=True, # 每个饼块是否显示阴影
startangle=0, # 默认从x轴正半轴逆时针起
radius=1.0 # 饼块的半径
)
plt.axis('equal') # 显示为圆形,避免比例压缩为椭圆
plt.show()
3,共享X轴,Y轴左右轴标(帕累托分析图)
数据样例如下,名称为va,类型为Series,左边为职位名称,右边为数量:
sales 4140
technical 2720
support 2229
IT 1227
product_mng 902
marketing 858
RandD 787
accounting 767
hr 739
management 630
作图:
fr = pd.Series(va.values.cumsum() / va.values.sum())
va.plot(kind='bar')
fr.plot(color='r',secondary_y=True, style='-o')
plt.annotate(format(fr[7], '.2%'), xy=(7, fr[7]), xytext=(7*0.9, fr[7]*0.9),
arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=.2')) # 用于注释图形指标
# plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
# plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
# plt1 = plt.pie(va.values,
# labels=va.index,
# autopct='%1.1f%%')
plt.xticks(rotation=50) # 设置字体大小和字体倾斜度
plt.show()
左边为出现的频率,右边为累积百分比(这里数据以降序排列较好,便于直观地观察),效果如下:
在pandas中,曲线图可以直接画,比如data中有多个属性,可以直接使用data.plot()。使用plt,若各个属性需要共用XY轴,那么可以重复plot即可。
4,箱型图
使用pandas画箱型图简单方便,但是注释比较麻烦,可以用annotate添加异常点的注释。若使用之前的数据va,则先创建二维数据框再画图。如果有多个列为数字类型,那么可以画每个列的箱型图,这里只有一列数据,如下:
pd.DataFrame(va).boxplot()
plt.show()
使用plt直接进行作图:
plt.boxplot(data,labels=[],
sym='o',whis=1.5)
其中,data可以是一维的,也可多维,若为多维则lables为每一维度的标签。sym为异常值的形状,whis为调节垂直线段的长度。效果如下:
5,多张图在一张画布中,即多个子图
使用plt:
plt.subplot(221)
plt.plot(x, y1,'r-', lw=2)
plt.subplot(222)
plt.plot(x,y2)
使用pandas:
data.plot(subplots=True, color=['r','b'], style=['-o','-'])
plt.show()
排版方式有不同,pandas是垂直排列,plt可以自己指定位置。pandas效果如下:
补充:Python DataFrame 多条件筛选 使用&
我就废话不多说了,大家还是直接看代码吧~
DF6
Out[42]:
B C D
0 1 B 10.750
1 3 C 8.875
2 2 T 58.000
3 2 L 57.000
4 3 Y 46.000
DF6[(DF6.B>1) & (DF6.D > 10)]
Out[45]:
B C D
2 2 T 58.0
3 2 L 57.0
4 3 Y 46.0
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/layman2016/article/details/79538760
猜你喜欢
- 导语:目前点评“2008年10佳改版网站”也许为时尚早,但2008年毕竟已经过去了9个多月,周四又同时有Twitter和FriendFeed
- 1.使用Qt Design设计一个空白窗口(注意:我是使用MainWindow创建的窗口)2.使用PyUIC将.ui文件转换成.py文件右键
- 如何制作关联的下拉菜单?看看代码:<form name=f1 METHOD="POST">
- 学委前面展示dict的概念和增删查改!这次我们把其他函数介绍补充了。dict 的元素定位(键/值定位)和遍历dict这种对象我们可以通过 k
- 终于开始做用户部分了,先做注册一用户 1.1用户注册 首先在Models里添加用户注册模型类UserRegister 继
- undetected_chromedriver是专门针对浏览器识别做出来的拓展直接使用undetected_chromedriver第三方库
- 一.图像采样处理原理图像采样(Image Sampling)处理是将一幅连续图像在空间上分割成M×N个网格,每个网格用一
- 在做task中,需要将TXT文本中的某一项注释修改,但是python对txt文本只有写入和读取两种操作。我采用的方法是:1.读取txt文件,
- 从本篇开始讲述如何用css实现网页的布局,即如何用css控制网页内各个元素的显示位置。如果你是一个初学者,很可能觉得做一个网页的第一步就是布
- 我使用的python版本是3.5.2今天想做个语音读取的小脚本,在网上查了一下发现python里有个pyttsx可以识别文字,打算通过pip
- 前言网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或
- 写爬虫有一个绕不过去的问题就是验证码,现在验证码分类大概有4种:图像类滑动类点击类语音类今天先来看看图像类,这类验证码大多是数字、字母的组合
- PyQt5窗口布局控件QStackedWidget介绍QTackedWidget是一个堆栈窗口控件,可以填充一些小控件,但是同一时间只有一个
- virtualenv 是一个创建隔绝的Python环境的工具。virtualenv创建一个包含所有必要的可执行文件的文件夹,用来使用Pyth
- 1.基本介绍在OpenCV中,图像通道是按照 B 通道→G 通道→R 通道的顺序存储的。在图像处理过程中,可以根据需要对通道进行拆分和合并。
- 在例子视图中返回文本的方式有点特别,即HTML被直接硬编码在Python代码之中。def current_datetime(request)
- 思路改进原博主文章(Python GUI–Tkinter简单实现个性签名设计)的代码,原先的代码是基于Python2的,我这份代码基于Pyt
- 要防止同一用户同时登陆,首页应该记录在线用户的信息(这里与用户名为例),然后判断正在登陆的用户里面是否已存在。在这里使用一个cache存放已
- 1. 首先导入一些python画图的包,读取txt文件,假设我现在有两个模型训练结果的records.txt文件import numpy a
- 应用场景:1、授权(Authorization)装饰器能有助于检查某个人是否被授权去使用一个web应用的端点(endpoint)。它们被大量