Python中不同图表的数据可视化的实现
作者:海拥 发布时间:2021-02-08 00:58:54
标签:Python,图表,数据,可视化
数据可视化是以图形格式呈现数据。它通过以简单易懂的格式汇总和呈现大量数据,帮助人们理解数据的重要性,并有助于清晰有效地传达信息。
考虑这个给定的数据集,我们将为其绘制不同的图表:
用于分析和呈现数据的不同类型的图表
1.直方图
直方图表示特定现象发生的频率,这些现象位于特定的数值范围内,并以连续和固定的间隔排列。
在下面的代码中绘制直方图Age, Income, Sales
。因此,输出中的这些图显示了每个属性的每个唯一值的频率。
# 导入 pandas 和 matplotlib
import pandas as pd
import matplotlib.pyplot as plt
# 创建上面给出的表的二维数组
data = [['E001', 'M', 34, 123, 'Normal', 350],
['E002', 'F', 40, 114, 'Overweight', 450],
['E003', 'F', 37, 135, 'Obesity', 169],
['E004', 'M', 30, 139, 'Underweight', 189],
['E005', 'F', 44, 117, 'Underweight', 183],
['E006', 'M', 36, 121, 'Normal', 80],
['E007', 'M', 32, 133, 'Obesity', 166],
['E008', 'F', 26, 140, 'Normal', 120],
['E009', 'M', 32, 133, 'Normal', 75],
['E010', 'M', 36, 133, 'Underweight', 40] ]
# 使用上述数据数组创建的数据框
df = pd.DataFrame(data, columns = ['EMPID', 'Gender',
'Age', 'Sales',
'BMI', 'Income'] )
# 为数值数据创建直方图
df.hist()
# show plot
plt.show()
输出:
2. 柱形图
柱形图用于显示不同属性之间的比较,或者它可以显示项目随时间的比较。
# 此处使用之前代码的数据框
# 绘制数值条形图,将显示所有 3 个年龄、收入、销售额之间的比较
df.plot.bar()
# 在 2 个属性之间绘制
plt.bar(df['Age'], df['Sales'])
plt.xlabel("Age")
plt.ylabel("Sales")
plt.show()
输出:
3. 箱线图
箱线图是基于 minimum, first quartile, median, third quartile, and maximum
. 术语“箱线图”来自这样一个事实,即图形看起来像一个矩形,线条从顶部和底部延伸。由于延伸线,这种类型的图有时被称为盒须图。
# 对于数据框的每个数字属性
df.plot.box()
# 单个属性箱线图
plt.boxplot(df['Income'])
plt.show()
输出:
4、饼图
饼图显示一个静态数字以及类别如何代表整体的一部分。饼图以百分比表示数字,所有段的总和需要等于 100%。
plt.pie(df['Age'], labels = {"A", "B", "C",
"D", "E", "F",
"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()
plt.pie(df['Income'], labels = {"A", "B", "C",
"D", "E", "F",
"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()
plt.pie(df['Sales'], labels = {"A", "B", "C",
"D", "E", "F",
"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()
输出:
5、散点图
散点图显示了两个不同变量之间的关系,它可以揭示分布趋势。当有许多不同的数据点,并且您想突出数据集中的相似性时,应该使用它。这在查找异常值和了解数据分布时很有用。
# 收入和年龄之间的散点图
plt.scatter(df['income'], df['age'])
plt.show()
# 收入和销售额之间的散点图
plt.scatter(df['income'], df['sales'])
plt.show()
# 销售额和年龄之间的散点图
plt.scatter(df['sales'], df['age'])
plt.show()
输出 :
来源:https://juejin.cn/post/7129345806313717768
0
投稿
猜你喜欢
- Bottle是一个轻量级的Web框架,此框架只由一个 bottle.py 文件构成,不依赖任何第三方模块。#!/usr/bin/env py
- Python官方文档给出的解释是id(object)Return the “identity” of an object. This is
- 在Python中定义一个数据便在内存中开辟一片空间来存储这个变量的值,这块已经被分配的内存空间便会有一个内存地址。访问这块内存需要用到变量名
- [Python标准库]decimal——定点数和浮点数的数学运算 &n
- 在做视觉设计时,如何高效地使用图标是一门学问:该使用什么样的图标?图标该放在哪里?大小如何?图标的使用是否帮助用户更好更快的理解内容,亦或是
- 合成微缩效果前言图像中的模糊效果可以强烈影响被拍摄场景的感知,模糊在传达所需的尺寸和距离感方面起着重要作用。合成微缩 (miniature
- 在所有的比例中黄金分割是最能引起人的美感的,0.618被公认为最具有审美意义的比例数字。黄金分割之所以那么普遍的流行,我猜一定跟理想女人体的
- 我就废话不多说了,还是直接上代码吧!import osimport xml.dom.minidomimport cv2 as cvImgPa
- 作为一个非设计出生的研究思路偏向的设计师,带着少了设计师自恋和自怜的眼光,我记下最近一年来感受到的交互设计师的尴尬。交互设计师就是出界面的,
- 安装pip install faker使用简单使用本库可生成姓名、地址、电话、邮箱、公司等等一系列数据。首先导入库,实例化:from fak
- 简介python可以做很多事情,虽然它的强项在于进行向量运算和机器学习、深度学习等方面。但是在某些时候,我们仍然需要使用python对外提供
- 本文实例为大家分享了python实现名片管理系统的具体代码,供大家参考,具体内容如下名片管理系统前提:实现名片管理系统,首先要创建两个pyt
- 例如,有一个字典如下:>>> dic = {"name": "botoo",&qu
- if rs.bof then 表示:当前指针的位置是在第一行记录之前 if rs.eof then 表示:当前指针的位置是在最后一行记录之后
- pytorch 预训练模型读取修改相关参数的填坑修改部分层,仍然调用之前的模型参数。resnet = resnet50(pretrained
- 目录前言cv2.drawMarker()函数说明参数说明利用鼠标回调函数交互式画点例1,简单的例子例2,删除功能总结前言这里所谓画点的意思是
- 用的昨天刚接触到的库,在windows下通过paramiko来登录linux系统并执行了几个命令,基本算是初试成功,后面会接着学习的。代码:
- 我使用的是anaconda安装的环境,其中有一个是h5py,自动安装的是2.7.0的版本,这个版本会导致保存模型时python奔溃。cond
- *args 和 **kwargs首先,要知道的是并不是必须写成*args和**kwargs。 只有变量前⾯的*才是必须的。所以,你也可以写成
- import urllib.parse,os.path,time,sys,re,urllib.requestfrom http.client