一行代码生成Tableau可视化图表的方法
作者:局外人一枚 发布时间:2022-09-21 12:01:47
今天给大家介绍一个十分好用的Python模块,用来给数据集做一个初步的探索性数据分析(EDA),有着类似Tableau的可视化界面,我们通过对于字段的拖拽就可以实现想要的可视化图表,使用起来十分的简单且容易上手,学习成本低,并且不需要我们写一大推冗长的代码。
PyGWalker
接下来就给大家来介绍一下这款名叫PyGWalker的Python模块,在使用之前,我们先通过pip命令来将其下载安装,代码如下
pip install pygwalker
## 或者是
conda install pygwalker
我们将其与pandas模块相结合,毕竟我们这里还是需要它来读取CSV数据集的,这是一份共享单车的用户使用数据,代码如下
import pandas as pd
import pygwalker as pyg
模块导入完成之后便是对数据集的读取了,代码如下
df = pd.read_csv(r"bike_sharing_dc.csv", parse_dates=['date'])
df.head()
output
接下去便是PyGWalker该登场的时候了,代码如下
pyg.walk(df)
output
我们随后变回看到如上图所示的界面,是不是和Tableau的界面很像呢,同样在左边的一栏中,我们可以看到数据集中各个字段,被分成了离散型变量(categorical data)和数值型变量(numeric data)
绘制可视化图表
接下来我们尝试来绘制可视化图表,拖拽当中的字段放置到X轴或者Y轴当中,就会有可视化图表显示出来
那么我们可以尝试绘制不同形态的图标,例如我们想要绘制折线图,例如我们在横轴放置的是“hour”这个离散型变量,"registered"字段也就是注册量作为纵轴,来查看不同时间段之下单车的使用量情况,同时在“Color”这一栏中放置的是“season”变量,代表的是不同的季节当中,不同时间段的单车App的注册量情况
我们将图表的形态变成区域图,
同时我们还可以来更改图表的大小,操作起来也十分的方便
过滤数据
这里我们还可以来过滤数据,主要是在filter这一栏来进行操作,要是将离散型变量拖拽过去的话,可以指定筛选的条件是哪些,例如只查看“春天”和“夏天”这两者的数据,然后图表依据筛选出来的条件来呈现最终的样子
那么要是将数值型变量拖拽过去的话,会出来一个横向的数轴并且设定横轴的上下限,那么最终的图表也会根据筛选出来的条件来呈现最终的样子
查看原始数据
最后要是我们想要查看原始数据,PyGWalker模块也提供了非常方便的途径,点击当中的“Data”选项
来源:https://blog.csdn.net/weixin_42814075/article/details/129813221
猜你喜欢
- 在 Python 中对一个可迭代对象进行排序是很常见的一个操作,一般会用到 sorted() 函数num_list = [4, 2, 8,
- 这个系列记录我在一年vue开发中总结的一些经验和技巧。利用Object.freeze()提升性能Object.freeze()是ES5新增的
- 马上就是圣诞节了,先提前祝大家圣诞快乐!:christmas_tree::christmas_tree::christmas_t
- 1、从数据库表中检索信息实际上,前面我们已经用到了SELECT语句,它用来从数据库表中检索信息。select语句格式一般为:SELECT 检
- 本文实例讲述了Python实现的简单hangman游戏。分享给大家供大家参考。具体如下:#!/usr/bin/env pythonimpor
- 使用一个遵循buffer protocol的对象就可以和numpy交互了.这个buffer_protocol要有哪些东西呢? 要有如下接口:
- 需求:对于一个python list 或者numpy数组,我需要找到这个list中最大的K个数及其对应的下标。解决方式:1. 可以构造字典通
- 本文实例讲述了MySQL定时备份数据库操作。分享给大家供大家参考,具体如下:1. 查看mysqldumproot@laowang:/# wh
- 01 InnoDB ReplicaSet(副本集)介绍 在MySQL8.0引入了InnoD
- Translate From:stevesouders原文:高性能网站设计:不要使用@import在高性能网站设计的第五章,我简要的提到@i
- 运行环境: python 3.6.0今天处于练习的目的,就用 python 写了一个百度翻译,是如何做到的呢,其实呢就是拿到接口,通过这个接
- Pandas中对 时间 这个属性的处理有非常非常多的操作。而本文对其中一个大家可能比较陌生的方法进行讲解。其他的我会陆续上传。应用情景是这样
- 流式布局流式布局,也叫做瀑布流布局,是网页中经常使用的一种页面布局方式,它的原理就是将高度固定,然后图片的宽度自适应,这样加载出来的图片看起
- 为网页设置防火墙的主要目的是根据网页内容对不同来访者提供不同的服务,利用Java Script或VB Script,我们很容易做到这一点。但
- 前言本文使用 cpu 版本的 tensorflow 2.4 ,选用 Keras Tuner 工具以 Fashion 数据集的分类任务为例,完
- 本文实例为大家分享了vue实现页面添加水印的具体代码,供大家参考,具体内容如下js文件建一个watermark.js文件let setWat
- 环境: python 2.7 + win10工具:fiddler postman 安卓模拟器首先,打开fiddler,fiddler作为ht
- 本文介绍以下内容:1. 使用transformers框架做预训练的bert-base模型;2. 开发平台使用Google的Colab平台,白
- 前言ECMAScript 6.0(以下简称 ES6)是 JavaScript 语言的下一代标准,已经在2015年6月正式发布了。它的目标,是
- 本文以实例形式讲述了Python中replace方法,很有实用价值,具体如下:replace方法主要有两种:last_date = &quo