位置：首页>> 网络编程>> Python编程>> 详细介绍在pandas中创建category类型数据的几种方法

详细介绍在pandas中创建category类型数据的几种方法

作者：一个处女座的程序猿　　发布时间：2023-01-13 15:40:57　

标签：pandas,创建,category

在pandas中创建category类型数据的几种方法之详细攻略

T1、直接创建 category类型数据
可知，在category类型数据中，每一个元素的值要么是预设好的类型中的某一个，要么是空值（np.nan）。

T2、利用分箱机制(结合max、mean、min实现二分类)动态添加 category类型数据

输出结果
[NaN, 'medium', 'medium', 'fat']
Categories (2, object): ['medium', 'fat']
   name    ID age age02 ... weight    test01    test02 age02_mark
0   Bob     1 NaN     14 ... 140.5 1.000000 1.000000      Minors
1 LiSa     2   28     26 ... 120.8 2.123457 2.123457      Adults
2 Mary         38     24 ... 169.4 3.123457 3.123457      Adults
3 Alan None           6 ... 155.6 4.123457 4.123457      Minors

[4 rows x 12 columns]

实习代码

import pandas as pd
import numpy as np

contents={"name": ['Bob', 'LiSa', 'Mary', 'Alan'],
"ID": [1, 2, ' ', None], # 输出 NaN
"age": [np.nan, 28, 38 , '' ], # 输出
"age02": [14, 26, 24 , 6],
"born": [pd.NaT, pd.Timestamp("1990-01-01"), pd.Timestamp("1980-01-01"), ''], # 输出 NaT
"sex": ['男', '女', '女', None,], # 输出 None
"hobbey":['打篮球', '打羽毛球', '打乒乓球', '',], # 输出
"money":[200.0, 240.0, 290.0, 300.0], # 输出
"weight":[140.5, 120.8, 169.4, 155.6], # 输出
"test01":[1, 2.123456789, 3.123456781011126, 4.123456789109999], # 输出
"test02":[1, 2.123456789, 3.123456781011126, 4.123456789109999], # 输出
}
data_frame = pd.DataFrame(contents)

# T1、直接创建 category类型数据
weight_mark=pd.Categorical(['thin','medium','medium','fat'],categories=['medium','fat'])
print(weight_mark)

# T2、利用分箱机制(结合max、mean、min实现二分类)动态添加 category类型数据
col_age_des=pd.Series(data_frame['age02']).describe()
age_ranges=[col_age_des['min']-1,col_age_des['mean'],col_age_des['max']+1]
age_labels=['Minors','Adults'] # 高于平均值的为胖
data_frame['age02_mark']=pd.cut(data_frame['age02'],age_ranges,labels=age_labels)
print(data_frame)

来源：https://blog.csdn.net/qq_41185868/article/details/115314188

0

投稿

猜你喜欢

Python实现的凯撒密码算法示例
本文实例讲述了Python实现的凯撒密码算法。分享给大家供大家参考，具体如下：一介绍凯撒密码是一种非常古老的加密方法，相传当年凯撒大地行军
Python 寻找局部最高点的实现
我就废话不多说了，直接上代码吧！# 寻找局部最高点# 输入input: 含有最高点高度的列表# 输出output: 返回最高点的位置# 时间
vue组件定义，全局、局部组件，配合模板及动态组件功能示例
本文实例讲述了vue组件定义，全局、局部组件，配合模板及动态组件功能。分享给大家供大家参考，具体如下：一、定义一个组件定义一个组件:1. 全
解决pycharm回车之后不能换行或不能缩进的问题
如果不小心按到键盘上的Insert键的话，光标显示的就不是一条竖线，而是一个类似方块的阴影区域，比如插入一下insert键的介绍：它叫插入键
python中startswith()和endswith()的用法详解
startswith()方法Python startswith() 方法用于检查字符串是否是以指定子字符串开头如果是则返回 True，否则返
Oracle学习笔记(六)
一、oracle oracle服务器有Oracle instace 和Oracle database instance有memory str
javascript中解析四则运算表达式的算法和示例
在编写代码时我们有时候会碰到需要自己解析四则运算表达式的情况，本文简单的介绍使用JavaScript实现对简单四则运算表达式的解析。一、熟悉
网页设计中怎么将px换成em
在这系列视觉设计的文章间隙插一篇字体单位的文章。前文说了，字体单位应该用em而不用px，原因简单来说就是支持IE6下的字体缩放，在页面中按c
go语言的变量定义示例详解
前言特别说明: 本文只适合新手学习这篇文章带我们入门go语言的定义变量的方式，其实和javascript很相似，所以特意总结在此。在go语言
在Python的Flask框架中使用日期和时间的教程
时间戳的问题我们的微博应用的一个忽略了很久的问题就是日间和日期的显示。直到现在，我们在我们的User和Post对象中使用Pyth
关于配置babel-plugin-import报错的坑及解决
配置babel-plugin-import报错的坑用的是antd design vue生成的项目，按着官网的提示一步一步下来，在配置babe
如何用python合并多个excel文件
目录安装模块XlsxWriter 示例合并Excel数据表头都一样的 excel表头都不一样的 excel表头都不一样的 excel安装模块
Python实现把json格式转换成文本或sql文件
python如何将json格式的数据快速的转化成指定格式的数据呢？或者转换成sql文件？下面的例子是将json格式的数据准换成以#_#分割的
MySQL数据库升级的一些"陷阱"
对于商业数据库而言，数据库升级是一个优先级很高的事情，有版本升级路线图，有相应的补丁，而且对于方案还有一系列的演练，显然是一场硬仗。而在My
sql 取代游标的写法示例
Update Tb_Garden1 G Set Steward = (Select Id From Zyq.Tb_User U Where
Golang中由零值和gob库特性引起BUG解析
起源就在今年9月份，我负责的部门平台项目发布了一个新版本，该版本同时上线了一个新功能，简单说有点类似定时任务。头一天一切正常，但第二天出现了
解决Django数据库makemigrations有变化但是migrate时未变动问题
写models.py时缺少了一个 verbose_name，导致数据库出现问题，整了很久，摸索出重新建立数据库的方法：首先删除每个app中的
vue中如何引入html静态页面
vue中引入html静态页面功能：系统中需增加帮助中心页面，由于页面较长，需要实现锚点定位跳转。1、开始用的路由方式，首先在router文件
MySQL之批量插入的4种方案总结
一、前言最近趁空闲之余，在对MySQL数据库进行插入数据测试，对于如何快速插入数据的操作无从下手，在仅1W数据量的情况下，竟花费接近47s，
python的turtle库使用详解
python中的turtle库是3.6版本中新推出的绘图工具库，那么如何使用呢？下面小编给大家分享一下。首先打开pycharm软件，右键单击

使用 pytorch 创建神经网络拟合sin函数的实现

Python中的__new__与__init__魔术方法理解笔记

编写Python脚本来实现最简单的FTP下载的教程

用python计算文件的MD5值

python tarfile压缩包操作保姆级教程

使用FastCGI部署Python的Django应用的教程

Pycharm学习教程（7）虚拟机VM的配置教程

Python获取本机所有网卡ip，掩码和广播地址实例代码

python numpy实现多次循环读取文件等间隔过滤数据示例

python 实现aes256加密

天谕手游家园币怎么获得

wps如何合并多个表格文件 wps合并多个表格文件方法

python 实现list或string按指定分段

升级Win8.1 不能手动、自动睡眠或者睡眠不能唤醒

Python 忽略文件名编码的方法

金铲铲之战约德尔人羁绊效果怎么样

PPT制作的展示相册怎么对图片进行修改?

Win7系统怎样设置浏览器兼容模式

Vue3.0 自己实现放大镜效果案例讲解

windows10家庭版和旗舰版有什么区别？windows10家庭版和旗舰版区别教程

手机版 网络编程 asp之家 www.aspxhome.com