网络编程
位置:首页>> 网络编程>> Python编程>> 基于pandas将类别属性转化为数值属性的方法

基于pandas将类别属性转化为数值属性的方法

作者:chenpe32cp  发布时间:2021-11-24 07:15:16 

标签:pandas,数值,属性

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码


import pandas as pd
df = pd.DataFrame([
  ['green', 'M', 10.1, 'class1'],
  ['red', 'L', 13.5, 'class2'],
  ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
  'XL': 3,
  'L': 2,
  'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法


Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码


pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

来源:https://blog.csdn.net/chenpe32cp/article/details/75452592

0
投稿

猜你喜欢

  • 我们都知道在9i之前,要想获得建表和索引的语句是一件很麻烦的事。我们通常的做法都是通过export with rows=no来得到,但它的输
  • Python注释python中单行注释采用 # 开头。python 中多行注释使用三个单引号(''')或三个双引号(
  • 前言:python在同一个线程中多次执行同一方法时,该方法执行耗时较长且每次执行过程及结果互不影响,如果只在主进程中执行,效率会很低,因此使
  • 1.在线定制下载echartshttps://echarts.apache.org/zh/builder.html2.创建一个django项
  • 1、异常的传播当在函数中出现异常时,如果在函数中对异常进行了处理,则异常不会再继续传播。如果函数中没有对异常进行处理,则异常会继续向函数调用
  • import webbrowser as webimport timeimport oscount=0while count<10:&
  • 1、类的定义创建一个rectangle.py文件,并在该文件中定义一个Rectangle类。在该类中,__init__表示构造方法。其中,s
  • PHP xpath() 函数定义和用法xpath()函数运行对 XML 文档的 XPath 查询。如果成功,该函数返回 SimpleXMLE
  • 学习WEB标准的朋友一般都是从学习CSS开始,为什么呢?因为CSS是一种很有意思的语言,它能让我们的网页千变万化。也许我们一开始的接触只是因
  • python 创建List二维列表lists = [[] for i in range(3)] # 创建的是多行三列的二维列表for i i
  •  在web开发中经常遇到多关键词对对个字段查询,我一般是通过动态数组来实现的。当然多个关键词的一般是用空格或,隔开,我这几假设多个
  • requestRequests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置
  • 前几天,酋长同学在日志里提到了关于Google宽松的管理制度,一个产品任务下来是没有时间限制的,Google深信在有时间限制下的产品肯定是不
  • 本文实例讲述了Django返回json数据用法。分享给大家供大家参考,具体如下:1、前端。jQuery发送GET请求,并解析json数据。g
  • 本文实例为大家分享了js实现放大镜效果的具体代码,供大家参考,具体内容如下该放大区域用背景图片放大<!DOCTYPE html>
  • 可以查看mysql文件目录my.ini文件,可以找到类似于 datadir="D:/beeagle/Program Files/M
  • 概要本文只是简单的介绍动态规划递归、非递归算法实现案例一题目一:求数组非相邻最大和[题目描述]在一个数组arr中,找出一组不相邻的数字,使得
  • 数据聚合与分组运算对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准备好之
  • 前言我们在上一期学习了关于Python 迭代器Iterator详情相关的概念,满足迭代器需要符合两个条件实现__iter__()方
  • 现在市场上的OA基本上可归结为两大阵营,即php阵营和java阵营。但对接触Oa不久的用户来说,看到的往往只是它们的表相,只是明显的价格差异
手机版 网络编程 asp之家 www.aspxhome.com