pandas 如何将字符串映射为数字
作者:白水baishui 发布时间:2021-04-15 02:47:33
pandas 将字符串映射为数字
在有些数据集中,有些数据变量用字符串表示,但为了方便处理,往往想转换为好处理的格式,这时候不一定要用one hot进行编码,也可以直接转成整数:
test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)
但是这样映射的数字是从0开始的,如果有初始要求,可以对映射结果加上某个值,例如,把从0开始变为从15开始:
test_df["xx"] = test_df["xx"].add(15)
效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):
user_id item_id ratings time
0 B001GXRQW0 APV13CM0919JD 1.0 1229644800
1 B001GXRQW0 A3G8U1G1V082SN 5.0 1229472000
2 B001GXRQW0 A11T2Q0EVTUWP 5.0 1229472000
3 B001GXRQW0 A9YKGBH3SV22C 5.0 1229472000
4 B001GXRQW0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 B01H5PPJT4 A2K9WVQW9TLWNK 5.0 1536969600
147190 B01H5PPJT4 A149ALSR6TPGF7 4.0 1536278400
147191 B01H5PPJT4 A2Q066NZCQSCOR 5.0 1535500800
147192 B01H5PPJT4 A1KJLWCW7XBS8I 5.0 1534550400
147193 B01H5PPJT4 ANABUB0FRZXRM 5.0 1534204800
user_id item_id ratings time
0 0 APV13CM0919JD 1.0 1229644800
1 0 A3G8U1G1V082SN 5.0 1229472000
2 0 A11T2Q0EVTUWP 5.0 1229472000
3 0 A9YKGBH3SV22C 5.0 1229472000
4 0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 858 A2K9WVQW9TLWNK 5.0 1536969600
147190 858 A149ALSR6TPGF7 4.0 1536278400
147191 858 A2Q066NZCQSCOR 5.0 1535500800
147192 858 A1KJLWCW7XBS8I 5.0 1534550400
147193 858 ANABUB0FRZXRM 5.0 1534204800
pandas 将某一列的字符值转换为数字
使用map的方法就可以实现把某一列的字符类型的值转换为数字。
class_mapping = {'A':0, 'B':1}
data[class] = data[class].map(class_mapping)
首先定义一个字典,然后使用map方法就可以把某一列的字符类型的值转换为数字。
来源:https://baishui.blog.csdn.net/article/details/123782779


猜你喜欢
- 先导入模块:from django.core.paginator import Paginator, EmptyPage, PageNotA
- 最近在研究品牌如何演绎,当然,看的时候没有忘记本行,分析了一下他们的交互设计~~路易威登LV上图采用胶片展示多组信息——大片展示品牌渲染。利
- 本文介绍了SpringBoot 中使用JSP的方法示例,分享给大家,具体如下:依赖: <parent>
- 以mysql-noinstall-5.0.22-win32为例,解压缩后会看到mysql-5.0.22-win32文件夹下面,有五个ini格
- 本文实例讲述了python中map、any、all函数用法。分享给大家供大家参考。具体分析如下:最近想学python,就一直比较关注pyth
- 前言shape函数是Numpy中的函数,它的功能是读取矩阵的长度,比如shape[0]就是读取矩阵第一维度的长度。直接用.shape可以快速
- using System;using System.Collections.Generic;using System.Linq;using
- 前言……最近在学习yolo1、yolo2和yolo3,写这篇博客主要是为了让自己对yolo2的结
- 负责Web编写的前端人员,都清楚可以通过W3验证服务功能,来在线验证自己编写的XHTML代码是否正确,在验证期间,最容易出现的错误往往都是在
- 本文实例讲述了JS实现密码框根据焦点的获取与失去控制文字的消失与显示效果。分享给大家供大家参考,具体如下:思路:1、首先用把密码框用txt暂
- python 的PIL安装是一件很头疼的的事, 如果你要在python 中使用图型程序那怕只是将个图片从二进制流中存盘(例如使用Scrapy
- 因为编写了一个Python程序,密集的操作了一个Mysql库,之前数据量不大时,没发现很慢,后来越来越慢,以为只是数据量大了的原因,但是后来
- 使用Python内置函数:bin()、oct()、int()、hex()可实现进制转换。先看Python官方文档中对这几个内置函数的描述:b
- DRF中的Request在Django REST Framework中内置的Request类扩展了Django中的Request类,实现了很
- 准备工作创建一个应用添加应用到配置创建一个html编写视图函数from django.shortcuts import render# Cr
- general_log(查询日志)开启和关闭一、查询日志开启方法一:mysql>set global general_log_file
- 至于对好广告的评判,不同的人有不同的标准,一些人认为那些打动人、有新意、有共鸣的广告是好广告,另一些人的观点则是:观众喜欢与否,不是广告好与
- 在开始安装SQL Server 2005数据库过程中,出现了下面的错误,安装不能继续进行:The SQL Server System Con
- 在开始之前,我们先来看看uint 与 int 的区别上面是图,下面是源码:package main import ( "fmt&q
- 本文实例讲述了python求解水仙花数的方法。分享给大家供大家参考。具体如下:一个N位的十进制正整数,如果它的每个位上的数字的N次方的和等于