位置：首页>> 网络编程>> Python编程>> Python Pandas 如何shuffle（打乱）数据

Python Pandas 如何shuffle（打乱）数据

作者：kingsam_　　发布时间：2023-04-22 23:17:16　

标签：Pandas,shuffle,打乱

在Python里面，使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法，本文介绍两种比较常用而且简单的方法。

应用情景：

我们有下面以个DataFrame

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的，我们希望不保持这个次序，但是同时列属性又不能改变，即如下效果：

实现方法：

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)

这样对可以对df进行shuffle。其中参数frac是要返回的比例，比如df中有10行数据，我只想返回其中的30％,那么frac=0.3。

有时候，我们可能需要打混后数据集的index（索引）还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

-------------------------------------分割线--------------------------------------------------------------

其实，sklearn(机器学习的库）中也有shuffle的方法。

from sklearn.utils import shuffle
df = shuffle(df)

另外，numpy库中也有进行shuffle的方法（不建议）

df.iloc[np.random.permutation(len(df))]

来源：https://blog.csdn.net/qq_22238533/article/details/70917102

0

投稿

猜你喜欢

js中string转int把String类型转化成int类型
首先给大家分享一篇js中int和string数据类型互相转化实例https://www.aspxhome.com/article/15474
python实现监控linux性能及进程消耗性能的方法
本文以实例形式实现了python监控linux性能以及进程消耗性能的方法，具体实现代码如下：# -*- coding: utf-8 -*-&
白鸦:贪守米缸者，饿死灶台
1、用户有三种：活跃用户、沉睡用户、外部用户。2、据不完全统计，外部用户8亿，沉睡用户1.2亿，活跃用户1千万。3、就算不去管活跃用户，或者
python中dict()的高级用法实现
collections中defaultdict的用法一、字典的键映射多个值将下面的列表转换成字典一个字典就是一个键对应一个单值得映射，而上面
10款最好的Web开发的 Python 框架
Python 是一门动态、面向对象语言。其最初就是作为一门面向对象语言设计的，并且在后期又加入了一些更高级的特性。除了语言本身的设计目的之外
Python异常继承关系和自定义异常实现代码实例
这篇文章主要介绍了Python异常继承关系和自定义异常实现代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价
SQL Server 2000数据库FOR XML查询概述
由于XML本身的诸多优点，XML技术已被广泛的使用，目前的好多软件技术同XML紧密相关，比如微软的.net 平台对xml提供了强大的支持，提
django 使用 request 获取浏览器发送的参数示例代码
获取数据(四种方式)1. url: 需要正则去匹配 url(r'^index/(num)/$&#
Check In和Check Out的多人协作管理
大多数网站维护都采用“多人协作，共同管理”方式。某个人负责一个（或者多个）栏目，他只能对他负责的栏目进
phpMyAdmin 2.10.2 配置方法
当成功安装了PHP，MYSQL后，我们一般要安装phpMyAdmin来管理你的mysql。本文介绍了phpMyAdmin 2.10.2的配置
Python借助with语句实现代码段只执行有限次
debug的时候，有时希望打印某些东西，但是如果代码段刚好在一个循环或者是其他会被执行很多次的部分，那么用来print的语句也会被执行很多次
教你使用Python根据模板批量生成docx文档
一、需求说明能够根据模板批量生成docx文档。具体而言，读取excel中的数据，然后使用python批量生成docx文档。二、实验准备准备e
Golang 按行读取文件的三种方法小结
Golang 是一种现代的编程语言，它具有高效、简洁和可扩展等特点，因此在各种领域广泛应用。在 Golang 中，读取文件是一个常见的操作。
解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题
错误提示图片首先，我的操作系统是win7旗舰版，安装Python3.7.1之后启动时，提示如图错误，网上比较多的是两种处理方法：（1）安装W
SQL Server 2000中生成XML的小技巧
以前在介绍SQL2k的时候已经提到了SQL2k对XML的支持，使用for XML语句就可以很容易的把执行的结果转化为一个XML，这样可以在很
给Python的Django框架下搭建的BLOG添加RSS功能的教程
前些天有位网友建议我在博客中添加RSS订阅功能，觉得挺好，所以自己抽空看了一下如何在Django中添加RSS功能，发现使用Django中的s
JavaScript中的设计模式单例模式
前言：设计模式在我们编程中是十分重要的！设计模式（Design pattern）代表了最佳的实践，通常被有经验的面向对象的软件开发人员所采用
c#几种数据库的大数据批量插入（SqlServer、Oracle、SQLite和MySql）
在之前只知道SqlServer支持数据批量插入，殊不知道Oracle、SQLite和MySql也是支持的，不过Oracle需要使用Orace
js如何能知道浏览者计算机使用的语言是繁体还是简体
爱如风过问：js如何能知道浏览者计算机或者浏览器使用的语言是繁体还是简体？如题，我想用jS检测到浏览者使用的是繁体还是简体中文，以便设置页
vue实现联动选择
本文实例为大家分享了vue实现联动选择的具体代码，供大家参考，具体内容如下因为项目需求，作者和作者头像都是由后台接口传给前端的，所以我就选择

python实现浪漫的烟花秀

Python Tkinter GUI编程实现Frame切换

python导入pandas具体步骤方法

Python实现求两个数组交集的方法示例

Django框架反向解析操作详解

Python深度强化学习之DQN算法原理详解

Pytest单元测试框架生成HTML测试报告及优化的步骤

Django中QuerySet查询优化之prefetch_related详解

详解python中@classmethod和@staticmethod方法

python中doctest库实例用法

win8旗舰32位系统IE浏览器恢复默认设置的方法

excel如何只粘贴到筛选出的部分 excel筛选后复制粘贴跳过隐藏行教程

火影忍者手游2021缤纷水果季怎么玩

iPhone XR如何设置来电闪光

如何在格式工厂设置字体颜色？格式工厂设置字体颜色的方法

win10如何更改盘符字母？windows10更改盘符名称方法

wps文字立方符号怎么弄

机动都市阿尔法审判之眼怎么玩？阿尔法审判之眼打法心得

qq拼音输入法加速期限3月6日到期

Wps中进行设置背景图片的操作方法

手机版 网络编程 asp之家 www.aspxhome.com