python训练数据时打乱训练数据与标签的两种方法小结
作者:白话先生 发布时间:2021-11-17 11:15:12
标签:python,打乱,数据,标签
如下所示:
<code class="language-python">import numpy as np
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])
y = np.array([1,2,3,4,5])
print '-------第1种方法:通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------'
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])
data_num, _= data.shape #得到样本数
index = np.arange(data_num) # 生成下标
np.random.shuffle(index)
print '-------原数据:----------'
print '数据:',data
print '标签:', y
print '-------打乱数据:----------'
print '数据:',data[index]
print '标签:',y[index]
print '-------第2种方法:直接的打乱数据,利用随机数种子,好处:每次打乱的顺序是固定的----------'
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])
y = np.array([1,2,3,4,5])
print '-------原数据:----------'
print '数据:',data
print '标签:', y
print '-------打乱数据:----------'
np.random.seed(116)
np.random.shuffle(data)
np.random.seed(116)
np.random.shuffle(y)
print '数据:',data
print '标签:', y</code>
来源:https://blog.csdn.net/liuweizj12/article/details/80020861


猜你喜欢
- 本文实例讲述了Python list列表中删除多个重复元素操作。分享给大家供大家参考,具体如下:我们以下面这个list为例,删除其中所有值为
- 前言:如今,大多数计算机都带有多个内核,允许多个线程并行运行计算。即使处理器只有单核,也可以通过并发编程来提升程序的运行效率,比如在一个线程
- 基本概念当前读与快照读在MVCC中,读操作可以分成两类:快照读 (snapshot read)与当前读 (current read)。 快照
- 在thoughtbot,我们用Ruby和Rails工作,但通常我们总是尝试使用最合适的语言或者框架来解决问题。我最近一直在探索机器学习技术,
- 有这样一类文章标题,喜欢学习的人肯定见过:使用Google的7个技巧Web设计中9个常见的可用性错误Adobe Photoshop 75个技
- 在sql语句后使用 SCOPE_IDENTITY() 当然您也可以使用 SELECT @@IDENTITY 但是使用 SELECT @@ID
- 今天在部署一个实验系统的时候,报出下面这个错: Your 'max_allowed_packet' variable is
- 当然还是要使用FileSystemObject(FSO)来创建了。不过在创建前,要先检查以下目录是否存在,如果存在,就不用创建了: 
- 首字母为英文和下划线,其它部分则可以是英文、数字和下划线(即:_),而变量名称是区分大小写,即变量temp与Temp为不同变量。变量的基本用
- 今天训练faster R-CNN时,发现之前跑的很好的程序(是指在运行程序过程中,显卡利用率能够一直维持在70%以上),今天看的时候,显卡利
- 对于html中的一些元素注册事件的方式有多种 第一种: <script> function test() { alert(&qu
- 本文实例为大家分享了bootstrapValidator.min.js表单验证的具体代码,供大家参考,具体内容如 * 意:下载后全选复制并粘贴
- 前言上个篇章中我们主要介绍了OpenTelemetry的客户端的一些数据生成方式,但是客户端的数据最终还是要发送到服务端来进行统一的采集整合
- 一、命令提示符窗口安装卸载1、安装第一种,最常用的,初学者也是基本都是用的这个方法,直接在cmd里面安装。首先键盘按住win+r就会弹出来运
- auth模块简介auth模块是对登录认证方法的一种封装,之前我们获取用户输入的用户名及密码后需要自己从user表里查询有没有用户名和密码符合
- 目录先通过一个实例来了解下接口到底解决什么问题。定义一个接口定义类,继承接口Python 抽象基类的介绍 (PEP3119)软件行业,唯一不
- 介绍Markdown(也简称md)作为一种轻量级标记语言,因其易写易读,效果美观大方,不仅被众多网站使用,也是程序员们做笔记、写文档的首选。
- 具体代码如下所示:#coding=utf8from urllib import requestimport reimport urllib,
- 用关键字 in 和not in 来 如下:qwe =[1,2,3,4,5] if 2 in qwe: print ‘good!' e
- 使用方法和步骤如下:step1检测是否已经启用ServiceBroker,检测方法:SelectDATABASEpRoPERTYEX(