Python 实现训练集、测试集随机划分
作者:no_error_no_warn 发布时间:2023-02-12 01:41:24
标签:Python,训练集,测试集,划分
随机从列表中取出元素:
import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)
以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:
import csv
import random
def getDataSet(proportion):
"""
:exception
获取训练集和测试集(将数据按比例随机划分)
:parameter
proportion - 测试集/数据集
:return
trainDataSet - 训练集
testDataSet - 测试集
author
肖政宇
modify
2019年5月10日
"""
dataSet = open('数据集.csv')
dataSetReader = csv.reader(dataSet)
"""
:exception
将数据保存到数组
"""
dataSet = []
next(dataSetReader, 'none') # 跳过表头
data = next(dataSetReader, 'none')
while (data != 'none'):
dataSet.append(data)
data = next(dataSetReader, 'none')
"""
:exception
按照比例随机划分出训练集和测试集
"""
dataNumber = dataSet.__len__() # 数据集数据条数
testNumber = int(dataNumber * proportion) # 测试集数据条数
testDataSet = [] # 测试数据集
trainDataSet = [] # 训练数据集
testDataSet = random.sample(dataSet, testNumber) # 测试集
for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
dataSet.remove(testData)
trainDataSet = dataSet # 训练集
return trainDataSet, testDataSet
来源:https://blog.csdn.net/qq_39514033/article/details/90052508
0
投稿
猜你喜欢
- 最近网上流行着一些采集程序,更多人拿着这些东西在网上叫卖,很多不太懂的人看着那些程序眼羡,其实如果你懂一些ASP,了解自动采集程序的原理后,
- 因为工作的原因,开发过一个拆分字符串的SQL函数,现在把它贴出来,与大家共勉学习。该函数如下: &
- 1. 功能说明,在页面使用smarty循环100次输出,类似for循环100次{section name=total loop=100}{$
- 以前有过一篇类似的文章, 讲的比较简单只有三个插件而已, 所以这篇文章将全持续更新.jQuery UI 大名顶顶, 不用介绍, 它的各个控件
- 前言这几天比较空闲,就接触了下百度地图的API(开发者中心链接地址:http://developer.baidu.com),发现调用还是挺方
- ThinkPHP3.1.3版本有一些特性,还是值得关注的,下面来简单说下。1、异常方面的改进新版的ThinkPHP3.1.3重写了异常类Th
- riginal_Data因为程序是为了实现对纯数值型Excel文档进行导入并生成矩阵,因此有必要对第五列文本值进行删除处理。Import_D
- 前言Python是C语言实现的,因此Python对象在C语言层面应该是一个结构体 ,组织对象占用的内存。 不同类型的对象,数据及行为均可能不
- 作者:做梦的人(小姐姐)出处:https://www.cnblogs.com/chongyou/python读取yaml文件使用,有两种方式
- 目录准备数据集导入所需的软件包将数据从文件加载到Python变量拆分数据进行训练和测试标记化并准备词汇预处理输出标签/类建立Keras模型并
- ISNULL 使用指定的替换值替换 NULL。 &nb
- 又是一年春来到,看各大网站的新年Logo也成为了我们必不可少的新年餐点,为此,我们特别整理了部分网站的新年Logo秀,如果你看到了更加有意思
- .asa是文件后缀名,它是Active Server Application的首字母缩写。Global.asa文件可以管理在ASP应用中两个
- 如果进入了shell交互窗口,python的退出方式只能够用函数不能够用命令,这有时候让人感觉到很不习惯。因为函数会比命令多一个括号的输入,
- 一切从一个糟糕的浏览器开始,它完全不支持 XHTML。什么是 MIME Type? 为什么这么说呢?首先,我们要了解浏览器是如何处理内容的。
- 前言:博主在刚接触Python的时候时常听到GIL这个词,并且发现这个词经常和Python无法高效的实现多线程划上等号。本着不光要知其然,还
- (1)最近真是郁闷,在Myeclipse中使用DB Browser但出现以下问题:(2)然后赶紧百度,求大神解决,主要的解决方法试一下几种:
- 下面演示了,当asp程序发生错误时,屏蔽系统默认的错误显示,而显示自定义的错误信息。<%@ LANGUAGE="V
- 在“按需加载”的需求中,我们经常会判断当脚本加载完成时,返回一个回调函数,那如何去判断脚本的加载完成呢?我们可以对加载的 JS 对象使用 o
- 上次谈到客户端和服务端的编码“陷阱”,其中对url编码只是提及带过,并没有做深入讨论,事实上由于浏览器环境的复杂和不一致性,我们也很容易掉进