Python 按比例获取样本数据或执行任务的实现代码
作者:授客 发布时间:2023-01-10 09:48:16
标签:Python,样本数据,执行任务
按比例获取样本数据或执行任务
By:授客 QQ:1033553122
开发环境
win 10
python 3.6.5
需求
已知每种分类的样本占比数,及样本总数,需要按比例获取这些分类的样本。比如,我有4种任务要执行,分别为任务A,任务B,任务C,任务D, 要求执行的总任务次数为100000,且不同分类任务执行次数占比为 A:B:C:D = 3:5:7:9,且在宏观上这些任务同时进行
代码实现
#!/usr/bin/env python
# -*- coding:utf-8 -*-
__author__ = 'shouke'
import time
from copy import deepcopy
def main():
class_propotion_map = {'A':3, 'B':5, 'C':7, 'D':7} # 分类及样本数比例映射
class_list = [] # 分类
class_proption_list = [] # 存放分类样本数比例
for class_type, propotion in class_propotion_map.items(): # 同一个循环,可以保证比例索引和对应分类索引一一对应
class_list.append(class_type)
class_proption_list.append(propotion)
temp_class_propotion_list = deepcopy(class_proption_list)
result = []
t1 = time.time()
total_sample_num = 100000 #任务执行次数
for i in range(1, total_sample_num+1):
max_propotion = max(temp_class_propotion_list)
if max_propotion > 0:
index = temp_class_propotion_list.index(max_propotion)
result.append(class_list[index])
temp_class_propotion_list[index] -= 1
elif max_propotion == 0 and min(temp_class_propotion_list) == 0:
temp_class_propotion_list = deepcopy(class_proption_list)
index = temp_class_propotion_list.index(max(temp_class_propotion_list))
result.append(class_list[index])
temp_class_propotion_list[index] -= 1
t2 = time.time()
from collections import Counter
c = Counter(result)
for item in c.items():
print(item[0], item[1]/total_sample_num)
print('耗时:%s'%(t2-t1))
main()
运行结果
说明
以上方式大致实现思路就是,获取每种分类样本数所占比例副本数据列表,然后每次从中获取最大比例值,并查找该比例值对应的分类(获取分类后就可以根据需要构造、获取分类样本数据),找到目标分类后,把比例数据副本中该比例值减1,直到最大比例和最小比例都等于0,接着重置比例副本数据为样本数比例值,重复前面的过程,直到样本数达到目标样本总数,这种方式实现的前提是得提前知道样本总数及不同分类样本数所占比例,且比例值为整数
来源:https://www.cnblogs.com/shouke/archive/2020/12/02/14077282.html


猜你喜欢
- 本文实例讲述了Python Zip和Enumerate用法。分享给大家供大家参考,具体如下:Python 中的 Zipzip的作用:可以在处
- 用python搭建百万答题、自动百度搜索答案。使用平台windows7python3.6MIX2手机代码原理手机屏幕内容同步到pc端对问题截
- Access 操作很简单,具体不步骤如下:打开你mdb数据库,工具-->数据库实用工具-->压缩和修复数据库(c)... SQL SERVE
- 前言之前,我们用pygame做了一个2D的Pong游戏,今天我们做一个3D的,游戏画面如下:用ad和←→
- 1.列表(本部分内容出入官方文档)对于这个功能,微信小程序中并没有提供类似于Android中listview性质的控件,所以我们需要使用 w
- 在开发过程中,我们经常会将日期时间的毫秒数存放到数据库,但是它对应的时间看起来就十分不方便,我们可以使用一些函数将毫秒转换成date格式。
- 视频对象提取与其说是视频对象提取,不如说是视频颜色提取,因为其本质还是使用了OpenCV的HSV颜色物体检测。下面话不多说了,来一起看看详细
- 大小写字母转换:函数 uc (uppercase) 将所有的小写字母转成大写;函数 lc (lowercase) 将所有的大写字母转成小写;
- 本文实例讲述了Python数据类型之List列表。分享给大家供大家参考,具体如下:list列表1.概述:通过之前的学习,我们知道变量可以存储
- 1、下载安装好PyCharm 专业版后打开或者新建一个Python项目,找到View导航栏,如下图:在Tool Windows下可以找到Sc
- 首先看看如何快速查看剩余火车票?当你想查询一下火车票信息的时候,你还在上12306官网吗?或是打开你手机里的APP?下面让我们来用Pytho
- 1、监听视频滑动给 swiper 增加 @change="change",这个时间在我们完成一次滑动后执行,在 meth
- 本文主要给大家介绍了关于Python中字典(dict)合并的四种方法,分享出来供大家参考学习,话不多说了,来一起看看详细的介绍:字典是Pyt
- 最近写了一个软件屡屡打包不能正常运行,而直接在cmd命令行窗口运行却都能正常输出,没有任何报错,一开始怀疑程序里面sys.args[1]使用
- <?php/** * 车票接口类 * * @author chepiao100 * 
- tkinter获取复选框(Checkbutton)的值定义GUI:from tkinter import *# 初始化Tk()myWindo
- 简介:破解rar和zip压缩包。Windows下使用PyCharm软件。1.步骤1.环境指令pip install 安装。如果是rar文件需
- 这里的Go(SDK)、GoLand的安装就不多说了,网上自行下载,我们着重讲项目配置,import pkg时能够完美运行一、Go版本以及Go
- 夹角余弦(Cosine)也可以叫余弦相似度。 几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。(
- 1. 引言本文是数独游戏问题求解的第二篇,在前文中我们使用回溯算法实现了最简单版本的数独游戏求解方案。本文主要在前文解决方案的基础上,来思考