keras 读取多标签图像数据方式
作者:Stretch Dong 发布时间:2021-01-30 18:26:48
标签:keras,多标签,图像
我所接触的多标签数据,主要包括两类:
1、一张图片属于多个标签,比如,data:一件蓝色的上衣图片.jpg,label:蓝色,上衣。其中label包括两类标签,label1第一类:上衣,裤子,外套。label2第二类,蓝色,黑色,红色。这样两个输出label1,label2都是是分类,我们可以直接把label1和label2整合为一个label,直接编码,比如[蓝色,上衣]编码为[011011]。这样模型的输出也只需要一个输出。实现了多分类。
2、一张图片属于多个标签,但是几个标签不全是分类。比如data:一张结婚现场的图片.jpg,label:高兴,3(表示高兴程度)。这时label1是分类,label2时回归。这种情况就需要多个标签,模型需要多个输出。【其实最好的例子,就是目标检测,不但检测什么物体(分类),还要检测到物体的坐标(回归)】
在这里我主要针对第二种情况加以说明:
keras的ImageDataGenerator.flow_from_directory 只能简单的读取单标签数据。所以我自己写了个data_generate,来生成bathsize多标签数据
#此模块主要用来读取数据集,返回一个数据可迭代对象
#重点是,此模块分批次的把图像读入内存的,而不是一次全读入,有效的减少了内存溢出
import os
import cv2
import numpy as np
import keras
from random import shuffle
#目标图像大小
image_size= (229, 229, 3)
#类别编码
class_dict=dict(zip(['neg','pos','neu'],[0,1,2]))
#处理.txt文件,并加载图片文件夹里的图片名
#txt_path,txt文件路径,data_path,图片文件夹路径
def read_txt(txt_path,data_path):
# 中间数组
labels_class = []
labels_score = []
with open(txt_path) as f:
lines_list = f.readlines()
for lines in lines_list:
line = lines.split(' ')
labels_class.append(line[0].rstrip(".jpg"))
labels_score.append(line[2])
labels_dict=dict(zip(labels_class,labels_score))
#处理图片数据集
all_picture_name = os.listdir(data_path)
#打乱数据集
shuffle(all_picture_name)
all_picture_path=[os.path.join(data_path,one)for one in all_picture_name]
return all_picture_name,all_picture_path,labels_dict
class data_generate:
def __init__(self,all_piture_name,all_picture_path,labels_dict,batch_size):
self.index=0
self.all_picture_name=all_piture_name
self.all_picture_path=all_picture_path
self.labels_dict=labels_dict
self.batch_size = batch_size
def get_mini_batch(self):
while True:
batch_images=[]
batch_labels=[]
batch_class=[]
batch_score=[]
for i in range(self.batch_size):
if(self.index==len(self.all_picture_name)):
self.index=0
bgr_image = cv2.imread(self.all_picture_path[self.index])
if len(bgr_image.shape) == 2: # 若是灰度图则转为三通道
bgr_image = cv2.cvtColor(bgr_image, cv2.COLOR_GRAY2BGR)
rgb_image = cv2.cvtColor(bgr_image, cv2.COLOR_BGR2RGB)
rgb_image=cv2.resize(rgb_image,(image_size[0], image_size[1]))
img = np.array(rgb_image)
img=keras.applications.inception_v3.preprocess_input(img)
batch_images.append(img)
#label=[]
label1=self.all_picture_name[self.index].rstrip(".jpg")
batch_class.append(keras.utils.to_categorical(class_dict[label1[:3]], 3))
batch_score.append(np.array(self.labels_dict[label1]))
#batch_labels.append(label)
self.index+=1
batch_images=np.array(batch_images)
batch_class = np.array(batch_class)
batch_score = np.array(batch_score)
#注意label的生成batch_class,一个单独数组,batch_score一个单独的数组
'''
注释掉的这段代码生成的label是错误的。
batch_images=[]
batch_labels=[]
for i in range(self.batch_size):
if(self.index==len(self.images)):
self.index=0
batch_images.append(self.images[self.index])
batch_labels.append(self.labels[self.index])
self.index+=1
batch_images=np.array(batch_images)
batch_labels=np.array(batch_labels)
yield batch_images,batch_labels
'''
yield batch_images,[batch_class,batch_score]
接下来就是放入keras.fit_generate中了
history=model.fit_generator(generator=train_data.get_mini_batch(),
steps_per_epoch=146,
epochs=300,
validation_data=test_data.get_mini_batch(),
validation_steps=34,
)
来源:https://blog.csdn.net/weixin_42269778/article/details/100384934


猜你喜欢
- 本文实例讲述了wxPython定时器wx.Timer简单应用。分享给大家供大家参考。具体如下:# -*- coding: utf-8 -*-
- for循环语句的对象是可迭代对象,可迭代对象需要实现__iter__或iter方法,并返回一个迭代器,什么是迭代器呢?迭代器只需要实现 __
- 我不知道有多少人在使用浏览器的书签,这东东有时候实在是很有用的,比如现在说到的jQuerify书签。jQuerify书签的功能很简单,那就是
- 所有代码都是网上百度出来的,通过个人实践找到适合自己的。采用的python 库是 pymouse、pykeyboard安装时直接p
- create database MyDb on ( name=mainDb, filename='c:\MyDb\mainDb.md
- 最近,W3C的一项公告称,在W3C与XHTML2的合同于今年年底到期后将不会续签。这意味着W3C停止了对XHTML2的开发,转而大力支持HT
- 第一种:利用functools 工具处理import functoolsresult = (lambda k: functools.redu
- vue卡片翻转轮播展示,同时在翻转时切换数据,供大家参考,具体内容如下效果及代码代码:<template> <
- 本文实例讲述了Python自定义函数计算给定日期是该年第几天的方法。分享给大家供大家参考,具体如下:写一个函数,计算给定日期是该年的第几天.
- 1 PromisePromise有一个缺点是一旦创建无法取消,所以本质上Promise是无法被终止的.但是我们可以通过中断调用链或中断Pro
- 1. 首先VC++的DLL的导出函数定义成标准C的导出函数: #ifdef LRDLLTEST_EXPORTS #define LRDLLT
- 目录MySQL 基础常用命令1. SQL语句2. 建表3.字段属性4.修改表:alter table5. 增删改查:字符串全部使用'
- 经典神经网络的改进点名称改进点VGG161、使用非常多的3*3卷积串联,利用小卷积代替大卷积,该操作使得其拥有更少的参数量,同时会比单独一个
- 本文为大家分享了PHP微信支付实例,包括PHP微信支付源码,PHP微信退款源码,php微信支付接口,供大家参考,具体内容如下1.JSapi支
- 功能是打开本机端口,映射到指定IP的端口场景1本机:tomcat启动8080,通过本端口工具打开80,指向到tomcat的8080。请求本机
- 题目给定一个字符串,逐个翻转字符串中的每个单词。示例 1:输入: "the sky is blue"输出: "
- 前言Vuex 和 Pinia 是用于管理 Vue.js 应用程序状态的标准 Vue.js 库。让我们比较一下他们的代码、语言、功能和社区支持
- 确定数据库内有多少记录,或者确定有多少记录达到了某些标准,这些用ASP完成并非难事。如果你采用了正确的游标类型,你可以用RecordCoun
- 问题描述:已经用pip install jieba安装好jieba分词工具,但是在Jupyter 里import jieba运行一直提示Im
- 将el-switch值true、false改为number类型的1和0需求描述后端传回的status值为1(number类型)对应el-sw