利用python读取YUV文件 转RGB 8bit/10bit通用
作者:_沥川往事 发布时间:2023-09-05 08:33:19
标签:python,YUV文件,RGB,8bit,10bit
注:本文所指的YUV均为YUV420中的I420格式(最常见的一种),其他格式不能用以下的代码。
位深为8bit时,每个像素占用1字节,对应文件指针的fp.read(1);
位深为10bit时,每个像素占用2字节,对应文件指针的fp.read(2);
然后使用 int.from_bytes() 方法将二进制转换为int型数字。
以下程序可以读8bit或10bit位深的YUV,需要指定从第几帧开始读、一共读多少帧。
它返回三个数组,其shape分别为:Y [frame,W,H] U [frame,W/2,H/2] V [frame,W/2,H/2]
当只读1帧时它返回:Y [W,H] U [W/2,H/2] V [W/2,H/2]
# -*- coding: utf-8 -*-
import math
from functools import partial
import numpy as np
import matplotlib.pyplot as plt
def readyuv420(filename, bitdepth, W, H, startframe, totalframe, show=False):
# 从第startframe(含)开始读(0-based),共读totalframe帧
uv_H = H // 2
uv_W = W // 2
if bitdepth == 8:
Y = np.zeros((totalframe, H, W), np.uint8)
U = np.zeros((totalframe, uv_H, uv_W), np.uint8)
V = np.zeros((totalframe, uv_H, uv_W), np.uint8)
elif bitdepth == 10:
Y = np.zeros((totalframe, H, W), np.uint16)
U = np.zeros((totalframe, uv_H, uv_W), np.uint16)
V = np.zeros((totalframe, uv_H, uv_W), np.uint16)
plt.ion()
bytes2num = partial(int.from_bytes, byteorder='little', signed=False)
bytesPerPixel = math.ceil(bitdepth / 8)
seekPixels = startframe * H * W * 3 // 2
fp = open(filename, 'rb')
fp.seek(bytesPerPixel * seekPixels)
for i in range(totalframe):
for m in range(H):
for n in range(W):
if bitdepth == 8:
pel = bytes2num(fp.read(1))
Y[i, m, n] = np.uint8(pel)
elif bitdepth == 10:
pel = bytes2num(fp.read(2))
Y[i, m, n] = np.uint16(pel)
for m in range(uv_H):
for n in range(uv_W):
if bitdepth == 8:
pel = bytes2num(fp.read(1))
U[i, m, n] = np.uint8(pel)
elif bitdepth == 10:
pel = bytes2num(fp.read(2))
U[i, m, n] = np.uint16(pel)
for m in range(uv_H):
for n in range(uv_W):
if bitdepth == 8:
pel = bytes2num(fp.read(1))
V[i, m, n] = np.uint8(pel)
elif bitdepth == 10:
pel = bytes2num(fp.read(2))
V[i, m, n] = np.uint16(pel)
if show:
print(i)
plt.subplot(131)
plt.imshow(Y[i, :, :], cmap='gray')
plt.subplot(132)
plt.imshow(U[i, :, :], cmap='gray')
plt.subplot(133)
plt.imshow(V[i, :, :], cmap='gray')
plt.show()
plt.pause(1)
#plt.pause(0.001)
if totalframe==1:
return Y[0], U[0], V[0]
else:
return Y,U,V
if __name__ == '__main__':
#y, u, v = readyuv420(r'F:\_commondata\video\176x144 qcif\football_qcif.yuv', 8, 176, 144, 1, 5, True)
y, u, v = readyuv420(r'F:\_commondata\video\1920x1080 B\RitualDance_1920x1080_60fps_10bit_420.yuv', 10, 1920, 1080, 0, 5, True)
print(y.shape,u.shape,v.shape)
以下程序将YUV转为RGB(只能读8bit位深的YUV),返回1个数组,其shape为: [frame,W,H,3]
# -*- coding: utf-8 -*-
import cv2
import numpy as np
import matplotlib.pyplot as plt
def yuv2rgb(yuvfilename, W, H, startframe, totalframe, show=False, out=False):
# 从第startframe(含)开始读(0-based),共读totalframe帧
arr = np.zeros((totalframe,H,W,3), np.uint8)
plt.ion()
with open(yuvfilename, 'rb') as fp:
seekPixels = startframe * H * W * 3 // 2
fp.seek(8 * seekPixels) #跳过前startframe帧
for i in range(totalframe):
print(i)
oneframe_I420 = np.zeros((H*3//2,W),np.uint8)
for j in range(H*3//2):
for k in range(W):
oneframe_I420[j,k] = int.from_bytes(fp.read(1), byteorder='little', signed=False)
oneframe_RGB = cv2.cvtColor(oneframe_I420,cv2.COLOR_YUV2RGB_I420)
if show:
plt.imshow(oneframe_RGB)
plt.show()
plt.pause(0.001)
if out:
outname = yuvfilename[:-4]+'_'+str(startframe+i)+'.png'
cv2.imwrite(outname,oneframe_RGB[:,:,::-1])
arr[i] = oneframe_RGB
return arr
if __name__ == '__main__':
video = yuv2rgb(r'D:\_workspace\akiyo_qcif.yuv', 176, 144, 0, 10, False, True)
用ffmpeg也可以,比如你需要将yuv的第8帧输出成一个png:
ffmpeg -s 176x144 -i akiyo_qcif.yuv -filter:v select="between(n\,8\,8)" out.png
来源:https://blog.csdn.net/yuejisuo1948/article/details/83574237
0
投稿
猜你喜欢
- 元素浮动导致的问题及解决办法大家都应该很熟悉了,举个简单的例子:<style type="text/css">
- 如IP为192.168.1.111现要截取第二个.之前的值,得到结果192.168,很多网站都只显示前面2个值 &nb
- 目的是能使用Python进行rtmp推流,方便在h264帧里加入弹幕等操作。librtmp使用的是0.3.0,使用树莓派noir官方摄像头适
- 本文实例讲述了Python实现批量读取word中表格信息的方法。分享给大家供大家参考。具体如下:单位收集了很多word格式的调查表,领导需要
- MongoDB安装模块pip install pymongo连接数据库import pymongoclient = pymongo.Mong
- Linux Journal 发表了一篇优化 Oracle 数据库的文章,感觉十分的有用。简要介绍其摘要和大家共同分享 Linux 在企业级数
- 本文实例为大家分享了Python Pygame实现俄罗斯方块的具体代码,供大家参考,具体内容如下源码:# coding : utf-8#:
- 在使用SQL Server 的过程,中由于经常需要从多个不同地点将数据集中起来或向多个地点复制数据,所以数据的导出,导入是极为常见的操作.我
- 本文实例讲述了Python复制文件操作用法。分享给大家供大家参考,具体如下:这里用python实现了一个小型的自动发版本的工具。这个“自动发
- 一、前言在学习深度学习会发现都比较爱用python这个argparse,虽然基本能理解,但没有仔细自己动手去写,因此这里写下来作为自己本人的
- 项目地址是:https://www.chenshiyang.com/dytk接下来我们分析下源码简要看下实现原理。实现原理该项目不需要使用模
- 本文介绍了Python对于线程的支持,包括“学会”多线程编程需要掌握的基础以及Python两个线程标准库的完整介绍及使用示例。注意:本文基于
- 本文实例讲述了Python使用win32 COM实现Excel的写入与保存功能。分享给大家供大家参考,具体如下:很久之前通过东拼西凑实现过使
- 一、前言CodeIgniter 是一个简单快速的PHP MVC框架。EllisLab 的工作人员发布了 CodeIgniter。CodeIg
- 本文实例讲述了python获取本地计算机名字的方法。分享给大家供大家参考。具体如下:import sys, sockethostname =
- 本文实例讲述了php版微信支付api.mch.weixin.qq.com域名解析慢原因与解决方法。分享给大家供大家参考,具体如下:微信支付a
- 如下所示:# -*- coding: utf-8 -*-import sysfrom PySide.QtGui import *from P
- 前言 随机数可以用于数学,游戏,安全等领域中,还经常被嵌入到算法中,用以提高算法效率,并提高程序的安全性。平时数据分析各种分布的数据构造也
- 这段时间常给来面试的同学用《 你是一个职业的页面重构工作者吗? 》中三个部分的不同阶段去做自测,发现很多人都自我感觉良好,给我的回答基本都是
- 1、chr(i)chr()函数返回ASCII码对应的字符串。>>> print chr(65)A>>>