Python处理mat文件的三种方式小结
作者:石头之心 发布时间:2022-01-21 23:04:30
处理mat文件的三种方式
读书的时候,处理数据都是采用matlab,但毕业后当了程序员,matlab从此在自己的电脑上消失了(安装包太大,还要license,启动也好慢,不符合程序员的需求)。
但是最近公司仿真的数据是以matlab的.mat格式存储的,需要读取出来处理,那就找找python相关的库吧,没有python干不了的活!!!
mat文件存储了matlab中变量数据,因此,python读出的mat数据是以k-v形式存储在字典里,key是变量名,value是数据内容:
scipy
最先想到的的是scipy工具
import scipy.io as scio
data = scio.loadmat(‘example.mat')
data[‘loss']
但是读取有的.mat文件的时,会抛出异常(v7.3版本):
raise NotImplementedError('Please use HDF reader for matlab v7.3 files')NotImplementedError: Please use HDF reader for matlab v7.3 files
h5py
遇到上面的问题,就需要采用h5py库了:
import h5py
data=h5py.loadmat('example.mat')
data['loss'][:]
但是这样读出来的是file格式,调试的时候都很难知道key是什么,取数据可以按照key来取,但是前提是需要知道key值,不方便独立调试。
mat73
今天的主角登场,个人觉得mat73兼容性最好,几乎所有的mat文件都能成功读取,而且读取的结果是k-v的字典,很便于后续处理:
import mat73
data=mat73.loadmat(path)
data['loss']
mat4py
不推荐,兼容性较差,可能是没有后续更新。
总结:总的来说,个人比较推荐使用mat73,兼容各种版本的mat文件,其次可以比较清晰的看到mat文件中保存数据的key值,便于后续的提取。
python操作.mat文件
在win10中,打开
ITC_VD 数据集格式,
结果在训练集ITC_VD_Training_Testing_set中,看到标签文件全是快捷方式,
选中一个文件,右键 属性,看到:
Microsoft Access Table Shortcut (.mat)
查了半天,发现是.mat 的 matlab格式,
python读取.mat格式
from scipy.io import loadmat
m = loadmat(r"E:\data\yolov5_dbb\ITC_VD_Training_Testing_set\Training\GT/00064.mat")
daaa=m.keys()
print(daaa)
print(m['x00064'])
.mat 文件里的数据结构是 dict ,所以取值要按照 key:value 的形式:
上面读出来的数据是 ndarray 类型,为了方便数据的展示,我们可以将其转换为,pandas的DataFrame:
import pandas as pd
df = pd.DataFrame(m['H_BETA'])
df.head()
mat转图片
import glob
import cv2
import numpy as np
r_path=r'C:\File\2021-11'
files=glob.glob(r_path+"/*.mat")
from scipy.io import loadmat
# 数据矩阵转图片的函数
def MatrixToImage(data):
# data = data * 255
new_im = data.astype(np.uint8)
return new_im
for file in files:
if "2018" in file:
continue
print(file)
m = loadmat(file)
daaa = m.keys()
data=m['groundTruth']
print(data)
new_im = MatrixToImage(data)
cv2.imshow("asdf",new_im)
cv2.waitKey()
# print(data)
来源:https://blog.csdn.net/u014260618/article/details/121523499


猜你喜欢
- 需求:需要在pycharm中跑一个深度学习的项目但是tensorflow包导不入问题分析:当前使用的是anaconda的3.8版本,无法正常
- 本文实例讲述了Python基于回溯法子集树模板解决选排问题。分享给大家供大家参考,具体如下:问题从n个元素中挑选m个元素进行排列,每个元素最
- 功能输入一个特定格式的时间戳,自动获取前进或者后退多少小时之后的时间附加函数时间戳转换函数def date_time_str_to_long
- 1. go介绍Go官方 提供一个名为go的命令,该命令可以用来下载go的依赖,构建安装go应用,运行和测试 Go程序等等, 我们比较常用的比
- 1.什么是SQL注入 所谓SQL注入式攻击,就是攻击者把SQL命令插入到Web表单的输入域或页面请求的查询字符串,欺骗服务器执行恶意的SQL
- # 贪婪模式 默认的匹配规则# 在满足条件的情况下 尽可能多的去匹配到字符串import rers = re.match('\d{6
- 前言正则表达式是什么应该不用过多介绍,每位程序员应该都知道,正则表达式描述的是一种规则,符合这种限定规则的字符串我们认为它某种满足条件的,是
- Python 是一种高级的,动态的,多泛型的编程语言。Python代码很多时候看起来就像是伪代码一样,因此你可以使用很少的几行可读性很高的代
- MatrixOne是一个新一代超融合异构数据库,致力于打造单一架构处理TP、AP、流计算等多种负载的极简大数据引擎。MatrixOne由Go
- 本文实例讲述了python创建关联数组(字典)的方法。分享给大家供大家参考。具体分析如下:关联数组在python中叫字典,非常有用,下面是定
- 爬取结果:爬取代码import osimport jsonimport requestsfrom tqdm import tqdmdef l
- 在Spring boot开发中,需要在application.yml文件里配置数据库的连接信息,或者在启动时传入数据库密码,如果不加密,传明
- 我就废话不多说了,还是直接看代码吧!# -*- coding:utf-8 -*-#面试题,写一个方法,将一行字符串中所有的单词数量统计出来c
- 如果有一个多任务多loss的网络,那么在训练时,loss是如何工作的呢?比如下面:model = Model(inputs = input,
- 今天简单使用了一下python的re模块和lxml模块,分别利用的它们提供的正则表达式和xpath来解析页面源码从中提取所需的title,x
- 介绍Session:在计算机中,尤其是在网络应用中,称为“会话控制”。Session 对象存储特定用户会话所需的属性及配置信息。这样,当用户
- 借助 GitHub 的网络钩子webhook,开发者可以创建很多有用的服务。从触发一个 Jenkins 实例上的 CI(持续集成) 任务到配
- 最近由于经常要用到Excel,需要根据Excel表格中的内容对一些apk进行处理,手动处理很麻烦,于是决定写脚本来处理。首先贴出网上找来的读
- 如下所示:a[:, np.newaxis] # 给a最外层中括号中的每一个元素加[]a[np.newaxis, :] # 给a最外层中括号中
- 如何计算方差简单展示一下pandas里怎么计算方差:官方文档:def def_std(df): for ix,row in df