如何用Python合并lmdb文件
作者:SnailTyan 发布时间:2023-08-05 17:42:01
标签:python,lmdb
由于Caffe使用的存储图像的数据库是lmdb,因此有时候需要对lmdb文件进行操作,本文主要讲解如何用Python合并lmdb文件。没有lmdb支持的,需要用pip命令安装。
pip install lmdb
代码及注释如下:
# coding=utf-8
# filename: merge_lmdb.py
import lmdb
# 将两个lmdb文件合并成一个新的lmdb
def merge_lmdb(lmdb1, lmdb2, result_lmdb):
print 'Merge start!'
# env代表Environment, txn代表Transaction
# 打开lmdb文件,读模式
env_1 = lmdb.open(lmdb1)
env_2 = lmdb.open(lmdb2)
# 创建事务
txn_1 = env_1.begin()
txn_2 = env_2.begin()
# 打开数据库
database_1 = txn_1.cursor()
database_2 = txn_2.cursor()
# 打开lmdb文件,写模式,
env_3 = lmdb.open(result_lmdb, map_size=int(1e12))
txn_3 = env_3.begin(write=True)
count = 0
# 遍历数据库
for (key, value) in database_1:
# 将数据放到结果数据库事务中
txn_3.put(key, value)
count++
if(count % 1000 == 0):
# 将数据写入数据库,必须的,否则数据不会写入到数据库中
txn_3.commit()
count = 0
txn_3 = env_3.begin(write=True)
if(count % 1000 != 0):
txn_3.commit()
count = 0
txn_3 = env_3.begin(write=True)
for (key, value) in database_2:
txn_3.put(key, value)
if(count % 1000 == 0):
txn_3.commit()
count = 0
txn_3 = env_3.begin(write=True)
if(count % 1000 != 0):
txn_3.commit()
count = 0
txn_3 = env_3.begin(write=True)
# 关闭lmdb
env_1.close()
env_2.close()
env_3.close()
print 'Merge success!'
# 输出结果lmdb的状态信息,可以看到数据是否合并成功
print env_3.stat()
def main():
fr = open('lmdb.txt')
# lmdb1的目录
lmdb1 = fr.readline().strip()
# lmdb2的目录
lmdb2 = fr.readline().strip()
# result lmdb的目录
result_lmdb = fr.readline().strip()
fr.close()
merge_lmdb(lmdb1, lmdb2, result_lmdb)
if __name__ == '__main__':
main()
来源:https://blog.csdn.net/Quincuntial/article/details/56306024


猜你喜欢
- 开始之前,安利一本正在看的书《站在两个世界的边缘》,作者程浩,上帝丢给他太多理想,却忘了给他完成理想的时间。OK,有兴趣的可以看一看。nod
- 一.简单介绍: functools模块用于高阶函数:作用于或返回其他函数的函数。一般而言,任何可调用对象都可以作为本模块用途的函数
- 1 什么是嵌套循环所谓嵌套循环就是一个外循环的主体部分是一个内循环。内循环或外循环可以是任何类型,例如 while 循环或 for 循环。
- tf.reverse_sequence()简述在看bidirectional_dynamic_rnn()的源码的时候,看到了代码中有调用 r
- 前言Vuex 是一个专为 Vue.js 应用程序开发的 状态管理模式 。它借鉴了Flux、redux的基本思想,将共享的数据抽离到全局,同时
- 正在看的ORACLE教程是:自动备份Oracle数据库。
- 如何把imagenet预训练的模型,输入层的通道数随心所欲的修改,从而来适应自己的任务#增加一个通道w = layers[0].weight
- 关于Python语言,众说纷纭,但无外乎两种,强大,垃圾。大多数人还是对Python持肯定意见,认为它很强大。前些天和两个的大学同学聊天,一
- 在Python列表操作中:列表乘以某一个数,如list2 = list1 * 2 得到一个新的列表是list1的元素重复n次,且list1不
- 本文先比较range与arange的异同点,再详细介绍各自的用法,然后列举了几个简单的示例,最后对xrange进行了简单的说明。1. ran
- 代码:import sysfrom PyQt5.QtWidgets import (QWidget, QHBoxLayout, QLabel
- 1.tqdm模块是python进度条库, 主要分为两种运行模式1.1基于迭代对象运行: tqdm(iterator)import timef
- 介绍PaddleOCR 是一个基于百度飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、
- 本文实例讲述了python简单分割文件的方法。分享给大家供大家参考。具体如下:有的网站在上传文件时对文件大小有限制,因此可以将大文件分割成多
- 我们有时候,看到几k的日志文件,一大堆,一个一个打开又很麻烦,少看几个,又担心遗漏,这个时候,如果有一个可以合并所有文本文件的工具就好了。下
- 前言本文主要给大家介绍了关于Python中序列的修改、散列与切片的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。
- 1.前言对于数据库引擎来说,内存是一个性能提升的重要解决手段。把数据缓存起来,可以避免在查询或更新数据时花费多余的时间,而这时间通常是从磁盘
- pyecharts中的Funnel函数可以绘制漏斗图,自动根据数据大小生成由大到小自上而下排列的一个漏斗样的图形。1、导入Funnel模块。
- 本文实例分析了python删除指定类型(或非指定)的文件用法。分享给大家供大家参考。具体如下:如下,删除目录下非源码文件import os
- 啊,inline-block,挺难琢磨并且迷人的声明上承诺了很多,其实提供了很少。很多次我拿到类似这样的 PSD 文件:就哭了。一般说来,这