numpy数组之读写文件,numpy输入数组

numpy数组之读写文件

摘要：

该目录通过numpy读取和写入txt或csv文件，通过numpy读写npy或npz文件，通过h5py读取和写npy文件，通过简单读取读取和写入hdf5文件，并通过切片分配摘要引用将numpy数组保存到文件中。有许多文件类型可供选择，相应地有不同的读取和写入方法。

将 numpy 数组存入文件，有多种文件类型可供选择，对应地就有不同的方法来读写。

下面我将介绍读写 numpy 的三类文件：

txt 或者 csv 文件
npy 或者 npz 文件
hdf5 文件

通过 numpy 读写 txt 或 csv 文件

import numpy as np

a = np.array(range(20)).reshape((4, 5))
print(a)

# 后缀改为 .txt 一样
filename = 'data/a.csv'
# 写文件
np.savetxt(filename, a, fmt='%d', delimiter=',')

# 读文件
b = np.loadtxt(filename, dtype=np.int32, delimiter=',')
print(b)

缺点：

只能保存一维和二维 numpy 数组，当 numpy 数组 a 有多维时，需要将其 a.reshape((a.shape[0], -1)) 后才能用这种方式保存。
不能追加保存，即每次 np.savetxt() 都会覆盖之前的内容。

通过 numpy 读写 npy 或 npz 文件

读写 npy 文件

import numpy as np

a = np.array(range(20)).reshape((2, 2, 5))
print(a)

filename = 'data/a.npy'
# 写文件
np.save(filename, a)

# 读文件
b = np.load(filename)
print(b)
print(b.shape)

优点：

npy 文件可以保存任意维度的 numpy 数组，不限于一维和二维；
npy 保存了 numpy 数组的结构，保存的时候是什么 shape 和 dtype，取出来时就是什么样的 shape 和 dtype。

缺点：

只能保存一个 numpy 数组，每次保存会覆盖掉之前文件中存在的内容（如果有的话）。

读写 npz 文件

import numpy as np

a = np.array(range(20)).reshape((2, 2, 5))
b = np.array(range(20, 44)).reshape(2, 3 ,4)
print('a:
', a)
print('b:
', b)

filename = 'data/a.npz'
# 写文件， 如果不指定key，那么默认key为'arr_0'、'arr_1'，一直排下去。
np.savez(filename, a, b=b)

# 读文件
c = np.load(filename)
print('keys of NpzFile c:
', c.keys())
print("c['arr_0']:
", c['arr_0'])
print("c['b']:
", c['b'])

优点：

npy 文件可以保存任意维度的 numpy 数组，不限于一维和二维；
npy 保存了 numpy 数组的结构，保存的时候是什么 shape 和 dtype，取出来时就是什么样的 shape 和 dtype；
可以同时保存多个 numpy 数组；
可以指定保存 numpy 数组的 key，读取的时候很方便，不会混乱。

缺点：

保存多个 numpy 数组时，只能同时保存，即 np.savez(filename, a, b=b)。每次保存会覆盖掉之前文件中存在的内容（如果有的话）。

通过 h5py 读写 hdf5 文件

优点：

不限 numpy 数组维度，可以保持 numpy 数组结构和数据类型；
适合 numpy 数组很大的情况，文件占用空间小；
可以通过 key 来访问 dataset（可以理解为 numpy.array），读取的时候很方便，不会混乱。
可以不覆盖原文件中含有的内容。

简单读取

import numpy as np
import h5py

a = np.array(range(20)).reshape((2, 2, 5))
b = np.array(range(20)).reshape((1, 4, 5))
print(a)
print(b)

filename = 'data/data.h5'
# 写文件
h5f = h5py.File(filename, 'w')
h5f.create_dataset('a', data=a)
h5f.create_dataset('b', data=b)
h5f.close()

# 读文件
h5f = h5py.File(filename, 'r')
print(type(h5f))
# 通过切片得到numpy数组
print(h5f['a'][:])
print(h5f['b'][:])
h5f.close()

通过切片赋值

import numpy as np
import h5py

a = np.array(range(20)).reshape((2, 2, 5))
print(a)

filename = 'data/a.h5'
# 写文件
h5f = h5py.File(filename, 'w')
# 当数组a太大，需要切片进行操作时，可以不直接对h5f['a']进行初始化；
# 当之后不需要改变h5f['a']的shape时，可以省略maxshape参数
h5f.create_dataset('a', shape=(2, 2, 5), maxshape=(None, 2, 5), dtype=np.int32, compression='gzip')
for i in range(2):
    # 采用切片的形式赋值
    h5f['a'][i] = a[i]
h5f.close()

# 读文件
h5f = h5py.File(filename, 'r')
print(type(h5f))
print(h5f['a'])
# 通过切片得到numpy数组
print(h5f['a'][:])

同一个 hdf5 文件可以创建多个 dataset，读取的时候按照 key 来即可。

总结

csv 和 txt 只能用来存一维或二维 numpy 数组；
npy 用来存单个 numpy 数组，npz 可以同时存多个 numpy 数组，两者都不限 numpy 维度，且都保持 numpy 数组的 shape 和 dtype，写文件时若原文件存在只能覆盖原文件内容；
当 numpy 数组很大时，最好使用 hdf5 文件，hdf5 文件相对更小；
当 numpy 数组很大时，对整个 numpy 数组进行运算容易发生 MemoryError，那么此时可以选择对 numpy 数组切片，将运算后的数组保存到 hdf5 文件中，hdf5 文件支持切片索引。

References

当Python遇上HDF5--性能优化实战 -- 张玉腾
 杂： PYTHON上数据储存：推荐h5py -- Pony_s

免责声明：文章转载自《numpy数组之读写文件》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

Bash数组-判断某个元素是否在数组内的几种方法

声明一个数组array，一个待测试元素var array=( element1 element2 element3 ) var="element1" 接下来用几种方法来分别测试var是否是array中的元素判断方法1： echo "${array[@]}" | grep -wq "$var" && echo "Yes" || ech...

go json 编解码中的双引号问题

什么是json，json的标准？？现在越来越多的项目和开发插件等默认都会支持和使用json数据格式，作为数据保持、传输的一种方式。说是其中一种，就标示还有好多其他格式。比如：最多是xml。webservice的标准数据格式。不过由于json是JavaScript 对象表示法（JavaScript Object Notation），天生就对js支持很好...

Django之POST GET与前后端交互

Django之META与前后端交互 1 提交表单之GET 前端提交数据与发送 1）提交表单数据 2）提交JSON数据后端的数据接收与响应 1）接收GET请求数据 2）接收POST请求数据 3）响应请求 GET 请求过程前端通过ajax发起GET请求,json格式数据 var data = { "name": "test",...

Excel统计函数COUNTIF()的常规用法介绍

大神链接： Excel统计函数COUNTIF()的常规用法介绍（自己整理的）http://club.excelhome.net/thread-1169705-1-1.html(出处: ExcelHome技术论坛) Excel统计函数COUNTIF()的常规用法介绍 COUNTIF函数常规用法一基本简介作用用来计算区域中满足给定条件的单...

使用java8的stream对数组进行求和

1、对BigDecimal类型的值求和。 List<Map<String,Object>> list = new ArrayList<>(); Map<String,Object> stu1 = new HashMap<String, Object>(); stu1.put("name", "张三...

C# Parsing 类实现的 PDF 文件分析器

下载示例下载源代码 1. 介绍这个项目让你可以去读取并解析一个PDF文件，并将其内部结构展示出来. PDF文件的格式标准文档可以从Adobe那儿获取到. 这个项目基于“PDF指南，第六版，Adobe便携文档格式1.7 2006年11月”. 它是一个恐怕有1310页的大部头. 本文提供了对这份文档的简洁概述. 与此相关的项目定义了用来读取和解析...

numpy数组之读写文件

通过 numpy 读写 txt 或 csv 文件

通过 numpy 读写 npy 或 npz 文件

读写 npy 文件

读写 npz 文件

通过 h5py 读写 hdf5 文件

简单读取

通过切片赋值

总结

References

相关文章

Bash数组-判断某个元素是否在数组内的几种方法

go json 编解码中的双引号问题

Django之POST GET与前后端交互

Excel统计函数COUNTIF()的常规用法介绍

使用java8的stream对数组进行求和

C# Parsing 类实现的 PDF 文件分析器

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表