Python读取文件内容与存储

摘要:
souce_数据。nrows和souce_数据。ncols分别用于计算表的行数和列数。
Python读取与存储文件内容

一、.csv文件

读取:

import pandas as pd
souce_data = pd.read_csv(File_Path)

  其中File_path是文件的路径

储存:

import pandas as pd
souce_data.to_csv(file_path)

其中,souce_data格式应该为series或者Dataframe格式

二、Excel文件

读取:

import xlrd as xl
data_excel = xlrd.open_workbook(file_path)
souce_data = data_excel.sheet_by_name(sheet)
row_len = souce_data.nrows
col_len = souce_data.ncols
for i in range(row_len):
    for j in range(col_len):
        print(souce_data.cell_value(i,j))

  其中,open_workbook(file_path)函数是打开文件file_path,data_excel.sheet_by_name(sheet)函数是打开sheet中的文件并赋值给souce_data。souce_data.nrows与souce_data.ncols是分别计算表格的行数与列数。

三、txt文件

读取:  

Python对txt的内容读取有三类方法:read()、readline()、readlines(),这三种方法各有利弊,下面逐一介绍其使用方法和利弊。

1.read():

  read()函数通过一次性读取文件的所有内容放在一个大字符串中,即存在内存中

with open(file_path) as f:
    souce_data = f.read()
    print(souce_data)

    read()的优势:方便、简单;一次性独读出文件放在一个大字符串中,速度最快

    read()的弊端:文件过大的时候,占用内存会过大

2.readline():

  readline()逐行读取文本,结果是一个list

1 with open(file_path) as f:
2     line = f.readline()
3     while line:
4         print(line)
5         line = f.readline()        

    readline()的优势:占用内存小,逐行读取。

    readline()的弊端:由于是逐行读取,读取速度比较慢

3.readlines():

  readlines()一次性读取文本的所有内容,结果是一个list

with open(file) as f:
    for line in f.readlines():
         print line

  这种方法读取的文本内容,每行文本末尾都会带一个' '换行符 (可以使用L.rstrip(' ')去掉换行符

    readlines()的利端:一次性读取文本内容,速度比较快

    readlines()的弊端:随着文本的增大,占用内存会越来越多

储存:

with open(file_path,'w') as f:
    f.write(souce_data)

四、储存与读取json文件

存储:

import json
with open(file_path,'w') as cf:
    cf.write(json.dumps(souce_data))

读取:

import json
with open(file_path,'r') as rf:
    souce_data = rf.read()
souce_data = eval(souce_data)

 

免责声明:文章转载自《Python读取文件内容与存储》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇2016.2.14-2016.2.21 中大信(北京)工程造价咨询有限公司实习有感在Ubuntu下安装deb包需要使用dpkg命令下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

yaml 文件中引用变量来读取 python 代码的设置值

在接口自动化测试的时候,yaml 文件一般放测试的数据或当配置文件使用,yaml 文件存放静态的数据是没问题的,python的数据类型基本上都是支持的。有时候我们想在 yaml 文件中引用变量来读取 python 代码的设置值。 一:yaml文件中是静态数据,那么,我们用python可以正常的读取。 在接口自动化中,yaml文件保存测试数据。 我们可以用p...

python修改镜像源

pip升级:python -m pip install --upgrade pip https://www.cnblogs.com/andy9468/p/10319442.html 1、在命令中临时修改 pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pillow 2、永久修改镜像...

python获取文件的绝对路径

python获取文件的绝对路径 importos defload_file(): #获取当前文件路径 current_path = os.path.abspath(__file__) #获取当前文件的父目录 father_path = os.path.abspath(os.path.dirname(current_pat...

吾八哥学Selenium(四):操作下拉框select标签的方法

我们在做web页面自动化测试的时候会经常遇到<select></select>标签的下拉框,那么在Python里如何实现去操作这种控件呢?今天就给大家分享一下这个玩法。为了让大家学习更方便,我准备了一个测试页面。 测试的html页面代码为: <html> <head> <title>学Python...

django(八)之数据库表的一对多,多对多表-增删改查

单表操作 表记录的添加 方式一: Book() b=Book(name="python基础",price=99,author="yuan",pub_date="2017-12-12") b.save()...

npm 安装依赖包提示找不到python环境和Could not load the Visual C++ component “VCBuild.exe”

1 提示找不到python环境变量:             一般错误信息中会提示找不到python2,需要安装python2,并且配置python环境变量。然后设置npm常用的python版本,用以下命令npm config set python python2.7  或者 npm install --python=python2.7 2 如果安装完之后...