首页 > 学院 > 开发设计 > 正文

【程序员技术练级】学习一门脚本语言python(一)文件处理

2019-11-14 16:54:24
字体:
来源:转载
供稿:网友

现在工作上主要用的语言是java,java在企业级的应用上能够发挥很好的用途,但有时候要做一个小功能时,比如批量更新文件,抓取网页等,这时候用java就显得太笨重了。因此就学习了python这门脚本语言。

这篇随笔主要是讲述python怎么处理文本文件,顺便巩固下python的一些基本知识。

好了,开始吧......

需求阐述

  • 处理文本文件:读一个本地文件,逐行处理

说到处理文件,不得不说下python的内置函数 open

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

 

函数定义:打开一个文件,并返回相应的文件Object,如果指定的文件不能打开,那么 OSError 将会抛出

 其中,file参数表示需要打开的文件名称,

mode是打开模式,

buffering用来控制文件的缓冲,默认值为0,表示不缓冲,设置为1就会有缓冲,

 encoding 为文件编码,默认为系统编码,

errors 是一个可选参数,用来指定当文件在编码和解码过程中发生错误将怎么处理,注意,这个错误处理不会应用在mode为二进制的模式('b')中,

newline 用来控制通用换行符的工作模式(只工作在文本模式中)

mode模式可以有以下几种:

字符意义
'r'以只读方式打开 (default)
'w'以写方式打开,首先会删掉文件内容
'x'当文件已存在时,已独占方式打开
'a'以写方式打开,当文件存在时,会在内容末尾添加内容
'b'二进制
't'文本模式 (default)
'+'更新一个磁盘文件 (reading and writing)
'U'universal newlines mode (已废弃)

一般情况下,使用open()函数时只需要调入文件名参数,而不添加其它任何参数,就可以获取文件内容。默认的模式是读模式,如果读取特殊文件(例如视频或者图片文件),那么必须使用‘b’模式。

 

 

 下面是处理文本的一个例子展示:

 1 # encoding=utf-8 2 file_path = "d:/test.txt" 3 file = open(file_path) 4  5 #####1. read()##### 6  7 PRint(file.read()) 8  9 #####2. readline()#####10 11 line = file.readline()12 while line:13     print(line)14     line = file.readline()15 16 #####2. readlines()#####17 18 for line in file.readlines():19     print(line)

20 file.close()

 

上面列出来3种读取file的方式: read()、 readline()、 readlines()

 

  • readlines最常用的一种方式,会把文件的每行内容转换成一个list,然后就可以进行各种操作
  • read: 表示一次性返回文件的全部内容
  • readline:返回文件的一行内容,下次调用时会继续读下一行,直到读取完

 

 ok,处理文件的例子就到这!

 


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表