首页 > 编程 > Python > 正文

python 实时遍历日志文件

2020-01-04 17:33:02
字体:
来源:转载
供稿:网友
这篇文章主要介绍了python 实时遍历日志文件 的相关资料,需要的朋友可以参考下
 

open 遍历一个大日志文件

使用 readlines() 还是 readline() ?

总体上 readlines() 不慢于python 一次次调用 readline(),因为前者的循环在C语言层面,而使用readline() 的循环是在Python语言层面。

但是 readlines() 会一次性把全部数据读到内存中,内存占用率会过高,readline() 每次只读一行,对于读取 大文件, 需要做出取舍。

如果不需要使用 seek() 定位偏移, for line in open('file') 速度更佳。

使用 readlines(),适合量级较小的日志文件

import osimport timedef check():p = while True:f = open("log.txt", "r+")f = open("result.txt", "a+")f.seek(p, )#readlines()方法filelist = f.readlines()if filelist:for line in filelist:#对行内容进行操作f.write(line)#获取当前位置,为下次while循环做偏移p = f.tell()print 'now p ', pf.close()f.close()time.sleep()if __name__ == '__main__':check() 

使用 readline(),避免内存占用率过大

import osimport timedef check():p = while True:f = open("log.txt", "r+")f = open("result.txt", "a+")f.seek(p, )#while readline()方法while True:l = f.readline()#空行同样为真if l:#对行内容操作f.write(l)else:#获取当前位置,作为偏移值p = f.tell()f.close()f.close()breakprint 'now p', ptime.sleep()if __name__ == '__main__':check()

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表