遍历Python中多个输入流的行
Python的内置open()函数以读/写模式打开一个文件,并对文件进行读/写操作。要批量处理多个文件,必须使用Python标准库的fileinput模块。该模块提供了Fileinput类,该类具有遍历文件的功能。该模块还出于相同目的定义了助手功能。
此模块的主要接口是input()函数。此函数返回Fileinput类的实例。
fileinput.input(files, inplace, mode)
files参数是一个或多个要一一读取的文件的名称。每个文件都充当生成器,并且可以使用for循环对其进行迭代。文件中的每一行都将打印在Python控制台上。
>>> for line in fileinput.input('data.txt'): print (line)
files参数可以是包含许多文件的元组。文件内容将一一显示。
>>> for line in fileinput.input(files=('a.txt', 'b.txt')): print (line)
Fileinput类也可以在with语句中用作上下文管理器。
>>> with fileinput.input(files=('a.txt', 'b.txt')) as f: for line in f: print (line)
fileinput模块具有以下定义的功能。
返回当前正在读取的文件的名称。
返回文件描述符整数。
返回正在读取的文件的行号。该数字是累积计数。
返回当前文件的行号。
如果正在读取当前文件的第一行,则isfirstline()返回true,否则返回false
以下语句打印文件中的每一行以及行号
>>> for line in fileinput.input('books.py'): print ('{}->{}'.format(fileinput.filelineno(), line))
上面代码的示例输出是
1->import sqlite3 2->conn = sqlite3.connect('c:/python36/books.db') 3->cursor = conn.cursor() 4->cursor.execute("SELECT * from books;") 5->print(cursor.fetchall())
以下代码在文件夹中打印每个文件名,并在其中带有编号的行。在此程序glob()
中,使用的函数可返回当前路径中的文件列表(可选),并带有匹配的通配符。这里glob('*。py')将返回当前文件夹中所有扩展名为.py的文件的列表。此列表用作fileinput.input()函数的files参数。
import fileinput, glob, sys for line in fileinput.input(glob.glob("*.py")): if fileinput.isfirstline(): print (fileinput.filename(),'>') sys.stdout.write ("{}.{}".format(fileinput.filelineno(),line))
注意isfirstline()
方法的使用。当新文件的迭代开始时,此函数返回true,并首先打印fileinput.filename()函数返回的文件名,然后显示带数字的行。例如
1.py > 1.a = 10 2.b = 20 3.print ('addition=',a+b) hello.py > 1.x = 10 2.y = 20 3.z = x+y 4.print ("x+y=",z)
就地参数
默认情况下,fileinput.input()函数的inplace=False。如果将其设置为True,则使输入文件可写。
假设有一个“msg.txt”,其中包含以下文本。
Hello Python. Good morning
以下代码使用fileinput模块打开文件并在适当位置修改其内容。
>>> for line in fileinput.input(files='msg.txt',inplace = True): line = line.replace('morning', 'evening') sys.stdout.write(line)
“msg.txt”将显示所做的更改。