回顾一下之前学到的编码和文件读写。
不同的编码方式:
编码和解码:
读文件的三步骤:
写文件的三步骤:
不同的读写方式:
好了,复习到此结束,接下来一起来做项目吧!
这个练习,会让你学会一种方法,可以直接修改原文件中的数据。
语文老师将一些古诗存在txt文档里,一句一行。
最近,他计划抽一些古诗,自己设置一些空来让学生默写。
请你用代码帮老师完成这项工作(只要处理了一个文档,加上循环就能处理无数个文档了)。
我们以李商隐的《锦瑟》为例,这是原文档里的内容:
锦瑟
[唐] 李商隐
锦瑟无端五十弦,
一弦一柱思华年。
庄生晓梦迷蝴蝶,
望帝春心托杜鹃。
沧海月明珠有泪,
蓝田日暖玉生烟。
此情可待成追忆,
只是当时已惘然。
老师在这首诗想考学生“一弦一柱思华年。”和“只是当时已惘然。”,即他想得到的是:
锦瑟
[唐] 李商隐
锦瑟无端五十弦,
__。
庄生晓梦迷蝴蝶,
望帝春心托杜鹃。
沧海月明珠有泪,
蓝田日暖玉生烟。
此情可待成追忆,
__。
先新建一个poem1.txt,然后将以下古诗内容复制到里面,并且保存,放到与.py文件同目录下。
锦瑟
[唐] 李商隐
锦瑟无端五十弦,
一弦一柱思华年。
庄生晓梦迷蝴蝶,
望帝春心托杜鹃。
沧海月明珠有泪,
蓝田日暖玉生烟。
此情可待成追忆,
只是当时已惘然。
最终结果是要将“一弦一柱思华年。”和“只是当时已惘然。”这两句古诗用“__”来代替。
那首先我们就要能找到这两句古诗,所以思路如下:
1.找到poem1.txt文件
2.逐行读取该文件中的内容
3.逐行判断该行的内容是否是要找的两句古诗:“一弦一柱思华年。”和“只是当时已惘然。”如果是,就替换为“——”并写入poem2.txt文件,如果不是就原样写入test.txt文件.
使用open()函数打开文件。
with open('poem1.txt', 'r', encoding='utf-8') as f:
open('poem1.txt', 'r', encoding='utf-8')
:使用 open()
函数打开名为 poem1.txt
的文本文件。第一个参数是文件路径,第二个参数 'r'
表示以只读模式打开文件,第三个参数 'utf-8'
指定文件编码为 UTF-8。with
语句:使用 with
打开文件,可以确保在操作完成后自动关闭文件,同时能够处理异常情况。lines = f.readlines()
print(lines)
f.readlines()
:使用文件对象 f
的 readlines()
方法,读取所有行,并将它们存储在一个列表 lines
中。print(lines)
:打印读取到的内容,这里是文件的所有行。注意,输出的每一行都会带有换行符 \n
。with open('test.txt', 'w', encoding='utf-8') as new:
for line in lines:
if line not in ['一弦一柱思华年。\n', '只是当时已惘然。\n']:
new.write(line)
else:
new.write('____________\n')
open('test.txt', 'w', encoding='utf-8')
:使用 open()
函数以写入模式打开名为 test.txt
的文件。第一个参数是文件路径,第二个参数 'w'
表示以写入模式打开文件(会覆盖原有内容),第三个参数 'utf-8'
指定文件编码为 UTF-8。with
语句:使用 with
打开文件,确保在操作完成后自动关闭文件。for line in lines:
:遍历 lines
列表中的每一行。if line not in ['一弦一柱思华年。\n', '只是当时已惘然。\n']:
:检查当前行是否不等于给定的两行文本。new.write(line)
:如果当前行不满足条件,则将其写入名为 new
的文件中。else:
:如果当前行满足条件,则将 '____________\n'
写入文件中。由于使用 with
打开文件,在操作完成后会自动关闭文件。无需再专门写关闭的代码。
with open ('poem1.txt','r',encoding='utf-8') as f:
lines = f.readlines() # 这时,lines 的数据存放在内存里。
print(lines) # 将读取到的内容打印出来,发现实际上读到的是带换行符的字符串。
with open('test.txt','w',encoding='utf-8') as new:
for line in lines: # 在内存中,对数据进行处理,然后再写到文档里,覆盖之前的内容。
if line not in ['一弦一柱思华年。\n','只是当时已惘然。\n']: # 注意:这里的条件要根据上面打印出的数据写。
new.write(line)
else:
new.write('____________\n')
这段代码的功能是将 poem1.txt
中的内容读取到内存中,进行处理后,再覆盖写入到 test.txt
文件中。具体处理方式是,如果某一行与给定的两行文本相等,则在 test.txt
中写入 '____________\n'
,否则直接将原始行写入 test.txt
。
也可以将目标语句放到一个list中,在判断的时候,如果属于这个list,就替换为“____________”
代码如下:
list_test = ['一弦一柱思华年。\n','只是当时已惘然。\n'] # 将要默写的诗句放在列表里。
with open ('poem1.txt','r') as f:
lines = f.readlines()
print(lines)
with open('test.txt','w') as new:
for line in lines:
if line in list_test: # 属于默写列表中的句子,将其替换成横线。
new.write('____________。\n')
else:
new.write(line)
通过这个项目的实操,我们掌握并巩固了以下几个知识点:
文件操作:学习如何使用 Python 进行文件的读写操作。通过 open()
函数打开文件,使用 'r'
模式进行读取,使用 'w'
模式进行写入。
上下文管理器:学习如何使用 with
语句来打开文件。with
语句可以确保在操作完成后自动关闭文件,同时能够处理异常情况,提高代码的健壮性。
读取文件内容:学习使用 readlines()
方法从文件对象中读取所有行,并将其存储在一个列表中。这样可以方便地对文件内容进行处理和操作。
字符串比较和处理:学习如何对读取到的文本字符串进行条件判断和处理。在示例代码中,通过判断是否与给定两行文本相等,来决定是否写入 '____________\n'
或原始行到目标文件。
文件编码设置:学习如何设置文件的编码。示例中使用了 'utf-8'
编码,确保正确读取和写入包含非英文字符的文本。
通过理解和应用这些知识点,可以更好地处理和操作文本文件,扩展其对文件操作的基础能力。
总结为表格:
下面是使用 Markdown 格式总结这段代码可以学到的知识的表格:
知识点 | 描述 |
---|---|
文件操作 | 学习如何使用 Python 进行文件的读写操作 |
上下文管理器 | 学习如何使用 with 语句来打开文件,自动关闭文件,并处理异常情况 |
读取文件内容 | 学习使用 readlines() 方法从文件对象中读取所有行,并存储在列表中 |
字符串比较处理 | 学习如何对读取到的文本字符串进行条件判断和处理 |
文件编码设置 | 学习如何设置文件的编码,以确保正确读取和写入包含非英文字符的文本 |
本节完美结束,撒花~希望大家多多练习,早日成为大神!