文件的作用:
将数据长期保存下来,需要的时候使用
文本文件和二进制文件
在计算机中操作文件的套路非常固定,一共包含三个步骤:
序号 | 函数/方法 | 说明 |
---|---|---|
1 | open | 打开文件,并且返回文件操作对象 |
2 | read | 将文件内容读取到内存 |
3 | write | 将指定内容写入文件 |
4 | close | 关闭文件 |
file = open("test.txt")
text = file.read()
print(text)
file.close()
文件指针:
文件指针标记从哪个位置开始读取数据
第一次打开文件时,通常文件指针会指向文件的开始位置
当执行了read()方法后,文件指针会移动到读取内容的末尾
默认情况下会移动到文件末尾
f = open("文件名", "访问方式")
访问方式 | 说明 |
---|---|
r | 以只读方式打开文件.文件的指针将会放在文件的开头,这是默认模式.如果文件不存在,抛出异常 |
w | 以只写方式打开文件.如果文件存在会覆盖.如果文件不存在,创建新文件 |
a | 以追加方式打开文件.如果文件已存在,文件指针会放在文件的末尾.如果文件不存在,创建新文件进行写入 |
r+ | 以读写方式打开文件.文件的指针将会放在文件的开头.如果文件不存在,抛出异常 |
w+ | 以读写方式打开文件.如果文件存在会被覆盖.如果文件不存在,创建新文件 |
a+ | 以读写方式打开文件.如果文件已存在,文件指针会放在文件的末尾.如果文件不存在,创建新文件进行写入 |
提示:
readline方法
读取大文件的正确姿势
file = open("test")
while True:
text = file.readline()
# 判断到是否读取到内容
if not text:
break
print(text)
file.close()
目标
用代码的方式,实现文件的复制过程
小文件复制
file_1 = open("test_1")
file_2 = open("test_2", "w")
file_2.write(file_1.read())
file_1.close()
file_2.close()
大文件复制
file_1 = open("test_1")
file_2 = open("test_2", "a")
# file_2.write(file_1.read())
while True:
text_line = file_1.readline()
if not text_line:
break
file_2.write(text_line)
file_1.close()
file_2.close()
在终端/文件浏览器中可以执行常规的文件/目录管理操作,比如:
创建、重命名、删除、改变路径、查看目录内容…
在Python中,如果希望通过程序实现以上功能,需要导入os模块
序号 | 方法名 | 说明 | 示例 |
---|---|---|---|
01 | rename | 重命名文件 | os.rname(源文件名, 目标文件名) |
02 | remove | 删除文件 | os.remove(文件名) |
序号 | 方法名 | 说明 | 示例 |
---|---|---|---|
01 | listdir | 目录列表 | os.listdir(目录名) |
02 | mkdir | 创建目录 | os.mkdir(目录名) |
03 | rmdir | 删除目录 | os.rmdir(目录名) |
04 | getcwd | 获取当前目录 | os.getcwd() |
05 | chdir | 修改工作目录 | os.chdir(目标目录) |
06 | path.isdir | 判断是否是文件 | os.path.isdir(文件路径) |
Python 2.x默认使用ASCII编码
Python 3.x默认使用UTF-8编码
ASCII编码
计算机中只有256个ASCII字符
一个ASCII字符在内存中占1个字节的空间
8个0/1的排列组合一共有256中,也就是2**8
UNICODE编码
计算机中使用1~6个字节来表示一个UTF-8字符,涵盖了地球上几乎所有地区的文字
大多数汉子会使用3个字节表示
UTF-8是UNICODE编码的一种编码格式
Python 2.x默认使用ASCII编码格式
Python 3.x默认使用UTF-8编码格式
# *-* coding:utf8 *-*
上面这是官方推荐使用的,或者
# coding=utf8
unicode字符串