def open (file,mode='r',buffering=None, encoding=None,errors=None,newline=None,closefd=True): # known special case of open
打开文件返回流。如果失败,抛异常:IOError
file指定要打开的文件的文本名称(如果文件不在当前工作目录,则表示文件路径)或者整数形式的文件描述符。(如果赋值文件描述符,则当该方法返回的I/O对象关闭的时候文件描述符关闭,除非closefd设置为False)
mode是一个可选的字符串,用于指定以什么模式打开文件。默认是'r',表示以只读的文本模式打开文件。其他常用值'w'表示写(如果文件存在就清空文件内容),'x'表示创建一个新文件并以写模式打开,'a'表示追加(对于一些Unix系统,不管当前的seek位置,仅仅是追加到文件的末尾)。在文本模式,如果没有指定encoding,则编码与平台有关:调用locale.getpreferredencoding(False)来获取当前的编码方式。(对于纯字节读写模式,不需要指定encoding) 可用的模式如下:
===============================================================
字符含义
--------- ---------------------------------------------------------------
'r' 打开只读(默认)
'w' 打开文件写,首先清空文件内容
'x' 创建一个新文件,打开文件写
'a' 打开文件写,如果文件存在,则在文件末尾追加
'b' 二进制模式
't' 文本模式(默认)
'+' 打开磁盘文件更新(读和写)
'U' 通用的newline模式(deprecated)
===============================================================
默认模式是'rt'(以文本模式打开读取)。对于二进制随机访问,'w+b'打开文件并清空文件内容为0字节,'r+b'打开文件不清空文件内容。'x'模式意味着'w',如果文件存在,则抛异常`FileExistsError`
即使底层操作系统不区分,Python也会区分文件是以二进制模式打开还是以文本模式打开。以二进制模式(在模式参数中添加'b')打开的文件返回不加任何解码的字节对象。文本模式打开的文件返回字符串,字节首先以平台相关的编码进行解码,或者使用指定的编码进行解码。'U'模式已经过时了在以后的Python版本中会抛异常。在Python3中没有任何作用。使用newline控制通用的newline模式。
buffering是可选的,值是整数,用于设置缓存策略。0表示关闭缓存(仅在二进制模式可用),1表示缓存一行(仅对文本模式有效),任何>1的整数指定片段缓存的大小值(字节值)。如果不指定缓存参数,默认的缓存策略如下:
* 二进制文件以定长的片段进行缓存;缓存的大小一般是底层设备的"block size" 即`io.DEFAULT_BUFFER_SIZE`。在很多操作系统中,缓存大小典型值为4096或8192个字节。
* “交互式”文本文件(调用isatty()返回True的文件)使用行缓存。其他文本文件使用上述二进制文件的缓存策略。
encoding 用于对文件进行编码和解码的编码名称。只用于文本模式。默认编码方式是平台相关的,可以指定任何Python支持的编码名称。Python支持的编码方式可以查看codecs模块。
errors是一个可选字符串,它指定如何处理编码和解码错误-不能在二进制模式下使用。可以使用各种标准错误处理程序(在“错误处理程序”下列出),尽管已向codecs.register_error()注册的任何错误处理名称也有效。标准名称包括:
'strict':如果存在编码错误,则抛出ValueError异常。默认值None具有相同的效果。
'ignore':忽略错误。请注意,忽略编码错误可能会导致数据丢失。
'replace':导致替换标记(例如“?”)插入到数据格式不正确的地方。
'surrogateescape':将表示所有不正确的字节,作为Unicode私有使用区中从U + DC80到U + DCFF的代码点。当在写入数据时使用surrogateescape错误处理程序时,这些专用代码点将被转换回相同的字节。这对于处理未知编码的文件很有用。
'xmlcharrefreplace':仅在写入文件时才支持"xmlcharrefreplace"。编码不支持的字符被替换为适当的XML字符引用nnn;。
'backslashreplace':用Python的反斜杠转义序列替换格式错误的数据。
'namereplace':(仅在写入时也受支持)用\N {...}转义序列替换不支持的字符。
newline 控制如何设置新行(仅对文本模式有效)。可以是None、''、'\n'、'\r'以及'\r\n'。It works as follows:
* 对于输入,如果newline是None,使用通用新行模式。输入中的行可以以'\n'、'\r'或者'\r\n'结尾,这些符号会首先转换为'\n'然后再返回给调用者。如果是'',也使用通用的新行模式,但是行结尾字符会直接返回给调用者而不做任何转换。如果指定了其他合法的值,则按照给定值截取行,行的结尾字符直接返回给调用者而不做任何转换。
* 对于输出,如果newline是None,任何'\n'字符会转换为系统默认的行分隔符,即os.linesep。如果指定为''或者'\n',不做任何转换如果是其他合法字符,任何'\n'字符会转换为给定的字符。
如果closefd为False并且给出了文件描述符而不是文件名,则在关闭文件时,基础文件描述符将保持打开状态。 如果给定文件名,closefd必须为True(默认值),否则将引发错误。
open()返回一个file对象,它的类型依赖于打开的模式,根据打开的模式对文件进行标准的读写操作。当使用文本模式打开一个文件('w'、'r'、'wt'、'rt'等),open()方法返回一个TextIOWrapper对象。当使用二进制模式打开一个文件,返回的类有几种情况:二进制度模式open()方法返回的对象是BufferedReader,二进制写模式open()方法返回的是BufferedWriter,读/写模式,返回的是BufferedRandom。
也有可能使用字符串或字节数组作为文件来读写。字符串可以使用StringIO以文本模式的文件来操作,字节可以使用BytesIO以二进制模式的文件来操作。
"""
pass
模式和解释
模式 |
备注 |
t |
文本模式 (默认)。 |
x |
写模式,新建一个文件,如果该文件已存在则会报错。 |
b |
二进制模式。 |
+ |
打开一个文件进行更新(可读可写)。 |
U |
通用换行模式(Python 3 不支持)。 |
r |
以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb |
以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ |
打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ |
以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w |
打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb |
以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ |
打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ |
以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a |
打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab |
以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ |
打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ |
以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
file对象方法
常用方法 |
备注 |
file.close() |
关闭文件。关闭后文件不能再进行读写操作。 |
file.flush() |
刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。 |
file.fileno() |
返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。 |
file.isatty() |
如果文件连接到一个终端设备返回 True,否则返回 False。 |
file.next() |
Python 3 中的 File 对象不支持 next() 方法。 返回文件下一行。 |
file.read([size]) |
从文件读取指定的字节数,如果未给定或为负则读取所有。 |
file.readline([size]) |
读取整行,包括 "\n" 字符。 |
file.readlines([sizeint]) |
读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。 |
file.seek(offset[, whence]) |
设置文件当前位置 |
file.tell() |
返回文件当前位置。 |
file.truncate([size]) |
从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。 |
file.write(str) |
将字符串写入文件,返回的是写入的字符长度。 |
file.writelines(sequence) |
向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。 |
os模块
函数 |
备注 |
os.access(path, mode) |
检验权限模式 |
os.chdir(path) |
改变当前工作目录 |
os.chflags(path, flags) |
设置路径的标记为数字标记。 |
os.chmod(path, mode) |
更改权限 |
os.chown(path, uid, gid) |
更改文件所有者 |
os.chroot(path) |
改变当前进程的根目录 |
os.close(fd) |
关闭文件描述符 fd |
os.closerange(fd_low, fd_high) |
关闭所有文件描述符,从 fd_low (包含) 到 fd_high (不包含), 错误会忽略 |
os.dup(fd) |
复制文件描述符 fd |
os.dup2(fd, fd2) |
将一个文件描述符 fd 复制到另一个fd2 |
os.fchdir(fd) |
通过文件描述符改变当前工作目录 |
os.fchmod(fd, mode) |
改变一个文件的访问权限,该文件由参数fd指定,参数mode是Unix下的文件访问权限。 |
os.fchown(fd, uid, gid) |
修改一个文件的所有权,这个函数修改一个文件的用户ID和用户组ID,该文件由文件描述符fd指定。 |
os.fdatasync(fd) |
强制将文件写入磁盘,该文件由文件描述符fd指定,但是不强制更新文件的状态信息。 |
os.fdopen(fd[, mode[, bufsize]]) |
通过文件描述符 fd 创建一个文件对象,并返回这个文件对象 |
os.fpathconf(fd, name) |
返回一个打开的文件的系统配置信息。name为检索的系统配置的值,它也许是一个定义系统值的字符串,这些名字在很多标准中指定(POSIX.1, Unix 95, Unix 98, 和其它)。 |
os.fstat(fd) |
返回文件描述符fd的状态,像stat()。 |
os.fstatvfs(fd) |
返回包含文件描述符fd的文件的文件系统的信息,Python 3.3 相等于 statvfs()。 |
os.fsync(fd) |
强制将文件描述符为fd的文件写入硬盘。 |
os.ftruncate(fd, length) |
裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。 |
os.getcwd() |
返回当前工作目录 |
os.getcwdu() |
返回一个当前工作目录的Unicode对象 |
os.isatty(fd) |
如果文件描述符fd是打开的,同时与tty(-like)设备相连,则返回true, 否则False。 |
os.lchflags(path, flags) |
设置路径的标记为数字标记,类似 chflags(),但是没有软链接 |
os.lchmod(path, mode) |
修改连接文件权限 |
os.lchown(path, uid, gid) |
更改文件所有者,类似 chown,但是不追踪链接。 |
os.link(src, dst) |
创建硬链接,名为参数 dst,指向参数 src |
os.listdir(path) |
返回path指定的文件夹包含的文件或文件夹的名字的列表。 |
os.lseek(fd, pos, how) |
设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix,Windows中有效 |
os.lstat(path) |
像stat(),但是没有软链接 |
os.major(device) |
从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。 |
os.makedev(major, minor) |
以major和minor设备号组成一个原始设备号 |
os.makedirs(path[, mode]) |
递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。 |
os.minor(device) |
从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。 |
os.mkdir(path[, mode]) |
以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。 |
os.mkfifo(path[, mode]) |
创建命名管道,mode 为数字,默认为 0666 (八进制) |
os.mknod(filename[, mode=0600, device]) |
创建一个名为filename文件系统节点(文件,设备特别文件或者命名pipe)。 |
os.open(file, flags[, mode]) |
打开一个文件,并且设置需要的打开选项,mode参数是可选的 |
os.openpty() |
打开一个新的伪终端对。返回 pty 和 tty的文件描述符。 |
os.pathconf(path, name) |
返回相关文件的系统配置信息。 |
os.pipe() |
创建一个管道. 返回一对文件描述符(r, w) 分别为读和写 |
os.popen(command[, mode[, bufsize]]) |
从一个 command 打开一个管道 |
os.read(fd, n) |
从文件描述符 fd 中读取最多 n 个字节,返回包含读取字节的字符串,文件描述符 fd对应文件已达到结尾, 返回一个空字符串。 |
os.readlink(path) |
返回软链接所指向的文件 |
os.remove(path) |
删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。 |
os.removedirs(path) |
递归删除目录。 |
os.rename(src, dst) |
重命名文件或目录,从 src 到 dst |
os.renames(old, new) |
递归地对目录进行更名,也可以对文件进行更名。 |
os.rmdir(path) |
删除path指定的空目录,如果目录非空,则抛出一个OSError异常。 |
os.stat(path) |
获取path指定的路径的信息,功能等同于C API中的stat()系统调用。 |
os.stat_float_times([newvalue]) |
决定stat_result是否以float对象显示时间戳 |
os.statvfs(path) |
获取指定路径的文件系统统计信息 |
os.symlink(src, dst) |
创建一个软链接 |
os.tcgetpgrp(fd) |
返回与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组 |
os.tcsetpgrp(fd, pg) |
设置与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组为pg。 |
os.ttyname(fd) |
返回一个字符串,它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联,则引发一个异常。 |
os.unlink(path) |
删除文件路径 |
os.utime(path, times) |
返回指定的path文件的访问和修改的时间。 |
os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]]) |
输出在文件夹中的文件名通过在树中游走,向上或者向下。 |
os.write(fd, str) |
写入字符串到文件描述符fd中,返回实际写入的字符串长度 |
os.path模块 |
获取文件的属性信息。 |
os.system(command) |
在子shell中执行操作系统命令 |
import os
读文件
file = open(r'E:\大数据数据搜集的网站.txt','r',encoding='utf-8')
for line in file.readlines():
print(line)
file.close()
写文件
file = open(r'E:\mydata.txt', 'w', encoding='utf-8')
for i in range(10):
file.write('1234567890\n')
file.close()
file = open(r'E:\mydata.txt', 'r', encoding='utf-8')
file.seek(5)
print(file.readline())
file.seek(100)
print(file.readline())
print(file.tell())
file.close()
file = open(r'E:\大数据数据搜集的网站.txt', 'r', encoding='utf-8')
file1 = open(r'E:\mydata.txt', 'w', encoding='utf-8')
for line in file.readlines():
file1.write(line)
file1.write("\n")
file.close()
file1.flush()
file1.close()
import os
mydir = r'E:\Anaconda3'
print(os.path.isdir(mydir))
if os.path.isdir(mydir):
print("目录:", mydir)
files = os.listdir(mydir)
for myfile in files:
if os.path.isdir(mydir + "\\" + myfile):
print("目录:", myfile)
else:
print("文件:", myfile)