Day12 generator & file operation

1 生成式

生成式本质还是生成器,只是写法更简洁

1.1 生成式的语法1

  • 语法:
    (表达式 for 变量 in 序列)

  • 展开: (生成式比较复杂可以展开来看)

"""
def func():
    for 变量 in 序列:
        yield 表达式
func()
"""
  • 说明
    • () - 固定写法
    • 表达式 - 除了赋值语句以外的任何语句,比如:数据、赋值过的变量、运算表达式、函数调用表达式等 注意: 这个表达式一般和后面的变量有联系
gen1 = (10 for x in range(5))
print(next(gen1))
print(next(gen1))
print(next(gen1))
print(next(gen1))
print(next(gen1))
gen2 = ("str" + str(x) for x in range(5))
for str1 in gen2:
    print(str1)
dict1 = {"a": 1, "b": 2, "c": 3}
gen3 = ((value, key) for key, value in dict1.items())
print(next(gen3)) # (1, 'a')
print(dict(gen3)) # {2: 'b', 3: 'c'}
  • 联系:一句代码实现交换一个字典的key和value
dict2= dict((value, key) for key, value in dict1.items())
print(dict2)
  • 练习:实现自己的dict函数,可以将序列转化为字典
gen4 = ((value, key) for key, value in dict1.items())
def dict_change(seq):
    dict3 = {}
    for item in seq:
        list_item = list(item)
        if len(list_item) == 2:
            dict3[list_item[0]] = list_item[1]
        else:
            print("数据类型不支持")
            break
    return dict3
print(dict_change(gen4))

1.1 生成式的语法2

  • 语法
    (表达式 for 变量 in 序列 if 条件语句)
  • 展开
"""
def func():
    for 变量 in 序列:
        if 条件语句:
            yield 表达式
gen = func()
"""
gen = ('str%d' % x for x in range(15) if x % 2)

for item in gen:
    print(item)

1.3 补充: python的三目运算符

  • c语言 - 条件语句?值1 : 值2 (如果条件语句为真整个表达式的结果是值1,否则是值2)
  • python语言 - 值1 if 条件语句 else 值2
    result = a if a > b else b
a = 10
b = 20

result = a if a > b else b
print(result)

# 展开
if a > b:
    result = a
else:
    result = b

2 file operation

2.1 数据持久化

  • 为什么需要数据持久化
    • 程序中产生的数据默认是保存在内存中,程序结束数据会自动销毁。如果希望程序结果数据不销毁,那么需要对这个数据做数据持久化
  • 什么是数据持久化
    • 数据持久化就是 将数据保存到文件中,然后将文件保存在磁盘/硬盘中

2.2 文件操作(对文件内容进行操作)

2.2.1 基本步骤

  • 打开文件 -> 操作文件(读/写) -> 关闭文件(文件对象.close())

2.2.2 打开文件

open(file, mode='r',encoding=None) - 以指定的方式打开文件,并且返回文件对象

  • file - 字符串,文件路径, 可以写绝对路径也可以写相对路径

    • 绝对路径(一般不用) - 完整路径,例如:/Users/yuting/Workspace/JAVA/授课/python1902/day12-文件操作/test.txt
    • 相对路径(需要先将文件保存在工程目录下) 注意: 当前目录指的是当前代码所在文件对应的目录
      ./ - 代表当前目录(./可以省略)
      ../ - 代表当前目录的上层目录
      .../ - 代表当前目录的上层目录的上层目录
  • mode - 字符串,文件的打开方式(决定打开文件后能够进行的操作,和操作方式)

mode 解释
'r' 以只读的方式打开文件, 读出来的数据是字符串
'w' 只写,写之前会清空文件的内容, 写入的数据是字符串
'a' 以只写的方式打开文件, 写入的数据是字符串(在原文件的最后添加内容)
'rb'/'br' 以只读的方式打开文件, 读出来的数据是二进制数据
'wb'/'bw' 打 以只写的方式打开文件, 写入的数据是二进制数据

注意:二进制文件一般用于视频、音频、图片
如果是以读的方式打开文件,文件不存在会报错(FileNotFindError)
如果是以写的方式打开文件,文件不存在不会报错,并且会自动创建这个文件

  • encoding - 字符,文本编码方式
    'utf-8'(mac) - 支持中文
    'gbk'(windows) - 只支持英文

注意: 只有文本文件才能设置encoding,二进制操作不能设置encoding

open(r'D:\Python1902\py1902\day12文件操作\test.txt') # 使用绝对路径打开test.txt文件
open('./test.txt') # 使用相对路径打开,文件和py文件在一个目录下 ./可省略
open('./files/test2.txt')  #使用相对路径打开和py文件在一个目录下的目录files下的文件

# f保存文件对象, 只有打开文件才能得到文件对象
f = open('test.txt', 'r', encoding='utf-8')
  • 打开文件简写方式
    with open(file, mode='r',encoding=None) as 文件对象:
    文件的操作

2.2.3 操作文件

  • 读操作:
函数 解释
read([size]) 读取文件(读取size字节,默认读取全部)
readline([size]) 读取一行,如果指定size,将读入指定的字符数
readlines() 把文件内容按行全部读入,返回一个包含所有行的列表
f = open('test.txt', 'r', encoding='utf-8')
content = f.read()     # 读所有
print(type(content))
print(content)

# 设置读写位置在文件开头
f.seek(0)

print('=================读一行=============')
f1 = open('test.txt', 'r', encoding='utf-8')
print(f1.readline())
print(f1.readline())
# 读不到内容的时候返回空串
content = f1.readline()
print('==:', content, type(content))
  • 练习: 读一个本地的txt文件中的内容,一行一行的读,读完为止
f1 = open('test.txt', 'r', encoding='utf-8')

while True:
    content = f1.readline()
    print(content)
    if not content:
        break
#fread()和freadlines()会一次读入文件全部内容,如果文件太大,会直接耗尽内存的,因为文件对象可迭代,所以可以用for循环遍历文件读取
with open('qfile.txt','r',encoding='utf-8')  as fp:
    for line in fp:
        print(line.strip())   #注意无论是read、readline、readlines都会读入行末的\n,所以需要手动剔除\n
  • 写操作
    文件对象.write(内容) - 将内容写入指定文件
    'w'/'a' - 内容要求是字符串类型
    'bw'/'wb' - 内容要求是二进制(bytes)
f2 = open('test.txt', 'w', encoding='utf-8')
f2.write('世人皆说官人好,没关系,当不了。\n常加班,起不早,挣的不够去搓澡。\nBUG、CODE知多少,只是屏幕显人老。')
f2.write('hello python')
  • 关闭文件
    f.close()

2.2.4 字节类型(bytes)

  • 数据来源:
    • 将其他类型转换成bytes类型:
      整型和字符串都可以转换成bytes
    • 以'rb'/'br'的方式读文件
  • 字节类型转换
# 整型转bytes
print(bytes(True))
# 字符串转bytes
b1 = bytes('你好!', encoding='utf-8')
print(b1)
b1 = '你好!'.encode()
print(b1)

# 将bytes转字符串
str1 = str(b1, encoding='utf-8')
print('str1:', str1)
str1 = b1.decode(encoding='utf-8')
print('str1:', str1)

2.2.5 二进制文件的读写

图片、视频、音频等都是二进制文件。这些文件只能以带'b'的方式打开然后操作

# 二进制读操作
image_f = open('files/luffy.jpeg', 'rb')
image_data = image_f.read()
print(type(image_data), image_data)

# 下载网络图片
import requests
response = requests.get('https://www.baidu.com/img/bd_logo1.png?qua=high')

# 二进制写操作
n_f = open('new.jpeg', 'wb')
n_f.write(response.content)

2.2.6 数据持久化

  • 实现方法

    • 要为这个数据创建对应的本地文件
    • 程序中需要这个数据的时候从文件中去读这个数据的值
    • 这个数据的值发生改变后要将最新的数据更新到本地文件中
  • 练习:统计程序启动次数(将当前程序的启动次数打印出来)

# 1.将数据从文件中读出来
with open('files/count.txt', encoding='utf-8') as f:
    count = int(f.read())

# 2.更新数据
count += 1
print(count)

# 3.更新文件
with open('files/count.txt', 'w', encoding='utf-8') as f:
    f.write(str(count))

3 json文件

3.1 什么是json数据(特别重要,实用性!)

满足json格式要求的数据就是json数据; 文件内容满足json格式要求,就是json文件

3.2 json格式要求:

  • 一个json中有且只有一个数据
  • 这个必须是json支持的数据类型的数据

3.3 json支持的数据类型

数据类型 解释
数字类型(number) 包含所有的数字(整数和小数),并且支持科学计数法,例如: 10, 23.12, 3e2
字符串(string) 使用双引号引起来的字符集,支持转义字符,例如: "abc", "12山东黄金", "123\nabc", "\u4e00"
布尔(boolean) 只有true,false两个值
数组(array) 相当于python中的列表, [12, "avc", true, [1, 3]]
字典(dictionary) 相当于python中的字典,{"name": "张三", "age":18} , 键只能是字符串,值任意
null 相当于None, 空值

3.4 python数据和json数据的相互转换

python中内置了一个json模块,用来支持json相关操作 需要导入:import json

3.4.1 json转python

json数据类型 python数据类型
数字 int/float
字符串 str, 有可能将双引号变成单引号
布尔 bool, true -> True, false -> False
数组 list
字典 dict
null None
  • json.loads(字符串, encoding=编码方式) - 将字符串转换成python对应的数据
  • 注意: 这儿的字符串要求字符串中的内容必须是json格式数据(去掉字符串最外面的引号,本身就是一个json数据)
result = json.loads('"abc"', encoding='utf-8')
print([result])

result = json.loads('true', encoding='utf-8')
print([result])

result = json.loads('[12, true, "abc", null]', encoding='utf-8')
print(result, type(result))

3.4.2 python转json

python数据类型 json数据类型
int/float 数字
bool 布尔,True -> true, False -> false
str 字符串, 单引号会变成双引号
list/tuple 数组
dict 字典
None null
  • json.dumps(数据) - 将python数据转换成json格式的字符串
result = json.dumps(100)
print([result])

result = json.dumps('hello python')
print([result])

result = json.dumps(True)
print([result])

result = json.dumps({12: 23, 'name': '小明', 'gender': True, 'score': None})
print([result])
# 将一个文件中的字典导入
with open('files/test2.txt') as f:
    content = f.read()
    dict1 = json.loads(content, encoding='utf-8')
    print(dict1['age'])
  • load 和 dump 方法: 针对文件操作 后面加s是针对文件内容操作
with open('aa.txt', 'r', encoding='utf-8') as f:
    # result = json.load(f)
    result = json.loads(f.read())
    print(type(result), result)

with open('aa.txt', 'w', encoding='utf-8') as f:
    # json.dump([1, 'abc', True], f)
    data = json.dumps([1, 'abc', True])
    f.write(data)

你可能感兴趣的:(Day12 generator & file operation)