Day12 generator & file operation

1 生成式

生成式本质还是生成器，只是写法更简洁

1.1 生成式的语法1

语法：
（表达式 for 变量 in 序列）
展开: (生成式比较复杂可以展开来看)

"""
def func():
    for 变量 in 序列:
        yield 表达式
func()
"""

说明
- （） - 固定写法
- 表达式 - 除了赋值语句以外的任何语句，比如：数据、赋值过的变量、运算表达式、函数调用表达式等注意：这个表达式一般和后面的变量有联系

gen1 = (10 for x in range(5))
print(next(gen1))
print(next(gen1))
print(next(gen1))
print(next(gen1))
print(next(gen1))

gen2 = ("str" + str(x) for x in range(5))
for str1 in gen2:
    print(str1)

dict1 = {"a": 1, "b": 2, "c": 3}
gen3 = ((value, key) for key, value in dict1.items())
print(next(gen3)) # (1, 'a')
print(dict(gen3)) # {2: 'b', 3: 'c'}

联系：一句代码实现交换一个字典的key和value

dict2= dict((value, key) for key, value in dict1.items())
print(dict2)

练习：实现自己的dict函数，可以将序列转化为字典

gen4 = ((value, key) for key, value in dict1.items())
def dict_change(seq):
    dict3 = {}
    for item in seq:
        list_item = list(item)
        if len(list_item) == 2:
            dict3[list_item[0]] = list_item[1]
        else:
            print("数据类型不支持")
            break
    return dict3
print(dict_change(gen4))

1.1 生成式的语法2

语法
(表达式 for 变量 in 序列 if 条件语句）
展开

"""
def func():
    for 变量 in 序列:
        if 条件语句：
            yield 表达式
gen = func()
"""

gen = ('str%d' % x for x in range(15) if x % 2)

for item in gen:
    print(item)

1.3 补充： python的三目运算符

c语言 - 条件语句？值1 : 值2 （如果条件语句为真整个表达式的结果是值1，否则是值2）
python语言 - 值1 if 条件语句 else 值2
result = a if a > b else b

a = 10
b = 20

result = a if a > b else b
print(result)

# 展开
if a > b:
    result = a
else:
    result = b

2 file operation

2.1 数据持久化

为什么需要数据持久化
- 程序中产生的数据默认是保存在内存中，程序结束数据会自动销毁。如果希望程序结果数据不销毁，那么需要对这个数据做数据持久化
什么是数据持久化
- 数据持久化就是将数据保存到文件中，然后将文件保存在磁盘/硬盘中

2.2 文件操作(对文件内容进行操作)

2.2.1 基本步骤

打开文件 -> 操作文件(读/写) -> 关闭文件(文件对象.close())

2.2.2 打开文件

open(file, mode='r',encoding=None) - 以指定的方式打开文件，并且返回文件对象

file - 字符串,文件路径, 可以写绝对路径也可以写相对路径
- 绝对路径(一般不用) - 完整路径,例如:/Users/yuting/Workspace/JAVA/授课/python1902/day12-文件操作/test.txt
- 相对路径(需要先将文件保存在工程目录下) 注意: 当前目录指的是当前代码所在文件对应的目录
  ./ - 代表当前目录(./可以省略)
  ../ - 代表当前目录的上层目录
  .../ - 代表当前目录的上层目录的上层目录
mode - 字符串，文件的打开方式(决定打开文件后能够进行的操作，和操作方式)

mode	解释
'r'	以只读的方式打开文件, 读出来的数据是字符串
'w'	只写，写之前会清空文件的内容，写入的数据是字符串
'a'	以只写的方式打开文件, 写入的数据是字符串(在原文件的最后添加内容)
'rb'/'br'	以只读的方式打开文件, 读出来的数据是二进制数据
'wb'/'bw'	打以只写的方式打开文件, 写入的数据是二进制数据

注意：二进制文件一般用于视频、音频、图片
如果是以读的方式打开文件,文件不存在会报错（FileNotFindError）
如果是以写的方式打开文件，文件不存在不会报错，并且会自动创建这个文件

encoding - 字符,文本编码方式
'utf-8'(mac) - 支持中文
'gbk'(windows) - 只支持英文

注意: 只有文本文件才能设置encoding，二进制操作不能设置encoding

open(r'D:\Python1902\py1902\day12文件操作\test.txt') # 使用绝对路径打开test.txt文件
open('./test.txt') # 使用相对路径打开，文件和py文件在一个目录下 ./可省略
open('./files/test2.txt')  #使用相对路径打开和py文件在一个目录下的目录files下的文件

# f保存文件对象, 只有打开文件才能得到文件对象
f = open('test.txt', 'r', encoding='utf-8')

打开文件简写方式
with open(file, mode='r',encoding=None) as 文件对象:
文件的操作

2.2.3 操作文件

读操作：

函数	解释
read([size])	读取文件(读取size字节，默认读取全部)
readline([size])	读取一行,如果指定size，将读入指定的字符数
readlines()	把文件内容按行全部读入，返回一个包含所有行的列表

f = open('test.txt', 'r', encoding='utf-8')
content = f.read()     # 读所有
print(type(content))
print(content)

# 设置读写位置在文件开头
f.seek(0)

print('=================读一行=============')
f1 = open('test.txt', 'r', encoding='utf-8')
print(f1.readline())
print(f1.readline())
# 读不到内容的时候返回空串
content = f1.readline()
print('==:', content, type(content))

练习: 读一个本地的txt文件中的内容，一行一行的读，读完为止

f1 = open('test.txt', 'r', encoding='utf-8')

while True:
    content = f1.readline()
    print(content)
    if not content:
        break

#fread()和freadlines()会一次读入文件全部内容，如果文件太大，会直接耗尽内存的，因为文件对象可迭代，所以可以用for循环遍历文件读取
with open('qfile.txt','r',encoding='utf-8')  as fp:
    for line in fp:
        print(line.strip())   #注意无论是read、readline、readlines都会读入行末的\n，所以需要手动剔除\n

写操作
文件对象.write(内容) - 将内容写入指定文件
'w'/'a' - 内容要求是字符串类型
'bw'/'wb' - 内容要求是二进制(bytes)

f2 = open('test.txt', 'w', encoding='utf-8')
f2.write('世人皆说官人好，没关系，当不了。\n常加班，起不早，挣的不够去搓澡。\nBUG、CODE知多少，只是屏幕显人老。')
f2.write('hello python')

关闭文件
f.close()

2.2.4 字节类型(bytes)

数据来源:
- 将其他类型转换成bytes类型:
  整型和字符串都可以转换成bytes
- 以'rb'/'br'的方式读文件
字节类型转换

# 整型转bytes
print(bytes(True))
# 字符串转bytes
b1 = bytes('你好！', encoding='utf-8')
print(b1)
b1 = '你好！'.encode()
print(b1)

# 将bytes转字符串
str1 = str(b1, encoding='utf-8')
print('str1:', str1)
str1 = b1.decode(encoding='utf-8')
print('str1:', str1)

2.2.5 二进制文件的读写

图片、视频、音频等都是二进制文件。这些文件只能以带'b'的方式打开然后操作

# 二进制读操作
image_f = open('files/luffy.jpeg', 'rb')
image_data = image_f.read()
print(type(image_data), image_data)

# 下载网络图片
import requests
response = requests.get('https://www.baidu.com/img/bd_logo1.png?qua=high')

# 二进制写操作
n_f = open('new.jpeg', 'wb')
n_f.write(response.content)

2.2.6 数据持久化

实现方法
- 要为这个数据创建对应的本地文件
- 程序中需要这个数据的时候从文件中去读这个数据的值
- 这个数据的值发生改变后要将最新的数据更新到本地文件中
练习：统计程序启动次数(将当前程序的启动次数打印出来)

# 1.将数据从文件中读出来
with open('files/count.txt', encoding='utf-8') as f:
    count = int(f.read())

# 2.更新数据
count += 1
print(count)

# 3.更新文件
with open('files/count.txt', 'w', encoding='utf-8') as f:
    f.write(str(count))

3 json文件

3.1 什么是json数据(特别重要，实用性！)

满足json格式要求的数据就是json数据; 文件内容满足json格式要求，就是json文件

3.2 json格式要求:

一个json中有且只有一个数据
这个必须是json支持的数据类型的数据

3.3 json支持的数据类型

数据类型	解释
数字类型(number)	包含所有的数字(整数和小数),并且支持科学计数法,例如: 10, 23.12, 3e2
字符串(string)	使用双引号引起来的字符集，支持转义字符,例如: "abc", "12山东黄金", "123\nabc", "\u4e00"
布尔(boolean)	只有true,false两个值
数组(array)	相当于python中的列表, [12, "avc", true, [1, 3]]
字典(dictionary)	相当于python中的字典，{"name": "张三", "age":18} , 键只能是字符串，值任意
null	相当于None，空值

3.4 python数据和json数据的相互转换

python中内置了一个json模块，用来支持json相关操作需要导入:import json

3.4.1 json转python

json数据类型	python数据类型
数字	int/float
字符串	str, 有可能将双引号变成单引号
布尔	bool, true -> True, false -> False
数组	list
字典	dict
null	None

json.loads(字符串, encoding=编码方式) - 将字符串转换成python对应的数据
注意: 这儿的字符串要求字符串中的内容必须是json格式数据(去掉字符串最外面的引号，本身就是一个json数据)

result = json.loads('"abc"', encoding='utf-8')
print([result])

result = json.loads('true', encoding='utf-8')
print([result])

result = json.loads('[12, true, "abc", null]', encoding='utf-8')
print(result, type(result))

3.4.2 python转json

python数据类型	json数据类型
int/float	数字
bool	布尔，True -> true, False -> false
str	字符串，单引号会变成双引号
list/tuple	数组
dict	字典
None	null

json.dumps(数据) - 将python数据转换成json格式的字符串

result = json.dumps(100)
print([result])

result = json.dumps('hello python')
print([result])

result = json.dumps(True)
print([result])

result = json.dumps({12: 23, 'name': '小明', 'gender': True, 'score': None})
print([result])

# 将一个文件中的字典导入
with open('files/test2.txt') as f:
    content = f.read()
    dict1 = json.loads(content, encoding='utf-8')
    print(dict1['age'])

load 和 dump 方法：针对文件操作后面加s是针对文件内容操作

with open('aa.txt', 'r', encoding='utf-8') as f:
    # result = json.load(f)
    result = json.loads(f.read())
    print(type(result), result)

with open('aa.txt', 'w', encoding='utf-8') as f:
    # json.dump([1, 'abc', True], f)
    data = json.dumps([1, 'abc', True])
    f.write(data)