python之旅

目录

  • 第一章 计算机基础
    • 1. 计算机概览
    • 1.1 计算机硬件
    • 1.2 常见的操作系统
    • 1.3 软件(解释器/编译器)
    • 1.4 进制
  • 第二章 python入门
    • 2.1 环境的安装
    • 2.2 编码
    • 2.3 变量
    • 2.4 python基础语法
      • 1. 多行显示
      • 2. 实现换行
      • 3. 多个变量赋值
      • 4. 成员运算符
      • 5. 身份运算符
      • 6. 不换行输出
      • 7. pyc 文件
    • 2.5 py2与py3的区别
      • Note
  • 第三章 数据类型
    • 3.1 int
    • 3.2 bool
    • 3.3 str " "
      • 1. 常用操作
      • 2. 其他操作
      • 3. 公共功能
    • 3.4 list []
      • 1. 常用操作
      • 2. 其他:
      • 3. 公共功能
    • 3.5 tuple ()
      • 1. 常用操作
      • 2. 内置函数
    • 3.6 dict {}
      • 1. 常用操作
      • 2. 其他
      • 3. 公共功能
      • 4. 有序字典
    • 3.7 set() /{}
      • 1. 常用操作
      • 2. 其他
      • 3. 公共功能
    • 3.8 公共功能
    • 3.9 嵌套&深浅copy
      • 1. 可嵌套的数据类型
    • 3.10 内存相关&深浅拷贝
      • 1. 内存相关
      • 2. 深浅拷贝
  • 第四章 文件操作
    • 4.1 文件基本操作
      • 1. 文件打开格式
      • 2. 文件写入格式
      • 3. 文件读取格式
      • 4. 文件的关闭
    • 4.2 打开模式
      • 1. mode 分类
    • 4.3 其他操作
      • 1. 文件定位
      • 2. 重命名和删除文件
      • 3. f.flush()
    • 4.4 一次性操作文件
    • 4.5 文件修改(示例)
  • 第五章 函数
    • 5.1 三元运算
    • 5.2 函数基础
      • 1. 定义函数
      • 2. 两种参数(示例)
      • 3. 函数的返回值
      • 4. 函数的四种方式
      • 5. 练习(3)
    • 5.3 变量作用域&嵌套
      • 1. 函数传参方式(2+1)
      • 2. 函数定义参数(3)
      • 3. 作用域&函数嵌套
    • 5.4 函数进阶
      • 1. 函数赋值
      • 2. 函数传参
      • 3. 函数作为返回值
      • 3. lambda表达式
      • 4. 内置函数(30)
    • 5.5 函数闭包
      • 1. 函数闭包
      • 2. 递归(效率较低)
    • 5.6 装饰器和推导式
      • 1. 装饰器(重点)
      • 2. 关于参数
      • 3. 推导式
    • 5.7迭代器&生成器
      • 1. 迭代器(class:iterator)
      • 2. 可迭代对象
      • 3. 生成器(函数的变异)(class:generator)
    • 5.8 异常处理
      • 1. 示例
      • 2. 基本格式
      • 3. 主动触发异常
      • 4. 自定义异常
  • 第六章 模块
    • 6.1 模块的导入
      • Note1(4)
    • 6.2 模块的基本知识
    • 6.3 内置模块(10)
      • 1. random(7)
      • 2. hashlib(1) / getpass
      • 3. time(2)
      • 4. sys (5)
      • 5. os(操作系统相关)(16)
      • 6. shutil(4)
    • 6.4 json
      • 1. json
      • 2. pickle
    • 6.5 time&datetime
      • 1. time
      • 2. datetime
    • 6.6 模块importlib
    • 6.7 日志(模块logging)
      • 1. 日志示例
      • 2. logging本质
      • 3. 示例
      • 4. 日志切割
    • 6.8 collections(python核心模块)
    • 6.9 struct模块
  • 第七章 面向对象
    • 7.1 面向对象基础
      • 1. 基础概念
      • 2. 对象的封装
      • 3. 继承
      • 4. 多态(多种形态/类型)
      • 5. 类的专有方法
      • 6. 运算符重载
    • 7.2 类成员(6)
      • 1. 类变量(静态字段/属性)
      • 2. 方法
      • 2.1 绑定/普通方法
      • 2.2 静态方法
      • 2.3 类方法
      • 3. 属性
      • 4. 成员修饰符
    • 7.3 特殊方法
      • 1. 嵌套
      • 2. 特殊成员
      • 3. 内置函数
      • 4. super()
    • 7.4 接口类和抽象类(约束)&反射
      • 1. 扩展
      • 2. 可迭代对象
      • 3. 抽象类/接口类(约束 源码)
      • 4. 反射
    • 7.5 单例&项目结构
      • 1. 单例模式
      • 2. 模块导入
      • 3. 项目开发规范
  • 番外篇之正则
    • 1. 基本概念
    • 2. 规则
      • 2.1 元字符
      • 2.2 量词(6)
      • 2.3 贪婪匹配/惰性匹配
      • 2.4 示例
    • 3. re模块
      • 3.1 compile()
      • 3.2 re.match()
      • 3.3 search()
      • 3.4 findall()
      • 3.5 finditer()
      • 3.6 split()
      • 3.7 sub()/ subn()
    • 4. 分组
      • 4.1 特殊分组用法
      • 4.2. group()
      • 4.3 分组命名
      • 4.4 引用分组
      • 4.5 取消分组优先
      • 4.6 split,保留分割符
    • 5. 练习
  • 第八章 网络编程
    • 8.1 网络基础
      • 1. 基本概念(2)
      • 2. 网络中的概念(7)
    • 8.2 OSI&TCP/IP
      • 1. TCP协议(6)
      • 2. UDP协议
      • 3. OSI(Open System Interconnection)
      • 4. socekt(套接字)
    • 8.3 Socket模块
      • 1. socket参数的详解
      • 2. TCP信息传输
      • 3. TCP黏包问题
      • 4. UDP信息传输
      • 5. socket其他操作
    • 8.4 非阻塞模型
      • 1. 非阻塞io模型模型
      • 2. 验证客户端的合法性
    • 8.5 socketserver模块
      • 1. socketserver模块
      • 2. socketserver模块进阶
  • 第九章 并发编程
    • 9.1 操作系统基础
      • 1. 操作系统发展史
      • 2. 进程
      • 3. 同步异步阻塞非阻塞
      • 4. 进程的三状态图
    • 9.2 进程
      • 1. 进程与线程
      • 2. 进程的创建
    • 9.3 锁&进程间通信
      • 1. Process类
      • 2. 锁
      • 3. 进程间的通信
    • 9.4 cp模型&线程
      • 1. 生产者消费者模型
      • 2. 进程间数据共享
      • 3. 线程
      • 4. python操作线程(重点)
    • 9.5 锁&池
      • 1. 互斥锁
      • 2. 死锁
      • 3. 队列
      • 4. 池
    • 9.6 协程
      • 1. 协程概念
      • 2. greenlet&gevent
      • 3. asynico
      • 4. 协程的上下文切换

第一章 计算机基础

1. 计算机概览

1.1 计算机硬件

计算机的主要组成部分时主板、CPU、硬盘、内存及一些外设设备组成。

1.2 常见的操作系统

​ 操作系统(OS),是最接近物理硬件的系统软件。主要用来协调、控制、分配计算机硬件资源,使计算机各组件可以发挥最优性能。

  • windows
    • Win7,win vista,win10,win server(用于服务器)
  • linux(开源)
    • CentOs(免费,开源多用于中小企业)
    • RedHat(商业版,收费)
  • macos
    • 主要用于办公

1.3 软件(解释器/编译器)

​ 软件是运行于操作系统之上的应用程序。

​ 计算机语言主要是有解释器/编译器/虚拟机,再加上语法规则构成用来开发其他软件的工具。解释型语言,通常是由解释器边解释边执行的计算机语言,例如:python、ruby、PHP、perl。编译型语言,通常是由编译器编译整个代码文件,生成计算机可以识别的文件,交由计算机处理。

1.4 进制

  • 二进制. 0b
  • 八进制 0o(计算机内部使用)
  • 十进制 int(str, base=2/8/16)
  • 十六进制(表示). \x (一般用于计算机显示)

第二章 python入门

2.1 环境的安装

​ 首先,在官网下载py2与py3,2,3版本有很多不兼容所有会存在两个版本共存的问题。目前,mac、ubuntu等一些系统已经内置了python2版本。

​ 为了开发需要,我们需要下载并安装python3。用于开发的软件,通常安装版本一般是找次新版本进行安装。安装pycharm IDE 开发工具。

​ 环境变量的功能,及其配置。环境变量分为,用户环境变量(只对当前用户生效)和系统环境变量(所有用户均有效)。主要用于终端使用,不需要输入python解释器的完整路径,只要输入pythonx 就可使用。

PATH:方便用户在终端执行程序。即,将可执行程序所在的目录添加到环境变量,以后直接调用即可。

​ mac的环境变量在~/.bash_profile文件中。通常在安装的时候python会自动生成环境变量,无需手动配置。

2.2 编码

​ 当前,比较通用的编码有ASCII、Unicode、UTF-8、GB2312、GBK。由于计算机最初使用的是ASCII编码,所以其他编码必须兼容ASCII码。

  1. ASCII

    ASCII码,7bits表示一个字符,最高位用0表示,后来IBM进行扩展,形成8bit扩展的ASCII码。包含所有英文字母和常用的字符,最多可以表示127或256种。

  2. Unicode

    Unicode(万国码),随着计算机的普及,计算机需要兼容多国语言,Unicode编码应运而生。32bits表示一个字符,总共可以表示2**32种不同的符号,远远超出目前所有文字及字符,迄今使用21bits。通用的特点换来的是存储空间的浪费,一般只用于计算机内部处理计算。

  3. utf-8

    为弥补unicode的不足,utf-8针对unicode进行压缩和优化,去掉前面多余的0,只保留有效部分。完整保留ASCII码,欧洲文字一般用2bytes表示,中文一般用3bytes表示。

  4. GBK

    全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。

    中文使用2bytes表示。GBK,是对GB2312的扩展,又称GBK大字符集,简而言之就是所有亚洲文字的双字节字符。

# IDE:统一使用UTF-8, 全局和项目均如此

2.3 变量

​ 变量的主要作用是为了多次重复使用方便。

# 查看python关键字
import keyword
keyword.kwlist

常量:不允许修改的值,python中只是约定

2.4 python基础语法

1. 多行显示

Python语句中一般以新行作为语句的结束符。

但是我们可以使用斜杠( )将一行的语句分为多行显示,如下所示:

total = item_one + \
        item_two + \
        item_three

2. 实现换行

input("按下 enter 键退出,其他任意键显示...\n")

# 不换行输出
print(x, end='')
print(y, end='')

3. 多个变量赋值

a = b = c = 1
a, b, c = 1, 2, "john"

4. 成员运算符

# 如果在指定的序列中找到值返回 True,否则返回 False
in
# 如果在指定的序列中找到值返回 False,否则返回 True
not in

5. 身份运算符

is  
# is 是判断两个标识符是不是引用自一个对象 x is y 
类似 id(x) == id(y) , 如果引用的是同一个对象则返回 True,否则返回 False
is not  
# is not 是判断两个标识符是不是引用自不同对象 x is not y 
类似 id(a) != id(b)。如果引用的不是同一个对象则返回结果 True,否则返回 False。

6. 不换行输出

  • print 默认输出是换行的,如果要实现不换行需要在变量末尾加上 end=""

7. pyc 文件

​ 执行Python代码时,如果导入了其他的 .py 文件,那么,执行过程中会自动生成一个与其同名的 .pyc 文件,该文件就是Python解释器编译之后产生的字节码

字节码(Bytecode)是一种包含执行程序、由一序列 op 代码/数据对 组成的二进制文件字节码是一种中间码。它比机器码更抽象,需要直译器转译后才能成为机器码的中间代码。

机器码(machine code),学名机器语言指令,有时也被称为原生码(Native Code),是电脑的CPU可直接解读的数据机器码是电脑CPU直接读取运行的机器指令。

ps:代码经过编译可以产生字节码;字节码通过反编译也可以得到代码。

2.5 py2与py3的区别

  1. 字符串类型不同
v = u'henry'
print(v, type(v))  # unicode类型
# py2                  py3 数据类型对应关系
unicode    <--> str
eg.u'alex'        <--> 'alex'
str               <--> bytes
eg.'alex'         <--> b'alex

Note

  • bytes类型一般用于文件存储和网络传输
  1. 其他不同
Py2 Py3
1 字符串类型不同
2 py2py3默认解释器编码 ASCII UTF-8
3 输入输出 raw_input() ; print input() ; print()
4 int / long int 和 long,除法只保留整数 只用int,除法保留小数
5 range/xrange range/xrange 只有range,相当于py2的xrange
6 info.keys,info.values,info .items 数据类型是list 数据类型是
7 map/filter 数据类型是list 返回的是iterator,可以list()查看
8 reduce 内置 移到functools
9 模块和包 需要__init__.py
10 经典类和新式类 同时拥有 只有新式类

第三章 数据类型

3.1 int

# None 无操作
# bytes 类
# 只有str 可以强转
s = '99'
print(type(int(s)))

3.2 bool

# bool 布尔,主要用于条件判断。 
# None, 0 , '', [], {}, set() 
# 以上都是False

3.3 str " "

1. 常用操作

str操作常用的 14 (9+5) 种
1.upper/lower 2.isdigit/isdecimal 3.strip 4.replace 5.split 6.startswith/endswith 7.encode 8.format 9.join
  1. s.upper() / s.lower()
# 大小写转换
s = 'Henry'
print(s.upper(), s.lower())
  1. s.isdigit() / s.isdecimal()
# 判断是否是数字
s1 = '123'
s2 = '12.3'
# True Flase
print(s1.isdigit(), s2.isdigit())                  

# isdecimal只判断是否是整数
  1. s.strip()
# 默认去除两边空格+ \n + \t

s = '  asdfgh,      '
print('-->', s.strip(), '<--')
print('-->', s.strip().strip(','), '<--')
  1. s.replace('a', 'b', n)
# repalce 中的 a 和 b 必须是str类型, n 必须是int类型
s = 'adsafga'
print(s.replace('a', '666'))
print(s.replace('a', '666', 1))
  1. s.split('_')
# str的分割
s = 'henry_echo_elaine_'
li = s.split('_')
# 分割后的元素永远比分隔符号多一个
print(li)  
  1. s.startswith() / s.endswith()
# 判断开始/结束位置是否是指定元素
s = 'abghjkdc'
print(s.startswith('ab'), s.endswith('cd'))
# True  Flase
  1. str 的格式化输出(2种)
# 如果使用格式化输入,打印%需要使用 %%
# %s,%d  :表示占位符

# way1 通常用于函数
"***{0}***{1}**".format(a, b)
# % (a, )  :这里表示tuple,建议加逗号 

# way2 
"***%s, ***%s***" % (a, b,)   
# 示例
# way1 '{0} ***{1}'.format(a, b)
a = 'abcd'
b = '666'
s = '{0} ***{1}'.format(a, b)
print(s)
# way2 
s1 = '%s***%s' % (a, b,)
print(s1)

扩展使用示例:

# %s ,只能是tuple
msg = '我是%s, 年龄%s' % ('alex', 19)
msg = '我是%(name)s, 年龄%(age)s' % {'name': 'alex', 'age': 19}
# format格式化
v1 = '我是{name}, 年龄{age}'.format(name = 'alex', age = 18)
v1 = '我是{name}, 年龄{age}'.format(** {'name': 'alex', 'age': 19})
v2 = '我是{0}, 年龄{1}'.format('alex', 18) 
v2 = '我是{0}, 年龄{1}'.format(*('alex', 18) )
  1. encode
# 指定编码类型
s = '你好'
# 6个字节
print(s.encode('utf-8'))   
 # 4个字节
print( s.encode('gbk'))     
  1. '_'.join(s)
# 用于循环加入指定字符
# s 必须是iterable
# s 可是str,list,tuple,dict,set(str + 容器类)
# s 中元素值必须是str类型
'_'.join(s)
# 示例
# 指定元素循环连接str中的元素
s = 'henry'
print('_'.join(s))    # 下划线连接个字符

2. 其他操作

  1. s.find('a') / s.rfind()
# 返回第一个 a 的索引值,没有则返回 -1 
s = 'aaasdfgsh'
index = s.find('a')
print(index)
  1. s.index('a') / s.rindex() /s.lindex()
# 返回第一个 a 的索引值,没有报错
s = 'aaasdfgsh'
index = s.find('a')
print(index)
  1. s.isupper() / s.islower()
  2. s.capitalize()
  3. s.casefold()
  4. s.center(20, "*"). # 可以为空
  5. s.ljust(20, "*")/s.rjust()
  6. s.zfill() # 用0填充
  7. s.count('a', [start], [end]) # 查找'a' 的个数
  8. s.isalnum()
  9. s.isalpha()
  10. s.isnumeric()
  11. s.isprintable()
  12. s.istitle()
  13. s.partition('a') / s.rpartition()# 分成三部分,a左边,a右边
  14. s.swapcase()


3. 公共功能

  1. len(s)
# 返回s长度
s = '1234567890'
print(len(s))     # 10
  1. s[index]
# 索引取值
s = '123456789'
print(s[3])   # 4
  1. 切片
s = '123456789'
print(s[3:5])   # 45
  1. setp
# 根据step进行切片
s = '123456789'
print(s[3::2])   # 468
  1. for循环
s = '123456789'
for i in s:
    print(i)

3.4 list []

1. 常用操作

list操作目前一共有15(8+7)种, 1.append 2.insert 3.remove 4.pop 5.clear 6.reverse 7.sort 8.extend
  1. li.append('666')
# 任意类型数据,li操作不能直接放在print()中
li = [1, 2, 3, 4, 5, 6]
li.append('666')
print(li)
li.append(['henry'])
print(li)
  1. li.insert(2, 'henry')
# 按照index位置插入指定内容
li = [1, 2, 3, 4, 5, 6]
li.insert(3, 'henry')
print(li)
  1. li.remove('aa')
# 删除指定list中的元素
li = ['aa', 'a', 'aacde']
li.remove('aa')
print(li)
li.remove('bb')
print(li)  # 会报错
  1. li.pop(index)
# 按index删除list中的元素
li = [1, 2, 3, 4, 5, 6]
li.pop()
print(li)
li.pop(3)
print(li)
  1. li.clear()
# 清空list中的所有元素
li = [1, 2, 3, 4, 5, 6]
li.clear()
print(li)
  1. li.reverse()
# 反转list中的元素
li = [1, 2, 3, 4, 5, 6]
li.reverse()
print(li)
  1. li.sort(reveres = True)
# reverse = True 从大到小
# 只能是同一类型的元素
# dict,tuple不支持排序
li = [6, 2, 3, 1, 5, 4]
li.sort()
print(li)
li = ['ba', 'ab', 'c', 'd']
li.sort(reverse=True)
print(li)

li = [[6], [2, 3], [1, 5, 4]]
li.sort()
print(li)

li = [(6, 2, 3, 1, 5, 4)]
li.sort()
print(li)
  1. li.extend(s)
# 把s中的元素,循环取出,逐个追加到list中
# s可以是str, list, tuple, dict, set
# dict只取keys 追加到list中
s = 'henry'
li = [1, 2, 3, 4, 5, 6]
li.extend(s)
print(li)
s = ['a', 'b', 'c', 'd']
li.extend(s)
print(li)

2. 其他:

  1. li.count('a')
  2. li.copy(). # 浅拷贝
  3. li.count() # 只计算第一层,不考虑嵌套
  4. li.index('val')


3. 公共功能

  1. len(s)
li = [1, 2, 3, 4, 5, 6]
print(len(li))

  1. index 取值
li = [1, 2, 3, 4, 5, 6]
print(li[2])

  1. 切片
li = [1, 2, 3, 4, 5, 6]
print(li[2:5])

  1. step
li = [1, 2, 3, 4, 5, 6]
print(li[2::2])

  1. for循环
li = [1, 2, 3, 4, 5, 6]
for i in li:
  print(i)

  1. 修改
# 使用index修改,如果只是一个值,则正常修改
li = [1, 2, 3, 4, 5, 6]
li[2] = 'henry'
print(li)
# 使用index修改,如果是多个值,认为是一个tuple
li[2] = 'a', 'b', 'c'
print(li)
# 使用切片[]修改,则循环取值加入
li[2:3] = 'a', 'b', 'c'
print(li)
  1. 删除del li[]
# del 也不能放在print()里面
li = [1, 2, 3, 4, 5, 6]
del li[2]
print(li)
del li[2:]
print(li

3.5 tuple ()

# 没有独有操作,目前只有5种
# tuple里,最后一个值最好加一个 逗号 ,以区别于运算符

1. 常用操作

  1. len()
t = (1, 2, 3,)
print(len(t))
  1. index
t = (1, 2, 3,)
print(t[2])
  1. 切片
t = (1, 2, 3,)
print(t[1:])
  1. step
t = (1, 2, 3, 4, 5, 6, 7, 8, 9, 0)
print(t[1::2])
  1. for 循环
t = (1, 2, 3, 4, 5, 6, 7, 8, 9, 0)
for i int t:
  print(i)

2. 内置函数

  • max(tup). # 返回最大值
  • min(tup). # 返回最小值
  • tuple(li). # list 转tuple

3.6 dict {}

1. 常用操作

dict 目前一共有 14(9 + 5) 种操作, 1.keys 2.values 3.items 4.get 5.pop 6.update 7.setdefault 8.popitem 9.clear
# {key1: value1, k2: value2}
# key不能重复
  1. info/ info.keys()
    • 类似 list ,但不是list,例如:dict_keys(['name', 'age', 'gender'])
# 取所有key
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
for key i info:
  print(key)
  1. Info.values()
# 取所有value
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
for v in info.values():
    print(v)
  1. info.items()
# 取所有key值对
# 取出的是 tuple 类型
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
for pair in info.items():
    print(pair)
  1. Info.get(key, 666)
# 有key则取出, 没有则返回指定 值
# 如果没有指定值,则返回 None
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
print(info.get(1, 666))
print(info.get(4, 666))
  1. info.pop(key)
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
print(info.pop(1))
print(info.pop(4))
  1. info.update(info1)
# 只能用dict类型更新
info = {}
info1 = {1: 'henry', 2: 'echo', 3: 'eliane'}
info.update(info1)
print(info)
  1. info.setdefalut(key, value)
# 查询key,有则取出,没有则添加
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
info.setdefault(4, 'hello')
print(info)
# 取出需要赋值给其他变量
val = info.setdefault(4, 'i hate you')
print(val)
  1. info.popitem()
# 不能加参数,删除最后一个key值对
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
v = info.popitem()
print(v,info)   # v是tuple
  1. info.clear()
# 清空所有元素
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
info.clear()
print(info)

2. 其他

  1. info.copy() # 浅拷贝
  2. info.fromkeys()
li = [1, 2, 3, 4, 5]
info = {'a': 1, 'b': 2}
v = info.fromkeys(li, 'hello')
print(v, info)


3. 公共功能

  1. len(info)
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
print(len(info))
  1. Index 取值
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
print(info[1])
  1. for 循环
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
for i in info:
  print(i)
for v in info.values():
  print(v)
for pair in info.items():
  print(pair)
  1. 修改
# key一样则修改,不一样则追加
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
info[1] = 'hello'
print(info)
info[4] = 'you are smart'
print(info)
  1. 删除
info = {1: 'henry', 2: 'echo', 3: 'eliane'}
del info[1]
print(info)

4. 有序字典

# __getitem__ set, del 
from collections import OrderdDict

info = OrderedDict()
info['k1'] = 123
info['k2'] = 456

3.7 set() /{}

1. 常用操作

set 目前一共有11(10 + 2)种操作,空集合用set()表示。 
1.add 2.update 3.pop 4.discard 5.remove 6. clear 7.intersection 8.union 9.difference 10.symmetric_difference
# 无序,不重复
  1. s.add('a')
s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.add(5)
print(s)
  1. s.update(s1)
# 可以用str , list, tuple, dict, set, 也可以混合多种类型放入update中
s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s1 = {5, 6, 7, 8, 1, 2, 3}
s2 = [5, 6, 7, 8, 1, 2, 3]
s3 = (5, 6, 7, 8, 1, 2, 3)
s4 = {5: 6, 7: 8, 1: 2}
s.update(s1)
print(s)

s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.update(s2)
print(s)

s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.update(s3)
print(s)

s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.update(s4)
print(s)
  1. s.pop()
# 随机删除,此时pop中不能有任何参数
s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.pop()  # 默认删除第一个元素/随机
print(s)
  1. s.discard()
# 必须有一个参数,没有不报错, 不会返回值
s = {1, 'henry', 2, 'echo', 3, 'eliane'}
val = s.discard(3)
print(s)
print(val)
  1. s.remove('a')
# 必须有一个参数,没有会报错
s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.remove(3)
print(s)
  1. s.clear()
s = {1, 'henry', 2, 'echo', 3, 'eliane'}
s.clear()
print(s)
  1. s.intersection(s1)
# 取v1 和v2 的交集
v1 = {1, 'henry', 2, 'echo', 3, 'eliane'}
v2 = {1, 3, 5, 7}
v = v1.intersection(v2)
print(v)
  1. v.union(v1)
# 取并集
v1 = {1, 'henry', 2, 'echo', 3, 'eliane'}
v2 = {1, 3, 5, 7}
v = v1.union(v2)
print(v)
  1. v.difference(v1)
v1 = {1, 'henry', 2, 'echo', 3, 'eliane'}
v2 = {1, 3, 5, 7}
v = v1.difference(v2)
print(v)
  1. v.symmetric_difference(v1)
v1 = {1, 'henry', 2, 'echo', 3, 'eliane'}
v2 = {1, 3, 5, 7}
v = v1.symmetric_difference(v2)
print(v)

2. 其他

  1. v.copy()
  2. v.difference_update(v2)
  3. v.symmetric_difference_update(v2)
  4. v.intersection.update(v2)
  5. v.isdisjoint(v2) # 返回 bool值
  6. v.issubset(v2)/ v.issuperset(v2)


3. 公共功能

  1. len(v)
v = {1, 'henry', 2, 'echo', 3, 'eliane'}
print(len(v))
  1. for 循环
# 无序输出
v = {1, 'henry', 2, 'echo', 3, 'eliane'}
for i in v:
    print(i)

3.8 公共功能

int bool str list tuple dict set
len
index
切片
step
for循环/ iterable
修改
删除

3.9 嵌套&深浅copy

1. 可嵌套的数据类型

​ 所有的容器类例如:list,tuple, dict,set 都可以嵌套,但set(), 只能嵌套可hash(int, bool, str, tuple 4种)的数据类型。

3.10 内存相关&深浅拷贝

1. 内存相关

小数据池

  • ==判断值
  • is判断内存地址
  • python中默认会对int,str,bool进行缓存

缓存规则:

  • int型-5 — 256之间会被缓存
  • str:空和单个字符默认缓存;只包含字母、数字、下划线,也缓存; 乘数>1时,str只包含Num、ALp、_时缓存(最终长度不能超过20)
  • str:手动指定缓存
  • bool

2. 深浅拷贝

  1. 使用格式import copy(模块)
  2. 4 个结论
    • 浅拷贝只是拷贝第一层可变类型
    • 深拷贝拷贝所有可变类型的数据
    • 只要 copy ,一定会为数据开辟新的内存空间
    • tuple 浅copy地址一样, 有嵌套的可变类型,deepcopy也会拷贝tuple数据

第四章 文件操作

​ 文件操作主要用来读取、修改、和创建指定文件。

4.1 文件基本操作

1. 文件打开格式

f = open('文件路径',mode='r/w/a...',encoding='utf-8') 

2. 文件写入格式

  • file.write(str)将字符串写入文件,返回的是写入的字符长度
# mode= 'w'
# 打开文件时,会先清空历史文件,没有则创建
f.write('a')

3. 文件读取格式

# mode= 'r'
# way1 整个文件直接读取到RAM
f.read()
# 如果指定编码格式,会读出 1 个字符
# 如果是 mode= rb 会读出 1 个字节
f.read(1) 
                    

# way2 按行读取文件
# 一般用于for循环中,可用来读取 GB 级别的文件
f.readline() 只读取一行
f.readlines()  # 一次性加载所有内容到内存,并根据行分割成字符串
# 读取一行时也可以使用
for line in v:
    line = line.strip('\n')

4. 文件的关闭

# 当对文件操作完成后必须关闭,否则不会存储到本地磁盘
f.colse()
# 刷新缓冲区里任何还没写入的信息

4.2 打开模式

1. mode 分类

​ mode常见的有r/w/a(只读/写/追加),r+/w+/a+(读写/写读/追加读),rb/wb/ab(以二进制方式进行读/写/追加),r+b/w+b/a+b

模式 r r+ w w+ a a+
+ + + +
+ + + + +
创建 + + + +
覆盖 + +
指针在开始 + + + +
指针在结尾 + +

4.3 其他操作

​ 断点续传,通过终端与服务器之间的交互,找到文件断点位置,从而实现文件的单次传输。此种操作可以使用file.seek(n)实现,n表示字节数。

1. 文件定位

seek(offset [,from])方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。如果from被设为0,这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将作为参考位置。

  • file.seek(n)
    • 光标移动到指定字节位置。注意
  • file.tell()
    • 返回当前光标位置。可以用于断点续传技术。

2. 重命名和删除文件

  • rename()方法需要两个参数,当前的文件名和新文件名。
# 示例
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import os
# 重命名文件test1.txt到test2.txt。
os.rename( "test1.txt", "test2.txt" )
  • 你可以用remove()方法删除文件,需要提供要删除的文件名作为参数。
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import os
# 删除一个已经存在的文件test2.txt
os.remove("test2.txt")

3. f.flush()

  • 强制把内存中的数据,刷到硬盘中。主要用于操作文件时间过长,无法自动保存的问题。
v = open('a.txt',mode='a',encoding='utf-8')
while True:
    val = input('请输入:')
    v.write(val)
        # 强制把内存中的数据,刷到硬盘中
     v.flush()                        
v.close()

4.4 一次性操作文件

v = open('a.txt', mode='a', encoding='utf-8')
v1 = v.read()
v.close()
# 缩进中的代码执行完毕后,自动关闭文件
with open('a.txt', mode='a', encoding='utf-8') as v:
    data = v.read()

4.5 文件修改(示例)

Note:

  1. 文件在存储的时候,是连续存储的。文件较大时可以按行读取,修改。
  2. 按行读取时,一定要注意一行结束位置有 \n
# 示例1 
# 文件的修改,需要先把内容读到内存,修改后再存储
with open('a.txt', mode='r', encoding='utf-8') as v:
    data = v.read()
print(data)

new_data = data.replace('a', 666)
with open('a.txt', mode='w', encoding='utf-8') as v:
    data = v.wirte(new_data)
# 示例2  修改指定字符
# 大文件的修改
f1 = open('a.txt', mode='r', encoding='utf-8')
f2 = open('b.txt', mode='r', encoding='utf-8')
for line in f1:
    line = line.replace('a', 'b')
    f2.write(line)
f1.close
f2.close
# 一次性打开修改和关闭
with open('a.txt', mode='r', encoding='utf-8') as f1,open('b.txt', mode='r', encoding='utf-8') as f2:
    for line in f1.readlines():
# 或者如下写法
    for line in f1:   # 这种写法,也会一行行读取,包括 \n 也会单独一行读出
    line = line.replace('a', 'b')
    f2.write(line)

第五章 函数

​ 以双下划线开头的 **__foo** 代表类的私有成员,以双下划线开头和结尾的 **__foo__** 代表 Python 里特殊方法专用的标识,如 init() 代表类的构造函数。

5.1 三元运算

又称为三目运算

和预算符相关

val = v if v else 666
val = v or 666 # 源码中会见到

Note:为了赋值

# 简单条件赋值时使用
v = 前面 if 条件 else 后面
# 用户输入,如果是整数,则转换,否则赋值为None
data = input('>>>')
value = int(data) if data.isdecimal() else Non

5.2 函数基础

面向过程【可读性差、可重用性差】—> 函数式编程—>面向对象

# 如果给其他人发送邮件,可以把发送程序进行封装起来,可缩减代码长度和提高重复利用性。

函数式编程

  • 将n行代码放在别处,并取别名,以后可以调用
  • 场景:
    • 代码重复执行
    • 代码量特别多,超过一屏,可以选择函数编程(一般控制在一屏以内

1. 定义函数

可以定义一个由自己想要功能的函数,以下是简单的规则:(5)

  • 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()
  • 任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。
  • 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。
  • 函数内容以冒号起始并且缩进
  • return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None。
def functionname( parameters ):   
  "函数_文档字符串"
  function_suite  # 函数体  
    return [expression]
# 默认情况下,参数值和参数名称是按函数声明中定义的顺序匹配起来的。
# 函数定义
# way1
def 函数名():
    # 函数体
    pass
# 函数的执行
函数名()    # 会自动执行

# way2 
# 形参可以是多个
def 函数名(形参):
    # 函数体
    pass
函数名(实参)

Note1(1)

  • None方法类似函数,但不是(方法操作是s.upper(),方式,而函数是直接调用,len(),open())

2. 两种参数(示例)

形参(形式参数)与实参(实际参数)的位置关系。

def 函数名(形参):
    # 函数体
    pass
函数名(实参)
# 无形参示例
def get_sum_list()
    sum = 0
  for i in li:
    sum += i
print(get_sum_list())
# 有形参示例
# 请写一个函数,函数计算列表 info = [11,22,33,44,55] 中所有元素的和。
info = [11, 22, 33, 44]
def get_list_sum(li):
    sum = 0
    for i in li:
        sum += i
    print(sum)
get_list_sum(info)

3. 函数的返回值

Note2(4)

  1. return [表达式] 结束函数,选择性地返回一个值给调用方(func()为返回值)。
  2. return 1, 2 ,3 会返回tuple:(1, 2, 3)
  3. 函数默认返回值是 None ,有时可以使用其作为flag
  4. 可变类型(list)的基本上都是None, 不可变(str)基本上会返回新值
def func(arg):
    return 9 # 返回值为9,默认为None,可以返回任何类型的数据
val = def func(v)
# 示例2
# 让用户输入一段字符串,计算字符串中有多少A,就在文件中写入多少‘echo’
def get_char_count(arg):
    count = 0
    for i in arg:
        count += 1

def write_file(data):
    open('a.txt', mode='w', encoding='utf-8') as v:
        if len(data) == 0:或者 if not bool(data):
            return '写入失败'
                v.write(data)
        return '写入成功'
    
print(count)
content = input()

4. 函数的四种方式

# way1 无形参,无return
def fun1():
    pass
fun()
# way2 有形参,无return
def fun2(arg):
    pass
fun2(v)
# way3 无形参,有return(指定值)
def fun3():
    pass
    return 9
val = fun3(v)
# way4 有形参,有return(变量)
def fun4(arg1, arg2):
    pass
    return arg1 + arg2
val = fun4(v1 + v2)

5. 练习(3)

# 1. 写函数,计算一个list中有多少个数字,打印,有%s个数字
# 判断数字:type(a) == int
# 2. 写函数,计算一个列表中偶数索引位置的数据构造成另外一个列表,并返回。
# 3. 读取文件,将文件的内容构造成指定格式的数据,并返回。
a.log文件
    alex|123|18
    eric|uiuf|19
    ...
目标结构:
a. ["alex|123|18","eric|uiuf|19"] 并返回。
b. [['alex','123','18'],['eric','uiuf','19']]
c. [
    {'name':'alex','pwd':'123','age':'18'},
    {'name':'eric','pwd':'uiuf','age':'19'},
]

5.3 变量作用域&嵌套

1. 函数传参方式(2+1)

​ 参数传递方式分为位置传参、关键字传参、函数作为参数进行传递

  • 位置传参
    • 严格按照位置进行传参
# 示例
def func(a1, a2):
  pass

func(1, 3)
func(1, [1, 2, 3])
  • 关键字传参
# 示例
def func(a1, a2):
    pass

func(a1 = 1, a2 = [1, 2, 3])

func(a1 = 1, 2 )     # 此时会报顺序错误

Note3(1)

  1. 关键字传参可以和位置传参混合使用,但 位置参数 必须在 关键字传参

2. 函数定义参数(3)

​ 函数定义中,def func() 括号中可以省略默认参数和 *args/**kwargs。

  1. 省略参数
# 示例
def func():
    pass
  1. 默认参数
    • 注意默认参数一定要在位置参数之后
    • 在定义默认参数时,慎用可变类型变量
# 示例 
def func(a1, a2=2):
    pass
# 调用方法,有默认参数时,可以不用省略,采取默认值,也可以重新赋值
func(1)
func(1, 3)
# 默认形参时,如果默认是可变类型的需要谨慎使用
# 如果想要给values设置默认是空list
def func(data, value=[]):
  pass
# 推荐
def func(data, value=None):
  if not value:    
    valu=[]
  1. *args/**kwargs(万能参数)
  • *args 表示接收所有由实参通过位置传参方式,传递过来的数据,可以和位置参数一起使用。
    • 接收到的参数值,会通过循环加入tuple
# 示例 : 可以传递任意类型数据
def func(*args):
    pass

# [1, 2, 3]会被当成整体变成tuple中的一个元素
func(1, 2, 3, [1, 2 ,3])
# 直接赋值, [1, 2, 3]也会循环取出追加到tuple中
func(4, 5 ,6 ,*[1, 2 ,3])
  • **kwargs 表示接收所有关键字传参的数据,也可以通过**{'k1': 1, 'k2':2},循环取出keys对,加入形参dict中
# 示例 :只能通过关键字传参,或者dict赋值
def func(**kwargs):
    print(kwargs)

# [1, 2, 3]会被当成整体变成dict中 'd': [1, 2, 3]
func(a=1, b=2, c=3, d=[1, 2 ,3])
# 直接赋值, {'k1': 4, 'k2': 5}也会循环取出追加到形参的dict中
func(a=1, b=2, c=3, d=[1, 2, 3], **{'k1': 4, 'k2': 5})

Note4(4)

  1. 形参中的默认参数,也可以使用位置传参方式
  2. 传参时,有*(**)时,会直接赋值 (循环加入) 给形参
  3. 不带* / **的实参,会转换为tuple / dict
  4. 传入的数据都是循环加入tuple / dict中

3. 作用域&函数嵌套

​ 变量作用域时是变量的有效作用范围,在python中函数就是一个局部作用域。由于作用域的不同,变量的有效范围也不同,根据作用范围可以把变量分为,全局变量和局部变量。

全局变量:可供任何函数进行使用,修改,在python文件第一层的变量。在python中一般把全局变量命名为全部大写(规范),例如:USRE_NAME = 'henry'。

局部变量:可以把函数中的变量视为局部变量。函数体中变量为函数所私有(只能被其子函数进行使用)。

# 示例1
a   = 'henry'
def func():
  print(a)
a = 123
func()                                                # 此时使用的是全局变量, 结果是 123

# 示例2
a = 'henry'
def func1():
    def func2():
            a = 'echo'
        print(a)
    func2()
    print(a)

a = 123
func1()
print(a)
# echo 123 123

Note5(4)

  1. python文件就是一个全局作用域
  2. 函数是一个 (局部) 作用域
  3. 局部作用域中的数据归自己私有
  4. 作用域中查找数据规则
    • 优先查找自己作用域,自己没有,去父籍作用域查找直到找到全局作用域
    • 查找不到会报错,默认只能使用父籍作用域中的变量值不能赋值(可变类型可以修改
# 示例
# 对于可变变量可以进行修改
a = [1, 3, 5, 7]
def fun1():
    a.append('henry')
fun1()
print(a)                                                 # 此时a会被修改
# 两种赋值的方法
# 可以使用 global 关键字对全局变量进行重新赋值
global name
name = 'alex'  # 给全局变量重新赋值

# 可以使用 nolocal 关键字对父籍变量进行重新赋值, 在父籍找不到时,会报错
nonlocal name 
name = 'alex'  # 给父籍变量重新赋值

Note6(3)

  1. 对于可变变量可以进行修改
  2. global 关键字对全局变量进行重新赋值
  3. nolocal 关键字对父籍变量进行重新赋值, 在父籍找不到会报错

5.4 函数进阶

  • 高阶函数(3)
    1. 对函数赋值
    2. 函数当作参数传递
    3. 把函数当作返回值
# 
def func ():
  pass
print(type(func))
# 函数可以认为是一变量

1. 函数赋值

def func():
  print(123)
v = fun # 指向相同的地址
v()
# 示例
def func():
  print(123)
v1 = [func, func, func]
v2 = [func(), func(), func()]
print(v1)
print(v2)

2. 函数传参

def func(arg):
  print(arg)
def show():
  return 999

func(show)   # 999 None

3. 函数作为返回值

def func():
  print(1,2,3)
def bar():
  return func
v = bar()  # func
v()

Note7(3)

  1. 注意funcfunc() 的区别
  2. 函数(实际是内存地址)可以放入set()中(不常用), 或dict中(一般用于values,也可以放在key中但不常用)
  3. 函数一旦定义,只要进行加载,就是不可变,可 hash
# 10 个函数, 一般是建立字典
def func():
  print('话费查询')
def bar():
  print('***')
def base():
  print('***')

info = {
    'f1': func,
    'f2': bar,
    'f3': base
  }
choice = input('please input your choice: ')
name = info.get('choice')
 if not name:
    print('输入不存在')
 else:
        name()

3. lambda表达式

# 三目运算,为了解决简单的if...esle的情况
# lambda,为了解决简单函数的情况
eg:
def func(a1, a2):
  return a1 + a2
# 可以改写为,a1 + 100 即为return 值
func = lambda a1, a2: a1 + 100
# way1 直接使用
func = lambda : 100
func = lambda a: a*10
func = lambda *args, **kwargs: len(args) + len(kwargs)
# way2 使用全局变量
DATA = 100
func = lambda a: a + DATA
func(1)
# way3 使用父籍变量
DATA = 100
def func():
  DATA = 1000
  func1 = lambda a: a + DATA
  v = func1(1)
  print(v)
func()
# way4 使用条件判断 ########
func = lambda n1, n2: n1 if n1 > n2 else n2
# 练习1
USER_LIST = []
func1 = lambda x: USER_LIST.append(x)
v1 = func1('alex')
print(v1)                                    # None
print(USER_LIST) # ['alex']

# 练习2
func1 = lambda x: x.strip()
v1 = func1('   alex')
print(v1)                                   # 'alex'

# 练习3
func_list = [lambda x: x.strip(), lambda y: y+100, lambda x,y: x+y]
v1 = func_list[0]('   alex')
print(v1)                                    # 'alex'

Note8(2)

  1. 用于表示简单函数(一行解决的函数)。
  2. lambda 表达式会默认返回冒号:之后的值

4. 内置函数(30)

  • 自定义函数
  • 内置函数(31)
  1. 强制转换(7):int(),str, bool, list,dict,tuple,set
  2. 输入输出(2):print, input
  3. 其他(5):type, id, range, open, len
  4. 数学(7)
    • abs,round,float(int(55.5)保留整数部分)
    • max,min,sum,
    • divmod(两数相除,得商和余数, 两个值)
  5. 面向对象相关(4):dir,super,issubclass,isinstance
# divmod. 练习
USER_LIST = []
for i in range(1, 836):
  tem = {name':'hello-%s' % i, 'email':'XXXX%[email protected]' %s}
  USER_LIST.append(tem)
"""
    要求:
        每页展示10条
        根据用户输入的页码,查看
"""
  1. 进制转换(3):bin(0b,int<—>bin),oct(0o,int<—>oct),int(其他进制转int),hex(0x,int<—>hex)
# base 默认为 10
v1 = '0b1101'
result = int(v1, base = 2)
# 转8进制
v1 = '0o1101'
result = int(v1, base = 8)
# 转16进制
v1 = '0x1101'
result = int(v1, base = 16)
  # ip 点分二进制,将十进制转为二进制并通过 . 连接ip = '192.168.12.79'
  ip = '192.168.12.79'
  li = ip.split('.')
  l = []
  for i in li:
      i = int(i)
      i = bin(i)
      i = str(i).replace('0b', '')
      i = i.rjust(8, '0')
      l.append(i)
  s = '.'.join(l)
  print(s)
  1. 编码相关
  • chr() :把int型数据,转换为unicode编码

    • ord():把unicode转换为字符
    # 生成验证码
    import random # 导入一个模块
    def get_random_data(length=6):
      data = []
      for i in range(length):
          v = random.randint(65,90) # 得到一个随机数
          data.append(v)
      return ' '.join(data)
    
    code = get_random_data()
    print(code)
    
  1. map / filter / reduce(py2)/zip

    • map,循环每个元素(第二个参数),然后让元素执行函数(第一个参数),将每个函数结果保存到新的list中,并返回。(批量修改数据)
    # map操作的 func 是一个函数 v 必须是可迭代,
    v = [11, 22, 33]
    def func(arg):
      return arg + 100 
    result = map(func, v) # 将函数的返回值添加到空list中[111, 122, 133]
    print(list(result))
    # 使用lambda 改写
    result = map(lambda x: x+100, v)
    print(result)                               # py2直接返回
    print(list(resutl))                              # py3会返回一个object,可用list()查看
    
    • filter
    v = [1, 2, 3, 'welcome', 4, 'hello']
    result = filter(lambda x: type(x) == int, v) # 生成新list
    print(list(result)
    
    • reduce
    import functools
    v = [1, 2, 3, 4]
    result = functools.reduce(lambda x,y: x*y, v)
    print(result)
    
    • zip
    a = [1,2,3]
    b = [4,5,6]
    c = [4,5,6,7,8]
    zipped = zip(a,b)     # 打包为元组的列表
    [(1, 4), (2, 5), (3, 6)]
    zip(a,c) 
    
    # 与 zip 相反,*zipped 可理解为解压,返回二维矩阵式
    [(1, 2, 3), (4, 5, 6)]
    # 两组序列,转字典
    list1 = ['key1','key2','key3']
    list2 = ['1','2','3']
    info = dict(zip(list1,list2))
    print(info)
    

5.5 函数闭包

1. 函数闭包

def func(name):
  def inner():
    print(name)
  return inner

v1 = func('henry')
v1()
v2 = func('echo')
v2()
# 不是闭包
def func(name):
  def inner():
    return 123
  return inner

# 闭包:封装值 + 内层函数需要使用
def func(name):
  def inner():
    print(name)
    return 123
  return inner 

Note9(5)

  1. 闭包,为函数创建一块区域(内部变量供自己使用),为以后执行提供数据;
  2. 函数内部数据不会混乱
  3. 执行完毕+内部数据不被其他程序使用会被销毁
  4. 应用:装饰器,SQLAlchemy源码
  5. 由函数及其相关的引用环境组合而成的实体(即:闭包=函数+引用环境)

2. 递归(效率较低)

  • 递归限制为1000次
def func(i):
  print(i)
  func(i+1)
# 斐波那契数列
def func(a, b):
  print(b)
  func(a, a+b)
# 递归
def fun(a):
  if a == 5:
    return 100
  result = func(a+1) + 10
  return result
v = func(1)

# 注意
def fun(a):
    if a == 5:
            return 100
    result = func(a+1) + 10

v = func(1)

5.6 装饰器和推导式

  • 使用**func.__name__**获取被调用的func函数名,func为形参

1. 装饰器(重点)

def func():
  def inner():
    pass 
    return inner

v = func()
print(v)   # inner 函数
# ##############################
def func(arg):
  def inner():
    print(arg) 
    return inner

v1 = func(1)   # 1
v2 = func(2)   # 2
# ##############################
def func(arg):
  def inner():
    arg()
    return inner

def f1():
  print(123)
  
v = fucn(f1)
v()     # 123
# ##############################
def func(arg):
    def inner():
        arg()
return inner
def f1():
    print(123)
return 666
v1 = func(f1)
result = v1() 
# 执行inner函数 / f1含函数 -> 123 print(result)    
# None

# ##############################
def func(arg):
    def inner():
        return arg()
return inner
def f1():
    print(123)
return 666
v1 = func(f1)
result = v1()   # 123 666
  • 装饰器示例
def func(arg):
  def inner():
        print('before')
    v = arg()
    print('after')
    return v
  return inner

def index():
  print('123')
  return 666

# 示例
v1 = index()   # 123

v2 = func(index)  # before 123 after
v3 = v2()

v4 = func(index)   # before 123 after
index = v4
index()

index = func(index)  # before 123 after
index()
# 第一步,执行func函数,并将下面的函数当作函数传递,相当于func(index)
# 第二部,将func返回值,重新赋值为下面的函数名,index = func(index)
def func(arg):
    def inner():
        return arg()
    return inner

@func
def index():
    print(123)
    return 666

print(index)  # .inner at 0x1054a16a8>

应用示例

# 计算函数执行时间
def wrapper(func):
    def inner():
        start_time = time.time()
                func()
                end_time = time.time()
                print(end_time - start_time)
        return func()
      return inner

import time
 @ warpper   
def func():
    time.sleep(2)
    print(123)
  
 @ warpper   
def func():
    time.sleep(1.5)
    print(123)

# 判断用户是否登陆

Note10(2)

  1. 目的:在在不改变原函数的基础上,在执行函数前后自定义一些操作
  2. 场景:想要为函数扩展功能时
  • 编写装饰器
# 装饰器的编写(示例)
def wrapper(func):                        # 必须有一个参数
  def inner():
    ret = func()
    return ret
    return inner
# 应用 index = wrapper(index)
@wapper
def index():
  pass
@wapper
def manage():
  pass 
# 在执行函数,自动触发装饰器
v = index()
print(v)
# 导入本目录下的其他py文件
import a
a.f1()
a.f2()
a.f3()
  • 编写格式
def wrapper(func):
    def inner(*args, **kwargs):
                return func(*args, **kwargs)
    return inner

为什么要加*args,**kwargs?

2. 关于参数

# 让参数统一的目的:为装饰的函数传参
def x(func):
  def inner(a, b):
    return func()
  return inner

@x
def index():
  pass

index(1, 2)
  • 返回值
# 装饰器建议写法
def wrapper(function):
    def inner(*args, **kwargs):
            v = funtion(*args, **kwargs)
            return v
    return inner

@wrapper
def func():
        pass
  • 带参数的装饰器
# 第一步:v = wrapper(9)
# 第二步:ret = v(index)
# 第三步:index = ret
def x(counter):
    def wrapper(function):
        def inner(*args, **kwargs):
                v = funtion(*args, **kwargs)
                return v
        return inner
     return wrapper

@x(9)
def index():
    pass        
# 示例:
# 写一个带参数的装饰器,实现,参数是多少,被装饰器就要执行多少次,最终返回一个list
def x(*args):
  def wrapper():
    def inner():
      li = [index() for i in range(args[0])]
      return li
    return inner
  return wrapper

@x(9)
def index():
  return 8

v = index()
print(v)
  • 元数据
  • 多个装饰器:@x1 @x2

3. 推导式

  1. list推导式(生成式)

    • 格式(生成一个list)
    vals = [i for i in 'henry']
    v = [i for i in 可迭代对象 if 条件]  # 满足条件生成list
    v = [i if i > 5 else i+1 for i in 可迭代对象 if 条件]  
    # 满足条件生成list
    
    # 新浪
    def num():
         return [lambda x: x * i for i in range(4)]
    print([m(2) for m in num()])
    
  2. set推导式

    • 格式
    # 满足条件生成set,会去重,条件判断可以省略
    v = {i for i in 可迭代对象 if 条件} 
    
  3. dict推导式

    • 格式
    # 满足条件生成dict,但需要key值和冒号:,条件判断可以省略
    v = { 'k' + str(i): i for i in 可迭代对象 if 条件}
    

5.7迭代器&生成器

:int ,str, list…. / bytes(b'xxx'), datetime

对象:由创建的数据

类和对象

1. 迭代器(class:iterator)

  • 展示list中所有数据

    1. 迭代器:对某种(str/list/tuple/dict/set) (序列)对象中的元素,进行逐个获取。表象:具有**__next__()**方法,
    • list —> 迭代器:
      • v = iter([1, 2, 3, 4])
      • val = [1, 2, 3, 4].__iter__()
    • 迭代器获取每一个元素:v.next
    • 直到报错:StopIteration,表示迭代终止
    v = [1, 2, 3, 4]
    val = iter(v)
    value = val.__next__()
    print(value)
    
    1. 甄别:数据中是否包含**__next__()**方法
    2. for循环的内部,首先把数据转化为iter,反复执行iter.__next__(),取完不报错

2. 可迭代对象

  • 具有**__iter__()方法,必须返回一个迭代器(生成器)**
  • for循环

3. 生成器(函数的变异)(class:generator)

  • yiled可以保存状态,yield的状态保存与操作系统的保存线程状态很像,但是yield是代码级别控制的,更轻量级
  • send可以把一个函数的结果传给另外一个函数,以此实现单线程内程序之间的切换
  1. 生成器基础
def func():
  pass 
func()
# 生成器函数(内部是否包含yield)
def func(arg):
  arg = arg + 1
  yield 1
  yield 2
  yield 100
# 函数内部代码不执行,返回一个生成器
val = func(100) 

# 生成器:可以被for循环的,一旦开始循环,函数内部代码就开始执行
for i in val:
  print(i)
# 遇到第一个yield会把后面的值赋值给 i
# 如果yield已经执行完毕,则意味着for循环结束
# 边使用边执行
def func():
  count = 1 
  while True:
    yield count
    count += 1

# v 只取yield值,是一个生成器对象
v = func()
for i in v:
  print(i)
  
# 查看v中有哪些方法
dir(v)

Note11(4)

  1. 函数中如果存在yield,则该函数为生成器函数,调用生成器函数会返回一个生成器
  2. 只有被for循环时,生成器内部代码才会执行,每次循环都会获取yield的返回值
  3. 即使函数内部的yield函数永远执行不到,也是生成器
  4. 生成器也是一种特殊的迭代器,也是一个可迭代对象
class Foo(object):
  def __iter__(self):
    return iter([1, 2, 3])
    yield 1 
    yield 2
    
obj = Foo(object)
  1. 生成器中send

Note12(2)

  1. send方法,会触发一次next操作,yiled结果为其返回值
  2. 总的来说,send方法和next方法唯一的区别是在执行send方法会首先把上一次挂起的yield语句的返回值通过参数设定,从而实现与生成器方法的交互。
  3. 需要注意,在一个生成器对象没有执行next方法之前,由于没有yield语句被挂起,所以执行send方法会报错
def func():
    print(123)
    n = yield('aaa')
    print('----->', n)
    yield 'bbb'

data = func()
next(data)
v = data.send('太厉害了,直接传进去了')
print(v)
  1. 生成器示例
# 示例:读取文件
def func():
    curse = 0
    while True:
        f = open('db','r','utf-8')
        f.seek(curse)
        data_list = []
        for i in range(10):
                line = f.readline()
            if not line:
                return
            data_list.append(line)
        curse = f.tell()
        f.close
        for row in data_list:
            yield row
# redis 示例
import redis
coon = redis.Redis(host='192.168.12.12')
  1. yield from 关键字
# yield from (py3.3之后)
def base():
  yield 88
  yield 99
 
def bar():
  return 123

def func():
  yield 1
  yield from base()
  yield from bar()   # 报错,int 不可迭代,如果可迭代,则循环取出
  yield 2
  yield 
  1. 生成器推导式
v1 = [i for i in range(10)] # list推导式,立即产生数据
def func():
  for i in range(10):
    yield i
v2 = func()  # 与下面v2相同
v2 = (i for i in range(10)) # 生成器推导式,不会立即产生数据
  1. 酸爽生成器
    • 所有生成器取一次就没有了
    • 不取不会执行,惰性运算
# 示例1
ret = filter(lambda n: n%3==0, range(10))
print(len(list(ret)))                                   # 4
print(len(list(ret)))                      # 0
# 示例2
def add(n, i):
  return n + i

def test():
  for i in range(4):
    yield i
    
g = test()
for n in [1, 10]:
  g = (add(n, i) for i in g)
  
print(list(g))
# [20 21 22 23 24]
# 示例3
def add(n, i):
  return n + i

def test():
  for i in range(4):
    yield i
    
g = test()
for n in [1, 10, 5]:
  g = (add(n, i) for i in g)
  
print(list(g))
# [15, 16, 17, 18]

5.8 异常处理

1. 示例

# 示例1
try:
  val = input('请输入数字:')
  num = int(val)
except Exception as e:
  print('操作异常')
# 示例2
import requests
try:
  ret = requests.get('http://www.baidu.com')
    print(ret.text)
except Exception as e:
  print('请求异常')
# 示例3
def func(a):
  try:
    return a.strip()
  except Exception as e:
    pass
  return False

v = func([1, 2, 3])
print(v)
# 练习1,函数接收一个list将list中的元素每个都加100
def func(arg):
    li = []
    for items in arg:
        if items.isdecimal():
            li.append(int(items) + 100)
     return li
# 写函数,接收一个list, 中全是url 访问地址,并获取结果
import requests
def func(url_list):
  li = []
  try:
    for i in url_list:
      reponse = requests.get(i)
      li.append(reponse.text)
  except Exception as e:
    pass
  return li

func(['http://www.baidu.com', 'http://www.google.com', 'http://www.bing.com'])
# 比较异常 try 的位置不同,效果也不同
import requests
def func(url_list):
  li = []
  for i in url_list:
      try:
          reponse = requests.get(i)
          li.append(reponse.text)
        except Exception as e:
                pass
  return li

func(['http://www.baidu.com', 'http://www.google.com', 'http://www.bing.com'])


# 得到的结果是text格式的文本文档
reponse = requests.get('url', useragent:xxxxxx)

2. 基本格式

try:
  pass
except ValueError as e:
  pass
except IndexErro as e:
  pass
except Exception as e:
  print(e)
finally: 
  print('final')  # 无论对错都要执行的代码
# e 代表异常信息,是Exception类的对象,有一个错误信息
try:
  int('asdf')
except Exception as e:
  print(e)

try:
  int('asdf')
except ValueError as e:
  print(e)
  
try:
  int('asdf')
except IndexError as e:
  print(e)
  
# 即使遇到return 也会执行finally 
def func():
  try:
    int('1')
    return
  except Exception as e:
    print(e)
  finally:
    print('final')

3. 主动触发异常

try:
  int('123')
  raise Exception('错误信息')   # 主动抛出异常
except Exception as e:
  print(1)
# 打开一个文件,
def func():
  resutl = True
  try:
      with open('x.log', mode='r', encoding='utf-8') as f:
            data = f.read()
      if 'henry' not in data:
            raise Exception()
   except Exception as e:
        result = False 
   return result

4. 自定义异常

# 示例1
class MyException(Exception):
  pass
try:
  raise MyException('haha,错了吧')
except MyException as e:
  print(e)
class MyException(Exception):
  def __init__(self, message):
      self.message = message
try:
  raise MyExceptoin('123')
except MyException as e:
  print(e.message)

第六章 模块

6.1 模块的导入

  1. 模块:可以是py文件也可以是文件夹
    • py文件,写好了的对程序员直接提供某方面功能
    • import / from xxx import xx
    • :存储了多个py文件的文件夹,pickle,json,urlib
    • 如果导入一个包,包里默认模块是不能使用的
      • 导入一个包相当于执行**__init__.py**文件内容
  2. 定义模块时,可以把一个py文件或一个包当作一个模块,以便于以后其他py文件使用。
  3. **__ init__.py** 在文件夹中创建此py文件, python packages
    • py2:文件夹中必须有__ init__.py
    • py3:不需要,推荐加上
  4. 导入模块
    1. 导入模块—>调用模块中的函数(import 文件名)
    2. import 会把模块中的文件加载到内存
    3. **from py文件名 import func,show… (*)**:只导入指定函数,也会把模块中的内容加载一遍
      • 模块中的函数名可能和本地函数重名
      • from 模块 import func as f(模块中的函数重命名) f()
# test为文件夹,在当前工作目录中,jd为py文件,f1为jd中的函数
import test.jd
test.jd.f1()
# test为文件夹,在当前工作目录中,jd为py文件,f1为jd中的函数
from test import jd
jd.f1()
# 导入(绝对导入、相对. /..导入:相对导入必须有父籍包
# import
# from 模块.模块 import 模块
# from 模块.模块.模块 import 函数
# 调用:模块.函数(),函数()
# 主文件:运行的文件(print(__name__)). 
if __name__ == '__main__

Note1(4)

  • 模块在和要执行的py文件在同一路径且需要很多功能时,推荐使用import 模块
  • 其他推荐:from 模块 import 模块
  • from 模块1.模块2 import 函数 执行:函数()
  • 文件(夹)命名不可与模块相同,否则就会用当前目录中的文件(夹)
# __file__ python命令行中获取的参数
import os
import sys
BASE_DIR = os.path.dirname(os.path.dirname(__file__))
sys.path.append(BASE_DIR)

6.2 模块的基本知识

  1. 分类

    • 内置模块(py内部提供的功能)
    • 第三方模块
    # pip 安装模块
    pip install module_name
    # 安装成功,如果导入不成功,需要重启pycharm 
    
    • 自定义模块
    # a.py
    def f1():
      pass
    def f2():
      pass 
    
    # 调用自定义模块中的功能
    import a
    a.f1()
    

6.3 内置模块(10)

​ 内置模块目前有randomhashlibgetpasssys相关,os相关,shutiljsontime&datetime, import lib, logging10个。

1. random(7)

# random.randint(a, b)
import random
def get_random_data(length=6):
    data = []
    for i in range(length):
        v = chr(random.randint(65, 90)).lower()  # 得到一个随机数
        data.append(v)
    return ' '.join(data)
  1. random.randint(1,5)
  2. random.choice([1, 2, 3]):随机选择一个:验证码,抽奖≥
  3. random.sample([1, 2, 3, 4, 5], 3):随机选3个不重复,抽奖多个人
  4. random.uniform(1, 5):随机1-5中的随机小数
  5. random.shuffle([1,2,3,4]):洗牌,算法
  6. random.random():随机生成[0-1)之间的数
  7. random.randrange(1,5):randint基于randrange

2. hashlib(1) / getpass

摘要算法模块,密文验证/校验文件独立性

note1(3)

  1. md5 / sha
  2. 摘要文件内容一样,无论怎么分割,md5摘要后一致(大文件一致性校验)
  3. 一般在服务端进行加盐,给每个用户使用不同的salt,可以借助用户名
# 将指定的**str**摘要,可以使用sha1/md5
# md5常用来文件完整性校验
# hashlib.md5()/ .update() /.hexdigest()
import hashlib
def get_md5(data):
    obj = hashlib.md5()
    obj.update(data.encode('utf-8'))
    return obj.hexdigest()
val = get_md5('123')
print(val)

加盐

import hashlib
def get_md5(data):
    obj = hashlib.md5('adsfg12fsg'.encode('utf-8'))
    obj.update(data.encode('utf-8'))
    return obj.hexdigest()
val = get_md5('123')
print(val)

密码不显示

import getpass
pwd = getpass.getpass('please input pwd: ')
print(pwd)

3. time(2)

import time
v = time.time() # 获取从1970年开始到目前的时间,单位为秒
time.sleep(2)   # 休眠时间,2秒

4. sys (5)

  • 解释器相关
  1. sys.getrefcount(a)
  2. sys.recursionlimit() / sys.setrecursionlimit()
  3. sys.stdout.write(). print—>进度条
  4. sys.argv:获取命令行参数
    • shutil(shutil.rmtree(path)
  5. sys.path:模块导入路径
  6. sys.modules:存储当前程序中用到的所有模块
# 引用计数器
import sys  
a = [1, 2, 3]
print(sys.getrefcount(a))

# python默认支持的递归数量
v = sys.getrecrusionlimit()

# 输入输出,默认换行
sys.stdout.write('hello')
# \n \t 
# \r: 回到当前行的起始位置,一般于end=‘’连用
print('123\r', end='')
print('hello', end='')   
# 在输出的时候,回到123前,重新打印
# 应用:进度条
  • sys.argv / shutil
# sys.argv  shutil
# 删除 目录 的脚本, 只能是directory
import sys
import shutil

path = sys.argv[1]
shutil.rmtree(path)
print('remove the %s' % path)
  • sys.path(是个list)
    • paython解释器会按sys.pathon的路径查找
# sys包含python 和 工作目录
# 当前py文件所在路径会加载到 sys.path中
# pycharm也会 自动添加工作目录 和 项目路径加入
# python导入模块时默认查找路径
# 只能导入目录下的第一层文件

sys.path.append('module_path')

5. os(操作系统相关)(16)

  1. os.path.exist(file_name)
  2. os.stat(file_name).st_size
  3. os.path.abspath(file_name)
  4. os.path.dirname(file_name) # 获取上级目录
  5. os.path.join() # 路径拼接
  6. os.listdir() # 指定目录下的第一层文件,默认path = '.'
  7. os.walk(r'path')
  8. os.mkdir() / os.makedirs()
  9. os.rename(a, b)
  10. os.remove(a)
  11. os.path.isdir()
  12. os.path.isfile()
  13. os.path.isabs()
  14. os.path.basename():获取绝对路径下的文件名
  15. os.getpid():获取进程的id
  16. os.getppid():获取其父进程的id
import os
1. 获取文件大小
fiel_size = os.stat('filename').st_size       # 单位为字节
2. 读取文件
chunk_size = 1024
with open('filename', mode='rb') as f1:
  
v = r'path'                                            # r 表示转义,包括所有
os.path.dirname(v)
转义
v = 'al\\nex'
v = r'al\nex'                                            # 推荐
import os
v = 'test.txt'
path = 'user/henry/desktop'
new_path = os.path.join(path, v)
# 当前目录下第一层文件
import os
result = os.listdir(r'path')
print(result)

# 当前目录下的所有文件
import os
result = os.walk(r'path')   # 生成器
for a, b, c in result: 
  for i in c:                                           # a 是目录;b 是目录下的文件夹;c 是目录下的文件
    path = os.path.join(a, i)
      print(path)

6. shutil(4)

  1. shutil.make_archive()
  2. shutil.unpack_archive()
  3. shutil.rmtree()
  4. shutil.move()
import shutil
shutil.rmtree(r'path')
import shutil
 # 没有返回值
shutil.rmtree('dir_name')
# 重命名,可以是文件/目录
shutil.move('file_name1', 'new_file_name')
# 压缩文件(c_file_name.zip), 如果只给定文件名,压缩到py脚本所在目录
shutil.make_archive('c_file_name', 'zip', 'dir_name')
# 解压文件,默认是当前路径, 指定目录不存在会创建文件目录
shutil.unpack_archive('c_file_name.zip', extra=r'dir_paths', format='zip', )
from datetime import datetime
# 当前时间
ctime = datetim.now().strftime('%Y-%m-%d %H:%M:%S')
# 1.压缩test文件夹
# 2.放到code目录(默认不存在)
# 3.将文件解压到/User/henry/Desktop/t中

6.4 json

序列化:将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化

目的

  1. 以某种存储形式使自定义对象持久化
    • 对象持久化是指将内存中的对象保存到可永久保存的存储设备中(如磁盘)的一种技术。
  2. 将对象从一个地方传递到另一个地方。
  3. 使程序更具维护性。

python之旅_第1张图片

  • json, 所有语言通用,只能序列化指定的基本数据类型
    • dumps/loads/ dump/load
    • 所有字符串必须都是双引号
    • 最外层只能是dict/list
    • 不能支持load多次
    • dict中key只能是str
  • pickle,几乎支持所有python东西(socket对象),序列化的内容只能用python
    • dumps/loads/ dump/load
    • 支持连续load多次

1. json

# 只能包含,int,bool,str,list,dict
# 最外层必须是list/dict
# json 中如果包含str,必须是 双引号
# 如果是tuple类型数据,则会转换为list
- 特殊的字符串(list和dict嵌套的string)
- 不同语言间的数据交互
- 序列化/反序列化:把其语言的数据转化成json格式/ 相反
import json
v = [12, 3, 4, {'k1': 1}, True, 'adsf']
# 序列化
v = json.dumps(v)
# 反序列化
json.loads(v)
# 可转为json的数据中包含中文,让中文完全显示
v = {'k1': 'alex', 'k2': '你好'}
val = json.dumps(v, ensure_ascii=False)
print(val, type(val))

val = json.dumps(v)
print(val, type(val))

2. pickle

# 使用pickle序列化后,结果是编码后的二进制
import pickle
v = {1, 2, 3}
val = pickle.dumps(v)
print(val, typ(val))
val = pickle.loads(v)
print(val, typ(val))
# json dump 得到的是str, pickle得到的是bytes

Note(2)

  1. 经过编码过后的数据,通常称为 字节类型/bytes,字符串,格式为:b‘XXXXXXXX'
  2. 压缩后的0101

6.5 time&datetime

1. time

UTC/GMT:世界协调时间

本地时间:本地时区的时间

  • time.time() # 获取时间戳 1970.1.1 00:00-至今 的秒数
  • time.sleep(10) # 等待的秒数
  • time.timezone # 和标准时间的差距,和电脑的设置有关

2. datetime

# 获取datetime格式时间
from datetime import datetime, timezone, timedelta
v1 = datetime.now()
v2 = datetime.utcnow()
tz = timezone(timedelta(hours = 7))       # 东7区
v3 = datetime.now(tz)                          # 当前东7区时间


# 将datetime格式时间转化为str
v1 = datetime.now()
v1.strftime('%Y-%m-%d')                    # 连接不能使用汉字(Mac,linux没问题),可以使用.format()方法
# str转datetime,时间加减
val = datetime.strptime('2019-04-18', '%Y-%m-%d')
v = val +/- timedelta(days=40)              # 当前时间加/减40天
# 时间戳和datetime关系
import time, datetime
ctime = time.time()
datetime.fromtimestamp(ctime,tz)       # 当前时间,tz和上述相同
v = datetime.now()
val = v.timestamp()
print(val)

6.6 模块importlib

作用:根据字符串形式导入模块

开放封闭原则:配置文件开放,代码封闭

  1. 使用str导入模块
  2. __import__(和importlib.import_module('模块名'))
  3. os = __import__('os')和2等价
# 用字符串形式,去对象中找到其成员
import importlib
redis = importlib.import_module('utils.redis')
getattr(redis, 'func')()
import importlib
path = 'utils.redis.func'
module_path, func_name = path.rsplit('.', 1)
getattr(module_path, func_name)()
# 导入模块
import importlib
middleware_classes = [
    'utils.redis.Redis',
    'utils.mysql.MySQL',
    'utils.mongo.Mongo'
]
for path in middleware_classes:
    module_path,class_name = path.rsplit('.',maxsplit=1)
    module_object = importlib.import_module(module_path) # from utils import redis
    cls = getattr(module_object,class_name)
    obj = cls()
    obj.connect()

# 用字符串的形式导入模块。
# redis = importlib.import_module('utils.redis')
# 用字符串的形式去对象(模块)找到他的成员。
# getattr(redis,'func')()

6.7 日志(模块logging)

日志等级(level) 描述
DEBUG 最详细的日志信息,典型应用场景是 问题诊断
INFO 信息详细程度仅次于DEBUG,通常只记录关键节点信息,用于确认一切都是按照我们预期的那样进行工作
WARNING 当某些不期望的事情发生时记录的信息(如,磁盘可用空间较低),但是此时应用程序还是正常运行的
ERROR 由于一个更严重的问题导致某些功能不能正常运行时记录的信息
CRITICAL 当发生严重错误,导致应用程序不能继续运行时记录的信息

1. 日志示例

Note(2)
  • 多次配置logging模块,只有第一次配置有效
  • 在应用日志时,保留堆栈信息需加上exc_info=True
  • 用户:记录日志(银行流水)
  • 程序员:统计、故障排除的 debug、错误完成代码优化
# 方法1, 
# basicConfig 不能实现中文编码,不能同时向文件和屏幕输出
import logging
# logging.Error 默认级别
logging.basicConfig(fielname='cmdb.log',
                    format='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s'
                    datefmt = '%Y-%m-%d-%H-%M-%S'
                    level=logging.WARNING)
logging.log(10, '日志内容')                    # 不写
logging.debug('asdfgh')
logging.log(30, 'asdfgh')                      # 写
logging.warning('asdfgh')

应用场景:对于异常处理捕获的内容,使用日志模块将其保存到日志

try:
  requests.get('http://www.google.com')
except Exception as e:
  msg = str(e)  # 调用e.__str__方法
  logging.error(msg, exc_info=True)        # 线程安全,支持并发

2. logging本质

# 方法2
import logging
# 对象1:文件 + 格式
file_handler = logging.FileHandler('xxxxx', 'a', encoding='utf-8')
fmt = logging.Formatter(fmt='%(asctime)s - %(name)s - %(levelname)s - %(module)s: %(message)s')
file_handler.setFormatter(fmt)

# 对象2:写(封装了对象1 )
logger = logging.Logger('xxx(在log中会显示)', level=logging.ERROR)
logger.addHandler(file_handler)

logger.error('你好')

3. 示例

# 推荐
import logging

file_handler = logging.FileHandler(filename='x1.log', mode='a', encoding='utf-8',)
logging.basicConfig(
    format='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S %p',
    handlers=[file_handler,],
    level=logging.ERROR
)

logging.error('你好')

logger对像

  1. 创建一个logger对象、文件操作符屏幕操作符格式
  2. 给logger绑定文件操作和屏幕操作
  3. 给屏幕操作符和文件操作符设置格式
  4. 用logger对象操作
# warning和error写入不同文件,需要创建不同对象
import logging
# 需要加入name参数
logger = logging.getLogger() 
fh = logging.FileHandler('log.log')            # 写入文件
sh = logging.StreamHander()                  # 不需要参数,输出到屏幕
logger.addHander(fh)
logger.addHander(sh)
# asctime:日志写入时间, name:logger对象名称, levelname:日志级别, module:模块名称
fmt=logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(module)s: %(message)s')
fh.Setformatter(fmt)
logger.waring('message')

4. 日志切割

import time
import logging
from logging import handlers
# file_handler = logging.FileHandler(filename='x1.log', mode='a', encoding='utf-8',)
file_handler = handlers.TimedRotatingFileHandler(filename='x3.log', when='s', interval=5, encoding='utf-8')
logging.basicConfig(
    format='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S %p',
    handlers=[file_handler,],
    level=logging.ERROR
)

for i in range(1,100000):
    time.sleep(1)
    logging.error(str(i))
# 在应用日志时,如果想要保留异常的堆栈信息,exc_info=True
    msg = str(e)  # 调用e.__str__方法
    logging.error(msg,exc_info=True)

6.8 collections(python核心模块)

  • OrideredDict()
# dict创建过程
info = dict([('a', 1), ('b', 2), ('c', 3), ('d', 4)])
  • defaultDict
  • deque:双端队列
  • namedtuple:默认dict,可以给dict的value设置一个默认值
from collections import namedtuple
# 可命名tuple(time 结构化时间)
# 创建了一个Course类,这个类没有方法,所有属性值不能修改
Course = namedtuple('Course', ['name',  'price', 'teacher'])
python = Course('python', 999, 'alex')

print(python)
print(python.name)
print(python.price)

6.9 struct模块

  • unpack的结果是元组
  • 第一参数是数据类型
# 把数据转换为四个字节
import struct
a = struct.pack('i', 1000)
b = struct.pack('i', 78)

a1 = struct.unpack('i', a)
b1 = struct.unpack('i', b)

第七章 面向对象

7.1 面向对象基础

面向对象编程(Object Oriented Programming,OOP,面向对象程序设计)

优点和应用场景

  1. 业务功能较多时,通过面向对象归类
  2. 数据封装(创建字典存储数据)
  3. 游戏示例:创建一些角色,并根据角色需要再创建任务
  • 封装思想:将同一类的函数封装到同一个py文件中,以后方便使用
  • 面向对象:将同一类的函数封装到同一个class中,以后方便使用
  • 对象名:命名首字母大写

Note1(1)

  • 函数式的应用场景 --> 各个函数之间是独立且无共用的数据

1. 基础概念

  • :具有相同方法和属性的一类事物
  • 对象实例:一个拥有具体属性值和动作的具体个体
  • 实例化:从一个类得到一个具体对象的过程
# 定义一个类,Account
class Account:
    # 方法, 哪个对象调用方法,其就是self
    def login(self,name):
            print(123)
        return 666
    def logout(self):
            pass
# 调用类中的方法 
x = Account()                
# 实例化(创建)Account类的对象,开辟一块内存
val = x.login('henry')                            # 使用对象调用class中的方法
print(val)

Note2(2)

  • 应用场景:用于很多函数,需要对函数进行归类和划分(封装)
  • self:哪个对象操作,self代表类的实例,而非类

2. 对象的封装

  • 作用:存储一些值,将数据封装到对象,方便使用
  • 属性调用对象.属性名进行数据的调用
  • 广义封装:类中成员
  • 狭义封装:私有成员:_类名__名字:命名
class File:
  def read(self):
    with open(self.path, mode='r', encoding='utf-8') as f:
      data = f.read()
  def write(self, content):
    with open(self.path, mode='a', encoding='utf-8') as f:
      data = f.write()

obj = File()                    # 创建对象,并使用   
obj.path = 'test.txt'                              # 往obj对象中写入一个私有对象
obj.write(content)
# 定义私有属性,私有属性在类外部无法直接进行访问
obj2 = File('info.txt')
obj2.write(content)
class Person:
# __init__初始化方法(构造方法),给对象内部做初始化
    def __init__(self, name, age, gender):
        self.name = name
        self.age = age
        self.gender = gender
    def show(self):
        temp = 'i am %s, age:%s, gender:%s ' % (self.name, self.age, self.gender)
      print(temp)
# 类(),会执行__init__         
obj = Person('henry', 19, 'male') 
obj.show()

obj2 = Person('echo', 19, 'female')
obj2.show()

Note3(3)

  1. 函数和数据的封装
    • 如果写代码时,函数较多,可以将函数归类,并放入同一类中。(函数的封装)
    • 函数如果有一个反复使用的公共值,则可以封装到类中(数据的封装)
  2. 面向对象三大特性:封装、继承、多态
  3. 执行类中的方法时,需要通过self间接调用被封装的内容

2.1 查看对象的类

# 类有一个名为 __init__() 的构造方法,该方法在类实例化时会自动调用,一般通过object类进行格式化
# 类的方法与普通的函数只有一个特别的区别——它们必须有一个额外的第一个参数名称, 按照惯例它的名称是 self。
# self.__class__:查看实例所在的类
class Test:
    def prt(self):
        print(self)
        print(self.__class__)
t = Test()
t.prt()

2.2 类的方法

​ 在类的内部,使用 def 关键字来定义一个方法,与一般函数定义不同,类方法必须包含参数 self,且为第一个参数,self 代表的是类的实例。self 的名字并不是规定死的,也可以使用 this,但是最好还是按照约定是用 self

​ 类的私有方法**__private_method:两个下划线开头,声明该方法为私有方法,只能在类的内部调用 ,不能在类的外部调用。self.__private_methods**。

2.3 示例

# 循环让用户输入:用户名,密码,邮箱,输入完成后在打印
class Person():
  def __init__(self, user, pwd, email):
    self.username = user
    self.password = pwd
    self.email = email
  def info(self):
    return  temp = 'i am %s, pwd:%s, email:%s ' % (self.username, self.password, self.email,)

USER_LIST = []
while 1:
  user = input('please input user name: ')
  pwd = input('please input user pwd: ')
  email = input('please input user email: ')
  p = Person(user, pwd, email)
  USER_LIST.append(p)

for i in USER_LIST:
    data = i.info()
  print(i)

3. 继承

场景:多个类中,如果有公共的方法可以放到基类中,增加代码的重用性。

继承:可以对基类中的方法进行覆写

3.1 继承的查找方法

# 父类(基类)
class Base:
  def f1(self):
    pass
  
# 单继承,子类,Foo类继承Base类 (派生类)
class Foo(Base):
  def f2(self):
    pass
# 创建了一个子类对象
obj = Foo()
# 执行对象.方法时,优先在自己类中找,没有则找其父类
obj.f2()    
obj.f1()

# 创建了一个父类对象
obj = Base()
obj.f1()
obj.f2()   # 会报错

继承关系中的查找方法

  1. self 指的是哪个对象
  2. 当类是经典类时,多继承情况下,会按照深度优先方式查找
  3. 当类是新式类时,多继承情况下,会按照广度优先方式查找

3.2 经典类和新式类

  • 新式类:继承object,super,多继承(广度优先c3),具有mro方法
    • super(新式类支持,遵循mro顺序)
  • 经典类:py2不继承object,无super/mro , 深度优先

​ 从字面上可以看出一个老一个新,新的必然包含了跟多的功能,也是之后推荐的写法,从写法上区分的话,如果当前类或者父类继承了object类,那么该类便是新式类,否则便是经典类。

class D(object):
    def bar(self):
        print 'D.bar'
        
class C(D):
    def bar(self):
        print 'C.bar'

class B(D):

    def bar(self):
        print 'B.bar'

class A(B, C):

    def bar(self):
        print 'A.bar'
        
a = A()
# 执行bar方法时
# 首先去A类中查找,如果A类中没有,则继续去B类中找,如果B类中么有,则继续去C类中找,如果C类中么有,则继续去D类中找,如果还是未找到,则报错
# 所以,查找顺序:A --> B --> C --> D
# 在上述查找bar方法的过程中,一旦找到,则寻找过程立即中断,便不会再继续找了
a.bar()

4. 多态(多种形态/类型)

多态:一个类变现出来的多种状态—>多个类表现出相似的状态。

Pyhon不支持Java和C#这一类强类型语言中多态的写法,但是原生多态,Python崇尚“鸭子类型”。list,tuple,python的多态是通过鸭子类型实现的

# 多态,鸭子模型
def func(arg):                                        # 多种类型,很多事物
  v = arg[-1]                                  # 必须具有此方法,呱呱叫
  print(v)
# 对于一个函数,python对参数类型不会限制,传入参数时可以是各种类型,在函数中如果有例如:arg.append方法,就会对传入类型进行限制。
# 这就是鸭子模型,类似于上述的函数,我们认为只要能呱呱叫的就是鸭子,只要有append方法,就是我们想要的类型

5. 类的专有方法

  • **__init__ :** 初始化,在生成对象时调用
  • **__del__ :** 析构函数,释放对象时使用
  • **__repr__ :** 打印,转换
  • **__setitem__ :** 按照索引赋值
  • **__getitem__:** 按照索引获取值
  • **__len__:** 获得长度
  • **__cmp__:** 比较运算
  • **__call__:** 函数调用
  • **__add__:** 加运算
  • **__sub__:** 减运算
  • **__mul__:** 乘运算
  • **__truediv__:** 除运算
  • **__mod__:** 求余运算
  • **__pow__:** 乘方

6. 运算符重载

Python同样支持运算符重载,我们可以对类的专有方法进行重载

class Vector:
   def __init__(self, a, b):
      self.a = a
      self.b = b
 
   def __str__(self):
      return 'Vector (%d, %d)' % (self.a, self.b)
   
   def __add__(self,other):
      return Vector(self.a + other.a, self.b + other.b)
 
v1 = Vector(2,10)
v2 = Vector(5,-2)
print (v1 + v2)

7.2 类成员(6)

  • 实例化对象时,对在对象中存储类对象指针,指向其类

1. 类变量(静态字段/属性)

  • 写在类的下一级,和方法同级
  • 访问:类.变量名/ 对象.变量名
  • 继承关系中,自己类中没有的变量可以去基类中找
  • 只能赋值、修改自己的变量

对象成员实例变量(字段)

Note:属于谁的只允许谁去取,python允许对象去其类中取变量

2. 方法

2.1 绑定/普通方法

  1. 定义:必须有self参数
  2. 执行:先创建对象,由 对象.方法 调用

2.2 静态方法

  1. 定义:@staticmethod, 参数无限制
  2. 执行:类.静态方法名() / python对象也可以调用
class Foo:
    def __init__(self):
            self.name = 123
    
    def func(self, a, b):
        print(self.name, a, b)
# python内部装饰器
    @staticmethod
    def f():
        print(1,2)

Foo.f()
obj = Foo()
obj.func(1, 2)
obj.f()

2.3 类方法

  1. 定义:@classmethod, 必须有cls参数,当前类
  2. 执行:类.类方法() / python对象也可以调用
class Foo:
    def __init__(self):
            self.name = 123
    
    def func(self, a, b):
        print(self.name, a, b)
# python内部装饰器
    @classmethod
    def f(cls, a, b):
        print(a, b)

Foo.f(1, 2)
obj.f(1, 2)                                           # 不推荐

3. 属性

  1. 定义:@property 只能有一个参数self
  2. 执行:对象.属性名( 无括号
class Foo:
    @property
    def func(self):
        print(123)
        print(666)
       
obj = Foo()
ret = obj.func
print(ret)
# 示例:属性
class Page:
        def __init__(self, total_count, current_page, per_page = 10):
        self.total_count = total_count
        self.current_page = current_page
        self.per_page = per_page
    
    @proporty
    def start_index(self):
        return(self.current_page -1 ) * self.per_page
    @property
    def end_index(self):
        returno self.current_page * self.per_page_count
         
USER_LIST = []
for i in range(321):
    USER_LIST.append('henry-%s' % (i,))

# 请实现分页
current_page = int(input('请输入要查看的页码:'))
p = Page(321, current_page)
data_list = USER_LIST[p.start_index:p.end_index]
for i in data_list:
    print(i)

4. 成员修饰符

  • 公有:所有位置都能访问
  • 私有:__开头(只有自己才能访问)
class Foo:
    def __init__(self, name):
        self.__name = name    
    def func(self):
        print(self.name)        
obj = Foo('alex')
print(obj.__name)                        # 会报错
obj.func()                                            # 可以访问
class Foo:
    __x = 1 
    @staticmethod
    def func():
        print(Foo.__x)
obj = Foo()  
print(Foo.__x)                                    # 会报错
print(obj._Foo__x)                              # 强制访问私有成员

7.3 特殊方法

  • 特殊方法/魔术方法/内置方法/双下方法
  • 特殊成员(方法)__init__
  • type / isinstance / issubclass / super
  • 异常处理
  1. 类和对象的关系:对象是类的一个实例
  2. self:本质就是一个形式参数,对象调用方法时,python内部会将该对象传给这个参数
  3. 类/方法/对像都可以当作变量或嵌套到其他类中
class School(object):
    def __init__(self,title):
      self.title = title
    def rename(self):
      pass
   
class Course(object):
    def __init__(self, name, school_obj):
      self.name = name
      self.school = school_obj
    def reset_price(self):
      pass
      
class Classes(object):
    def __init__(self,cname, course_obj):
      self.cname = cname
      self.course = course_obj
    def sk(self):
      pass

s1 = School('北京')
c1 = Course('Python', s1)
cl1 = Classes('全栈1期', c1)

1. 嵌套

  • 函数:参数可以是任意类型
  • dict:函数、类和对像都可以作为字典的key, 即都是可hash的
  • 继承的查找关系
# 示例1
class StarkConfig(object):
  pass

class AdminSite(object):
  def __init__(self):
    self.data_list = []
  def register(self, arg):
    self.data_list.append(arg)
  
site = AdminSite()
obj = StarkConfig()
site.regisetr(obj)
# 示例2
class StarkConfig(object):
  def __init__(self, name, age):
    self.name = name
    self.age = aeg
    
class AdminSite(object):
  def __init__(self):
    self.data_list = []
    self.sk = None
    
  def set_sk(self, arg=StarkConfig):
    self.sk =arg
     
site = AdminSite()
site.set_sk(StarkConfig)
site.sk('henry', 19)
# 示例3
class StarkConfig(object):
  list_display = 'henry'
  
  def changelist(self):
    print(self.list_display)
    
class UserConfig(StarkConfig):
  list_display = 'echo'
  
  
class AdminSite(object):
  def __init__(self):
    self._register = {}
    
  def registry(self, key, arg=StarkConfig):
    self._register[key] = arg
  
  def run(self):
    for key, val in self._register.items():
      obj = val()
      obj.changelist()
    
site = AdminSite()
site.registry(1)
site.registry(2, StackConfig)
site.registry(3, UserConfig)                   # 易错点 echo
site.run()

2. 特殊成员

特殊成员:为了能够给快速实现某些方法而生。

2.1 __init__(初始化方法)

# 填充数据,一般称为初始化
class Foo:
  """
  此类的作用
  """
  def __init__(self):
  """
  初始化方法
  """
    pass

2.2 __new__(构造方法)

Note

  1. new方法是静态方法,在使用__new__方法时,构造的对象值为 new 方法的返回值
  2. 创建的是一块内存和指针
#  __new__ 创建一个空对象
# 通过 __init__ 初始化对像
class Foo(object):
  def __new__(cls, *args, **kwargs):   # 在 __init__ 之前
    return 'henry'/ object.__new__(cls)
  
  obj = Foo()
  print(obj)

2.3 __call__

# 对象() 会执行类中的 __call__ 方法
class Foo:
    def __init__(self):
        pass
    def __call__(self, *args, **kwargs):
        print('哈哈,你变成我了吧')

Foo()()
# 第三方模块。写一个网站,用户只要来访问,就自动找到第三个参数并执行
make_server('ip', port, Foo())

2.4 __getitem__ __setitem__ __delitem__

obj = dict()
obj['k1'] = 123
class Foo(object):
  def __setitem__(self, key, values):
    print(key, value)
  def __getitem__(self, item):
    return item + 'uuu'
  def __delitem__(self, key):
    print(key)
 
obj1 = Foo()
obj1['k1'] = 123  # 内部会自动调用__setitem__方法
obj1['xxx']       # 内部会自动调用__getitem__方法
del obj1['ttt']   # 内部会自动调用__delitem__方法

2.5 __str__

# 只有在打印时,会自动调用此方法,并将返回值显示出来
# type 查看
class Foo:
    def __str__(self):
        print('变样是不是不认识我了')
        return 'henry'
      
obj = Foo()
print(obj)

2.6 __dict__

作用: 查看对象中有哪些变量

class Foo(object):
  def __init__(self, name, age, email):
    self.name = name
    self.age = age
    self.email = email

obj = Foo('henry', 19, '[email protected]')
val = obj.__dict__                  # 去对象中找到所有变量并将其转换为字典
print(val) 

2.7 __enter__(上下文管理

作用:使用with语法时,需要

class Foo(object):
    def __enter__(self):
    self.x = open('a.txt', mode='a', encoding='utf-8')
    return self.x
  def __exit__(self, exe_type, exc_val, exc_tb):
    self.x.close()
  
with Foo() as f:                # 需要 __enter__ 和 __exit__ 方法
  f.write('henry')
  f.write('echo')

2.8 __add__ 两个对像相加

class Foo(object):
  def __init__(self, v):
    self.v = v
    
    def __add__(self, other):
    return self.v + other.v

obj1 = Foo()
obj2 = Foo()
val = obj1 + obj2                                 # obj1触发,把obj1传给self

2.9 __iter__

# 可迭代对象
class Foo:
    def __iter__(self):
            return iter([1, 2, 3, 4])
  
obj = Foo()
# 示例2
class Foo:
    def __iter__(self):
        yield 1
        yield 2
        ...
 
obj = Foo()

3. 内置函数

3.1 type(对象)

class Foo(object):
  pass

obj = Foo()
print('obj是Foo的对象,开心吧') if type(obj) == Foo else print('哪凉快呆哪去')

3.2 issubclass(子类,基类)

# 可以多级继承
class Base(object):
    pass
class Bar(Base):
    pass
class Foo(Bar):
    pass
print(issubclass(Foo, Base))

3.3 isinstance(obj, Foo)

# 判断某个对象是否时 某个类 或 基类 的实例(对象)
class Base(object):
    pass
class Foo(Base):
    pass
obj = Foo()
print(isinstance(obj, Foo))
print(isinstance(obj, Base))

4. super()

# super().func(),根据 self所属类的继承关系进行查找,默认找到第一个就停止
class Bar(object):
  def func(self):
      print('bar.func')
      return 123
class Base(Bar):
     def func(self):
      super().func()
      print('bar.func')
      return 123
  
class Foo(Base):
  def func(self):
    v = super().func()
    print('foo.func', v)
  
obj = Foo()
obj.func()

7.4 接口类和抽象类(约束)&反射

1. 扩展

# 会打印 hello
# 类里的成员会加载,代码会执行
# 函数只有在调用时执行
class Foo(object):
  print('hello')
  def func(self):
    pass
# 类的嵌套
class Foo(object):
    x = 1
    def func(self):
        pass

    class Meta(object):
        y = 123
        print('hello')
        def show(self):
            print(y.self)

2. 可迭代对象

  • 表象:可被for循环的对象
  • 作用:组合搜索
  • 可迭代对象:在类中实现**__iter__方法并返回迭代器/生成器**
# 可迭代对象示例1
class Foo:
    def __iter__(self):
            return iter([1, 2, 3, 4])
  
obj = Foo()
# 示例2
class Foo:
    def __iter__(self):
        yield 1
        yield 2
        ...''
 
obj = Foo()

3. 抽象类/接口类(约束 源码)

# python的约束,易错点
# 约束子类中必须要有send方法,如果没有则会抛出:NotImplementedError
class Interface(object):
  def send(self):
    raise NotImplementedError()

class Foo(Interface):
  def send(self):
    pass

class Base(Interface): 
  def func(arg):
    arg.send(arg)
# 应用场景示例
class BaseMassage(object):
  def send(self):
    raise NotImplementedError('子类中必须有send方法')
    
class Msg(BaseMassage):
  def send(self):
    print('发送短信')
  
class Email(BaseMassage):
  def send(self):
    print('发送邮件')
  
class Wechat(BaseMassage):
    def send(self):
    print('发送微信')
  
class DingDing(BaseMassage):
    def send(self):
        pass

obj = Email()
obj.send()

4. 反射

反射的概念是由Smith在1982年首次提出的,主要是指程序可以访问、检测和修改它本身状态或行为的一种能力(自省)。这一概念的提出很快引发了计算机科学领域关于应用反射性的研究。它首先被程序语言的设计领域所采用,并在Lisp和面向对象方面取得了成绩。

反射:通过字符串的形式操作对象相关的属性。python中的一切事物都是对象(都可以使用反射)

  • getattr('对象', 字符串):根据字符串的形式,去某个对象中获取其成员。
  • hasattr('对象', 字符串):根据字符串的形式,去某个对象中判断是否有该成员。
  • setattr('对象', '变量',值):根据字符串的形式,去某个对象中设置成员。
  • delatttr('对象', '变量'):根据字符串的形式,去某个对象中删除成员。
# getattr示例
class Foo(object):
  def __init__(self, name):
    self.name = name
    
obj = Foo('alex')
obj.name
v1 = getattr(obj, 'name')
# setattr示例
obj.name = 'eric'
setattr(obj, 'name', 'eric')
  • getattr:反射当前文件内容
# 反射当前文件内容
import sys
getattr(sys.modules[__name__], 'ab')
# 通过对象获取、示例变量、绑定方法
# 通过类来获取类变量、类方法、静态方法
# 通过模块名获取模块中的任意变量(普通变量、函数、类)
# 通过本文件反射任意变量
# 应用示例
class Foo(object):
   def login(self):
      pass
    
   def regiseter(self):
      pass
  
obj = Foo()
func_name = input('please input method name: ')
# 获取方法
getattr(obj, func_name)()
# setattr 示例
class Foo(object):
  pass

obj = Foo()
setattr(obj, 'k1', 123)
print(obj.k1)
# delattr 示例
class Foo(object):
  pass

obj = Foo()
obj.k1 = 999
delattr(obj, 'k1')
print(obj.k1)

Note(2)

  • python中一切皆对象(py文件,包,类,对象),可以通过getattr获取
  • 通过字符串操作内部成员都可以通过反射的机制实现
import x

v = x.NUM
# 等价于
v = getattr(x, 'NUM')
print(v)

v = getattr(x, 'func')
v()

v = getattr(x, 'Foo')
val = v()
val.x

示例:

# 浏览器两类行为
# way1: 输入地址+回车
get....
# way2: 表单(输入框+按键)
post....

# 浏览器都会有get,post,dispatch方法
class View(object):
  def get(self):
    pass 
  def Post(self):
    pass
  def Dispatch(self):                              # 请求第一步来这,在进行分发
    pass
# 推荐使用性能较好
class Foo(object):
  def post(self):
    pass

# 方式1
if hasattr(obj, 'get'):
  getattr(obj, 'get')
# 方式2:推荐使用
v = getattr(obj, 'get', None)
print(v)

7.5 单例&项目结构

1. 单例模式

1.1 单例

场景数据库连接和数据库连接池(数据一致时)

设计模式:23种设计模式

class Foo(object):
  pass 
# 每实例化一次,就创建一个新对象,内存地址 不一样
obj1 = Foo()
obj2 = Foo()
# 单例(Singleton)模式,无论是实例化多少次,都用第一次创建的那个对象,内存地址一样
class Singleton(object):
  instance = None
  def __new__(cls, *args, **kwargs):
    if not cls.instance:
        cls.instance = object.__new__(cls)
    return cls.instance
 
obj1 = Singleton()                                   # 内存地址一致
obj2 = Singleton()

1.2 标准

# 需要加锁,多线程,并发
class FileHelper(object):
  instance = None
    def __init__(self, path):
    self.file_object = open(path, mode='r', encoding='utf-8')
  
  def __new__(cls, *args, **kwargs):
    if not cls.instance:
      cls.instance = object.__new__(cls)
    return cls.instance

obj1 = FileHelper('x')                             # 内存地址一致
obj2 = FileHelper('x')

2. 模块导入

# 导入模块,只是保留模块内存
# 思考角度:函数名不能重复、内存溢出
from jd import n1

# 多次导入,模块只会加载一次,即使模块中包含其他模块
import jd
import jd
print(456)
# 多次导入,模块只会加载一次,即使模块中包含其他模块
import importlib
import jd
# 手动加载,会覆盖第一次导入
importlib.reload(jd)  
print(456)
  • 通过模块导入特性,也可以实现单例模式
# jd.py
class Foo(object):
  pass
obj = Foo()
# app.py
import jd                                             # 加载jd.py,加载最后会实例化一个Foo对象并赋值给obj
print(jd.obj)

3. 项目开发规范

  1. binstart
  2. config:配置文件settings
  3. src:业务逻辑
  4. db:数据文件
  5. lib:扩展模块
  6. log:日志文件

3.1 脚本

import os
import re
import datetime

import xlrd
import requests

3.2 单可执行文件

# app(程序入口)/src(业务相关)/lib(公共的类库)/db(文件)/config(配置)
app.py 越简单越好,少于10行

3.3 多可执行文件

# app(程序入口)/src(业务相关)/lib(公共的类库)/db(文件)/config(配置)
# bin(多个可执行文件例如:student.py,teacher.py,admin.py)
# log   (存储日志文件)
# seetings(BASE_PATH,LOG_FILE_NAME...)
path = sys.path.os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
sys.path.append(path)

python之旅_第2张图片

番外篇之正则

1. 基本概念

  1. re模块本身只是用来操作正则表达式的和正则本身无关
  2. 正则表达式:是一种匹配字符串的规则
  3. 为什么要有正则:应用场景
    • 匹配字符串
    • 表单验证:11位,全数字,1开头,第二个数 3-9,绑定银行卡
    • 爬虫:从网页源码中获取链接,重要数据

2. 规则

2.1 元字符

  • 是哪个一字符就匹配字符串中的哪一个字符
  1. 字符组(3)
    • [ad] ,匹配a/d,单字符匹配
    • [0-9], [a-z], [A-Z] (范围是从小到大),遵循ASCII码
    • [a-zA-Z], [0-9x]
  2. 转义字符(7 )
    • [0-9] 等价于 \d (\转义符,转义d使得其匹配0-9之间的数)
    • \w:(word,数字,大小写字母,下划线)
    • \s:(space, 空格,换行,制表符) (\t(table) \n(next))
    • \D \W \S(对以上结果取反)
    • \b:匹配\w\W之间,即匹配单词边界匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
  3. 特殊符号的含义(4)
    • . 除了换行符之外的任意内容
    • [\d] [0-9] \d 没有区别。 [\d\D] 匹配所有
    • [^abc]:非字符组,[abc] 取反
    • ^:表示一个字符的开始。 $:表示一个字符的结束 (^abc$)
  4. | 和()eg. abc|edf。 abc|ab
# 若果规则有重叠,需要长的在前面
www.(baidu|google).com
# () 表示分组,给一部分正则规定为一组,

2.2 量词(6)

1[3-9]\d{9}                                           # 量词前面一个重复次数,9次
1[3-9]\d{9,}                                          # 量词前面一个重复次数,9次以上
1[3-9]\d{n,m}                                        # 量词前面一个重复次数,n-m次
?                                                         # ? 匹配到0次或1次,没匹配上也算一次,匹配上算2次
                               #(可有可无,只能有一个)
+                              # + 匹配1次或多次
*                                                         # * 匹配0次或多次
# 匹配任意小数,保留两位
\d+\.\d{2}
# 匹配任意整数或小数
\d+\.?\d*                                           # 有bug
\d+(\.\d+)?                                            # 分组实现

2.3 贪婪匹配/惰性匹配

\d{7-12}                                                 # 默认是贪婪匹配,尽量多匹配
                                                             # 回溯算法
  
# 非贪婪匹配,惰性匹配,总是匹配符合条件范围内尽量小的字符串
\d{2,3}?                                          # 匹配两位数
\d+?3                                                     # 尽量多取,遇到3结束
元字符 量词 ?x                                        # 按照元字符规则在量词范围内匹配,一旦遇到x停止
.*?x                                                        # 常用,先找x找到匹配结束
# 身份证号匹配(正则表达式,断言)
[1-9](\d{16}[\dx]|\d{14})
[1-9]\d{14}(\d{2}[\dx])

^([1-9]\d{16}[0-9x]|[1-9]\d{14})$
. 是任意字符
* 是取 0 至 无限长度
? 是非贪婪模式。
.*?x                                                  # 就是取前面任意长度的字符,直到一个x出现

2.4 示例

# 匹配邮箱
\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}

# url
^((https|http|ftp|rtsp|mms)?:\/\/)[^\s]+

3. re模块

3.1 compile()

  • 编译正则表达式模式,返回一个对象的模式。(可以把那些常用的正则表达式编译成正则表达式对象,这样可以提高一点效率。)
  • 格式:re.compile(pattern,flags=0),pattern: 编译时用的表达式字符串。flags 编译标志位,用于修改正则表达式的匹配方式,如:是否区分大小写,多行匹配等。常用的flags有:
标志 含义
re.S(DOTALL) 使匹配包括换行在内的所有字符
re.I(IGNORECASE) 使匹配对大小写不敏感
re.L(LOCALE) 做本地化识别(locale-aware)匹配,法语等
re.M (MULTILINE) 多行匹配,影响^和$
re.X (VERBOSE) 该标志通过给予更灵活的格式以便将正则表达式写得更易于理解
re.U 根据Unicode字符集解析字符,这个标志影响\w,\W,\b,\B
import re
tt = "Tina is a good girl, she is cool, clever, and so on..."
rr = re.compile(r'\w*oo\w*')
print(rr.findall(tt))   
# 查找所有包含'oo'的单词
执行结果如下:
['good', 'cool']

3.2 re.match()

格式:re.match(pattern, string, flags=0)

  • 在search前的正则前加了一个:^
  • 想要完全匹配,可以在表达式末尾加上边界匹配符$,没有匹配到,则返回 None
   # 从字符串开头匹配,匹配上则返回一个match对像,有group()方法
   import re 
   ret = re.match('\d', '8alex83')  
   print(ret)

格式:re.search(pattern, string, flags=0)

  • re.search只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None
   print(re.search('\dcom','www.4comrunoob.5com').group())
   # 执行结果如下:4com

:match和search一旦匹配成功,就是一个match object对象,而match object对象有以下方法:

  • start() 返回匹配开始的位置
  • end() 返回匹配结束的位置
  • span() 返回一个元组包含匹配 (开始,结束) 的位置
  • group() 返回re整体匹配的字符串,可以一次输入多个组号,对应组号匹配的字符串。

a. group()返回re整体匹配的字符串,

b. group (n,m) 返回组号为n,m所匹配的字符串,如果组号不存在,则返回indexError异常
c.groups()groups() 方法返回一个包含正则表达式中所有小组字符串的元组,从 1 到所含的小组号,通常groups()不需要参数,返回一个元组,元组中的元就是正则表达式中定义的组。

   import re
   a = "123abc456"
    print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0))   #123abc456,返回整体
    print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1))   #123
    print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2))   #abc
    print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3))   #456
   ###group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。###

3.4 findall()

**格式**:re.findall(pattern, string, flags=0)
  • 可以获取字符串中所有匹配的字符串,返回一个列表,没有匹配则为空。
   p = re.compile(r'\d+')
   print(p.findall('o1n2m3k4'))
   执行结果如下:
   ['1', '2', '3', '4']
   import re
   tt = "Tina is a good girl, she is cool, clever, and so on..."
   rr = re.compile(r'\w*oo\w*')
   print(rr.findall(tt))
   print(re.findall(r'(\w)*oo(\w)',tt))        # ()表示子表达式 
   执行结果如下:
   ['good', 'cool']
   [('g', 'd'), ('c', 'l')]

3.5 finditer()

格式:re.finditer(pattern, string, flags=0)

  • 搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器。找到 RE 匹配的所有子串,并把它们作为一个迭代器返回。
   # 匹配到结果为 迭代器,每一项都是match对象,通过group取值
   import re
   ret = re.finditer('\d', 'safh123ghakjdsfg234'*2000000)
   for i in ret:
     print(i.group())

3.6 split()

**格式**:re.split(pattern, string[, maxsplit],maxsplit用于指定最大分割次数,不指定将全部分割。

- 按照能够匹配的子串将string分割后返回列表。
- 可以使用re.split来分割字符串,如:re.split(r'\s+', text);将字符串按空格分割成一个单词列表。

​```python
import re
ret = re.split('\d+', 'henry18')
print(ret)
# 保留分组中内容
ret = re.split('(\d+)', 'henry18')
print(ret)
​```

3.7 sub()/ subn()

**格式**:re.sub(pattern, repl, string, count=0)
   
**格式**:subn(pattern, repl, string, count=0, flags=0) 
  • 不返回/返回替换次数

import re
text = "JGood is a handsome boy, he is cool, clever, and so on..."
print(re.sub(r'\s+', lambda m:'['+m.group(0)+']', text,0))        # flags=0默认参数
执行结果如下:
JGood[ ]is[ ]a[ ]handsome[ ]boy,[ ]he[ ]is[ ]cool,[ ]clever,[ ]and[ ]so[ ]on...

python # 替换 n 次 ret = re.sub('\d', 'G', 'henry18',n) print(ret) # 返回替换次数(tuple类型) ret = re.subn('\d', 'G', 'henry18') print(ret) # 返回值为tuple类型 ​

```

4. 分组

4.1 特殊分组用法

语法 含义 示例
(?P) 分组,除了原有的编号外再指定一个额外的别名 (?Pabc){2} abcabc
(?P=name) 引用别名为的分组匹配到字符串 (?P\d)abc(?P=id) 1abc15abc5
引用编号为的分组匹配到字符串 (\d)abc\1 1abc15abc5
(?<=….) 以…开头,并不包括开头
(? 不以…结尾,并不包括开头

Note(3)

  1. [^] 带有特殊意义的元字符到字符组中大部分会取消它特殊意义
  2. [()+*.]:取消特殊含义,恢复原本意义
  3. [-]:第一个或最后表示横杠,中间位置表示范围

4.2. group()

  • 括号中默认为0,即取第0个分组
s = '

wahaha

' ret = re.search('(\w+)>(.*?)', s) print(ret.group()) print(ret.group(1)) print(ret.group(2))

4.3 分组命名

  • (?P正则表达式)
  • name:不需要加引号,本身就是字符串
ret = re.search('<(?P\w+)>(?P.*?)', s)
print(ret.group('tag'))
print(ret.group('content'))

4.4 引用分组

  • (?P=name)
s = '

wahaha

' ret = re.search('(?P\w+)>.*?', s) print(ret.group())
s = '

wahaha

' # \1 在python中有特殊含义 ret = re.search(r'(\w+)>.*?', s) print(ret.group())

4.5 取消分组优先

  • (?:)
# findall 遇到正则中的分组 优先 显示分组中的内容
import re
ret = re.findall('\d(\d)', 'henry18')
print(ret)
# 取消分组优先(?:正则表达式)
ret = re.findall('\d+(?:\.\d+)?', '1.234+2')
print(ret)

4.6 split,保留分割符

  • ()
# 保留分组中内容
ret = re.split('(\d+)', 'henry18')
print(ret)

5. 练习

# 示例1:匹配单个数字,findall方法会有屏蔽所有其他匹配项,只显示分组中内容
import re
ret = re.findall(r'\d+\.\d+|(\d)', '2+23*3.42/3.2')
print(ret)
while True:
    if '' not in ret:break
    ret.remove('')
print(ret)
# 示例2:匹配以...开头的数据,不包括开头
import re
m = re.findall('(?<=>)\w+', '\wahaha\\banana\\

qqxing\

') for i in m: print(i) # 匹配不以...开头的数据,不包括结尾 m = re.findall('(?)\w+', '\wahaha\\banana\\

qqxing\

') print(m)
  • | :或只负责把两个表达式分开,如果是整个表达式中只对一部分内容进行或,需要分组
  • ():限定一组正则的量词约束 (\d\w)?
# 示例3:以a开头,由至少一个字母组成的字
^a[a-zA-Z]+
^a[a-zA-Z]*
# 以1开头,中间3-5个数字,如果中间位置超过5个数字,则整个字符串不匹配
^1\d{3,5}$
# 示例4:匹配用户输入的身份证号
import re
content = input('用户输入:')
ret = re.match('[1-9]\d{14}(\d{2}[\dx])?$', content)
# 示例5:第一个乘除法
import re
ret = re.search('\d+(\.\d+)?[\*]-?\d+(\.\d+)?', s)

第八章 网络编程

  1. 网络基础
  2. 基于tcp协议和udp协议的socket
  3. 解决tcp协议的粘包问题
  4. 并发

8.1 网络基础

1. 基本概念(2)

  1. 两个运行中的程序传递信息?

    • 通过文件,通过网络
  2. 网络应用开发架构

    • C/S:client/server(需要安装对应的客户端)

python之旅_第3张图片

  • B/S:browser/server(不需要任何客户端)
    • 统一程序的入口
  • B/S是特殊的C/S

2. 网络中的概念(7)

  1. 网卡(3)
    • mac地址:48位, 6位冒分十六进制
    • head中包含的源和目标地址由来
      • ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址。
    • mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号)
  2. 交换机(4)
    • 功能:负责局域网通信(只认识mac地址,通过arp/ rarp协议)
    • 通信方式:广播、单播、组播(交换机只使用前面的两种)
    • ARP协议:地址解析协议,通过ip地址,获取其mac地址
    • 保留网段(私有IP):192.168.0.0-92.168.255.255 /172.16.0.0-172.31.255.255 /10.0.0.0-10.255.255.255
    • 广播限制在二层交换机的局域网范围内,禁止广播数据穿过路由器,防止广播数据影响大面积的主机
  3. 路由器(2)
    • 负责局域网间通信
    • 网关ip局域网的网络出口,访问局域网之外的区域都需要经过gateway
    • 路由器(Router)又称网关设备(Gateway)是用于连接多个逻辑上分开的网络
  4. 协议
    • server和client得到的内容都是二进制,双发预先约定好的一套语法规则
    • 语法、语义、时序
  5. IP地址
    • Ipv6:冒分16进制,0:0:0:0:0:0:0:0- FFFF:FFFF:FFFF:FFFF:FFFF:FFFF:FFFF:FFFF(128bits, 16x8)
    • 每一个ip地址要想被所有人访问到,那么这个ip地址必须是申请的
  6. port 端口(4)
    • 端口号0 - 65535
    • 一个端口同一时刻只能被一个服务占用
    • ip+port:可以确认一台机器上的一个应用
    • 1024以内只能是root才能启用

8.2 OSI&TCP/IP

1. TCP协议(6)

  1. TCP(Transmission Control Protocol)可靠的、面向连接的协议(eg:打电话)、传输效率低全双工通信(发送缓存&接收缓存)、面向字节流
  2. 应用场景:文件上传下载(邮件、网盘、缓存电影)、Web浏览器;电子邮件、文件传输程序。
  3. 特点(3):面向连接、可靠、流式传输的全双工通信
  4. 三次握手:请求(SYN)—> 确认(ACK)+请求—>确认
    • server端 accept 接收过程中等待客户端的连接
    • connect 会发送一个syn连接请求
      • 如果收到了server响应ack和由server端发来的syn连接请求
      • client端进行回复ack信息后,建立了一个tcp连接
    • 三次握手过程在代码过程中是由acceptconnect共同完成,具体细节在socket没有体现
  5. 四次挥手:请求(FIN)—> 确认—>请求—>确认
    • server 端和clinet端在代码中都有close方法,每一端发起的close操作都是断开fin请求,得到断开确认ack之后,就可以结束一端的数据发送
    • 如果两端发起close请求,那么就是两次请求两次确认,一共是四次操作
    • 可以结束数据发送,表示连接断开
  6. 长连接:会一直占用双方port
  7. I/O:相对于内存来说
    • write 是 send
    • read 是 recv
    • i input 向内存中输入 input,read,recv, recvfrom, accept, connect, close
    • output 从内存中输出 print,write,send,sendto, accept, connect, close

python之旅_第4张图片

2. UDP协议

  1. UDP(User Datagram Protocol)不可靠的、无连接的服务,传输效率高(发送前时延小),一对一、一对多、多对一、多对多、面向报文,尽最大努力服务,无拥塞控制。
  2. 场景**:即时通讯(qq,wechat),域名系统 (DNS);视频流;IP语音(VoIP)。
  3. 特点:面向数据报,不可靠,传输速度快,能完成一对多,多对一,和一对一的高效通信
  4. UDP 是User Datagram Protocol的简称, 中文名是用户数据报协议

Note1(3)

  • TCP传输数据几乎没有限制,UDP能够传递数据长度是有限的,是根据数据传递设备的设置有关
  • Tcp可靠连接,udp不可靠无连接
  • 三次握手时,确认信息和请求连接信息合并为一帧,四次挥手,主动断开端,不能确定另一端是否还需要传输信息,所以不能合并。

3. OSI(Open System Interconnection)

  1. 应用层
  2. 表示层
  3. 会话层
  4. 传输层
  5. 网络层
  6. 数据链路层
  7. 物理层

OSI五层协议(简化)

  1. 应用层:代码
  2. 传输层:tcp/udp 端口号四层路由器、四层交换机
  3. 网络层:ipv4/ipv6,三层路由器、三层交换机
  4. 数据链路层:mac地址,arp协议,(二层)交换机
  5. 物理层:二进制流

TCP/IP(arp在tcp/ip中属于网络层)

  1. 应用层
  2. 传输层
  3. 网络层
  4. 链路层

Note2(4)

  1. 家用路由器集成了交换功能
  2. 网络协议
    • 网际层协议:IP协议、ICMP协议、ARP协议、RARP协议。
    • 传输层协议:TCP协议、UDP协议。
    • 应用层协议:FTP、Telnet、SMTP、HTTP、RIP、NFS、DNS

4. socekt(套接字)

  1. 工作在应用层传输层之间的抽象层,帮助我们完成所有信息的组织拼接
    • Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
  2. socket历史
    1. 套接字起源于 20 世纪 70 年代加利福尼亚大学伯克利分校版本的 Unix,即人们所说的 BSD Unix。 因此,有时人们也把套接字称为“伯克利套接字”或“BSD 套接字”。一开始,套接字被设计用在同 一台主机上多个应用程序之间的通讯。这也被称进程间通讯,或 IPC套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。
    2. 基于文件类型的套接字家族
      • 套接字家族的名字:AF_UNIX,unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信
    3. 基于网络类型的套接字家族
      • 套接字家族的名字:AF_INET,(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)
  3. 同一机器上的两个服务之间的通信(基于文件)
    • 基于网络的多台机器之间的多个服务通信

  1. 其实站在你的角度上看,socket就是一个模块。我们通过调用模块中已经实现的方法建立两个进程之间的连接和通信。也有人将socket说成ip+port,因为ip是用来标识互联网中的一台主机的位置,而port是用来标识这台机器上的一个应用程序。所以我们只要确立了ip和port就能找到一个应用程序,并且使用socket模块来与之通信。

8.3 Socket模块

1. socket参数的详解

import socket
socket.socket(family=AF_INET,type=SOCK_STREAM,proto=0,fileno=None)
# 创建socket对象的参数说明:
参数 含义
family 地址系列应为AF_INET(默认值),AF_INET6,AF_UNIX,AF_CAN或AF_RDS。 (AF_UNIX 域实际上是使用本地 socket 文件来通信)
type 套接字类型应为SOCK_STREAM(默认值),SOCK_DGRAM,SOCK_RAW或其他SOCK_常量之一。 SOCK_STREAM 是基于TCP的,有保障的(即能保证数据正确传送到对方)面向连接的SOCKET,多用于资料传送。 SOCK_DGRAM 是基于UDP的,无保障的面向消息的socket,多用于在网络上发广播信息。
proto 协议号通常为零,可以省略,或者在地址族为AF_CAN的情况下,协议应为CAN_RAW或CAN_BCM之一。
fileno 如果指定了fileno,则其他参数将被忽略,导致带有指定文件描述符的套接字返回。 与socket.fromfd()不同,fileno将返回相同的套接字,而不是重复的。 这可能有助于使用socket.close()关闭一个独立的插座。

2. TCP信息传输

type = socket.SOCK_STREAM  # 表示tcp协议
# server 端
import socket 
sk = socket.socket()
sk.bind(('127.0.0.1'), port号)
sk.listen(n)               # 监听链接,n 表示允许多少个客户端等待,3.7之后无限制可省略
con,cli_addr = sk.accept() # 接受客户端链接,阻塞,服务端需要一直监听,不能关闭
con.recv(size)                   # 接收字节数
con.send('content'.encode('utf-8')) 
# socket 发送接收都是字节流,即二进制
con.close()                  #关闭客户端套接字
sk.close()                               #关闭服务器套接字(可选)

# client 端
import socket
sk = socket.socket()
sk.connet(('ip', port号))
sk.send('content'.encode('utf-8'))
sk.recv(size)
sk.close()
# ip和端口占用解决方法,针对macos
import socket
from socket import SOL_SOCKET,SO_REUSEADDR # 加入一条socket配置,重用ip和端口
sk = socket.socket()
sk.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)        # 就是它,在bind前加
sk.bind(('127.0.0.1',8898))                                 # 把地址绑定到套接字

3. TCP黏包问题

1. 黏包现象

  • 提高效率:为了减少tcp协议中的确认收到的网络延迟时间
  • 发送端:由于两个数据的发送时间间隔短+数据长度小,tcp协议的优化机制将两条信息作为一条信息发送出去
  • 接收端:由于tcp协议中所传输的数据无边界,来不及接收的多条数据会在接收端内核的缓存端黏在一起
  • 本质:接收信息的边界不清晰,主要是接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的

2. 成因机制

  1. tcp协议的拆包机制
    • 当发送端缓冲区的长度大于网卡的MTU时,tcp会将这次发送的数据拆成几个数据包发送出去。
    • MTU是Maximum Transmission Unit的缩写。意思是网络上传送的最大数据包。MTU的单位是字节大部分网络设备的MTU都是1500
    • 如果本机的MTU比网关的MTU大,大的数据包就会被拆开来传送,这样会产生很多数据包碎片,增加丢包率,降低网络速度。
  2. 面向流的通信特点和Nagle算法
    • TCP(transport control protocol,传输控制协议)是面向连接的,面向流的,提供高可靠性服务。
    • 收发两端(客户端和服务器端)都要有一一成对的socket,因此,发送端为了将多个发往接收端的包,更有效的发到对方,使用了优化方法(Nagle算法),将多次间隔较小且数据量小的数据,合并成一个大的数据块,然后进行封包。这样,接收端,就难于分辨出来了,必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。
    • 对于空消息tcp是基于数据流的,于是收发的消息不能为空,这就需要在客户端和服务端都添加空消息的处理机制,防止程序卡住,而udp是基于数据报的,即便是你输入的是空内容(直接回车),也可以被发送,udp协议会帮你封装上消息头发送过去。
    • 可靠黏包的tcp协议:tcp的协议数据不会丢,没有收完包,下次接收,会继续上次继续接收,己端总是在收到ack时才会清除缓冲区内容。数据是可靠的,但是会粘包

3. Tcp黏包现象

  • 自定义协议:首先发送报头(4bytes) ,针对发送数据大小进行提前声明,内容是即将发送报文字节长度
    • struct:把所有数字都固定的转换为4bytes
    • 再发送数据信息
# 自定义协议,解决黏包问题
# server端
import struct
import socket
sk = socket.socket()
sk.bind(('ip', port))
sk.listen()
con, cli_addr = sk.accept()
size = con.recv(4)
size = struct.unpack(size)[0]           # unpack,为一tuple类型
content = con.recv(size).decode('utf-8')# 接收文件内容
con.close()
sk.close()

# client端
import struct
import socket
sk = socket.socket()
sk.connect(('ip', port))
content  = '我是henry'.encode('utf-8')      # 字节流
size = struct.pack('i', len(content))          # 发送内容长度进行struct
sk.send(size)
sk.send(content)
sk.close()

4. UDP信息传输

# server
import socket
sk = socket.socket(type = socket.SOCK_DGRAM)
sk.bind(('127.0.0.1', 9000))

msg, client_addr = sk.recvfrom(1024)
print(msg)
sk.sendto(b'received', client_addr)
sk.close()

# client
import socket
sk = socket.socket(type = socket.SOCK_DGRAM)

sk.sendto(b'hello', ('127.0.0.1', 9000))
ret = sk.recv(1024)
print(ret)
sk.close()

Note3(2)

  1. socket收发的必须是bytes类型,经过编码的文件均是bytes类型
  2. 网络传输数据一般使用json格式

1. UDP不会发生黏包(6)

  1. UDP(user datagram protocol,用户数据报协议)是无连接的,面向消息的,提供高效率服务。
  2. 不会使用块的合并优化算法,由于UDP支持的是一对多的模式,所以接收端的skbuff(套接字缓冲区)采用了链式结构来记录每一个到达的UDP包,在每个UDP包中就有了消息头(消息来源地址端口等信息),这样,对于接收端来说,就容易进行区分处理了。 即面向消息的通信是有消息保护边界的
  3. 对于空消息:tcp是基于数据流的,于是收发的消息不能为空,这就需要在客户端服务端都添加空消息的处理机制,防止程序卡住,而udp是基于数据报的,即便是你输入的是空内容(直接回车),也可以被发送,udp协议会帮你封装上消息头发送过去。
  4. 不可靠不黏包的udp协议:udp的recvfrom阻塞的,一个recvfrom(x)必须对唯一一个sendto(y),收完了x个字节的数据就算完成,若是y;x数据就丢失,这意味着udp根本不会粘包,但是会丢数据,不可靠。
  5. UDP协议发送时,用sendto函数最大能发送数据的长度为:65535- IP头(20) – UDP头(8)=65507字节。用sendto函数发送数据时,如果发送数据长度大于该值,则函数会返回错误。(丢弃这个包,不进行发送)
  6. TCP协议发送,由于TCP是数据流协议,因此不存在包大小的限制(暂不考虑缓冲区的大小),这是指在用send函数时,数据长度参数不受限制。而实际上,所指定的这段数据并不一定会一次性发送出去,如果这段数据比较长,会被分段发送,如果比较短,可能会等待和下一次数据一起发送

5. socket其他操作

import socket
# 服务端套接字函数
s.bind()                                              # 绑定(主机,端口号)到套接字
s.listen()                                            # 开始TCP监听
s.accept()                                          # 被动接受TCP客户的连接,(阻塞式)等待连接的到来

# 客户端套接字函数
s.connect()                                         # 主动初始化TCP服务器连接
s.connect_ex()                                    # connect()函数的扩展版本,出错时返回出错码,而不是抛出异常

# 公共用途的套接字函数
s.recv()                                               # 接收TCP数据
s.send()                                              # 发送TCP数据
s.sendall()                                           # 发送TCP数据

s.recvfrom()                                         # 接收UDP数据
s.sendto()                                            # 发送UDP数据

s.getpeername()                                   # 连接到当前套接字的远端的地址
s.getsockname()                                   # 当前套接字的地址
s.getsockopt()                                      # 返回指定套接字的参数
s.setsockopt()                                      # 设置指定套接字的参数
s.close()                                              # 关闭套接字

# 面向锁的套接字方法
s.setblocking()                                      # 设置套接字的阻塞与非阻塞模式
s.settimeout()                                       # 设置阻塞套接字操作的超时时间
s.gettimeout()                                       # 得到阻塞套接字操作的超时时间

# 面向文件的套接字的函数
s.fileno()                                               # 套接字的文件描述符
s.makefile()                                           # 创建一个与该套接字相关的文件
# 官方文档对socket模块下的socket.send()和socket.sendall()解释如下:
socket.send(string[, flags])
Send data to the socket. The socket must be connected to a remote socket. The optional flags argument has the same meaning as for recv() above. Returns the number of bytes sent. Applications are responsible for checking that all data has been sent; if only some of the data was transmitted, the application needs to attempt delivery of the remaining data.
# send()的返回值是发送的字节数量,这个数量值可能小于要发送的string的字节数,也就是说可能无法发送string中所有的数据。如果有错误则会抛出异常。

socket.sendall(string[, flags])
Send data to the socket. The socket must be connected to a remote socket. The optional flags argument has the same meaning as for recv() above. Unlike send(), this method continues to send data from string until either all data has been sent or an error occurs. None is returned on success. On error, an exception is raised, and there is no way to determine how much data, if any, was successfully sent.
# 尝试发送string的所有数据,成功则返回None,失败则抛出异常。

# 故,下面两段代码是等价的:
sock.sendall('Hello world\n')

buffer = 'Hello world\n'
while buffer:
    bytes = sock.send(buffer)
    buffer = buffer[bytes:] 

8.4 非阻塞模型

  • 阻塞io模型,非阻塞io模型,事件驱动io,io多路复用,异步io模型五种

1. 非阻塞io模型模型

  • 利用tcp可以实现并发
  • server端使用setblocking(False)方法进行设置,此时需要使用异常处理
  • 客户端下线时,在非阻塞情况下,msg为空
# server端
import socket
sk = socket.socket()
sk.bind(('127.0.0.1', 9000))
sk.setblocking(False)                               # 设置为非阻塞状态
sk.listen()

user = []
del_user = []
while True:
    try:
        con, addr = sk.accept()
        user.append(con)
    except BlockingIOError:
        for i in user:
            try:
                content = i.recv(1024).decode('utf-8')
                if not content:
                    del_user.append(i)
                    continue
                i.send(content.upper(). encode('utf-8')) 
                # 发送的bytes类型可以直接解释出(ascii字符)
            except BlockingIOError:pass            # 注意异常,会报错
        for i in del_user:
            user.remove(i)
        del_user.clear()
sk.close()
# clinet端
import time
import socket
sk = socket.socket()
sk.connect(('127.0.0.1', 9000))
while True:
    sk.send(b'hello')
    msg = sk.recv(1024)
    print(msg)
    time.sleep(0.2)
sk.close()

Note4(3)

  1. socket的非阻塞io模型 + io多路复用实现(框架实现方式)
  2. 非阻塞提高了cpu利用率,但cpu有效率很低
  3. TCP断开连接后,只要有数据发送就会报错

2. 验证客户端的合法性

  • 验证客户端的合法性(自动化开发)
# 客户端使用对象是用户,直接登陆验证
    # 可以看到源码,在服务端进行验证登陆
# 客户端使用对象是机器
  1. 摘要算法:hmac算法
import hmac
secret_key = b'asdfgh'
random_seq = os.urandom(32)
hmac.new(secret_key, random_seq)
ret = hmac.digest()                           # 结果是bytes类型数据
  1. 使用hmac验证客户端的合法性
# 使用TCP协议发送数据为空时,默认不会发送
# server端
import os
import hmac
import socket

def chat(con):
    while True:
        msg = con.recv(1024).decode('utf-8')
        print('------>', msg)
        con.send(msg.upper().encode('utf-8'))
        # con.send(''.encode('utf-8'))              # tcp不会发送
        
sk = socket.socket()
sk.bind(('127.0.0.1', 9000))
sk.listen()

com_key = b'henry'
while True:
    con, addr = sk.accept()
    sec_key = os.urandom(32)
    con.send(sec_key)                             # 第一次发送
    val = hmac.new(com_key, sec_key).digest()
    data = con.recv(32)                           # 第一次接收
    if data == val:
        print('客户端合法')
        chat(con)
    else:
        print('客户端不合法')
        con.close()
sk.close()
# client 端
import socket
import hmac

def chat(sk):
    while True:
        sk.send('hello'.encode('utf-8'))
        msg = sk.recv(1024).decode('utf-8')
        print('------>', [msg])

sk = socket.socket()
sk.connect(('127.0.0.1', 9000))
sec_key = sk.recv(32)                           # 第一次接收
com_key = b'henry'
val = hmac.new(com_key, sec_key).digest()
sk.send(val)                                         # 第一次发送
chat(sk)

sk.close()
# 进阶示例
from socket import *
import hmac,os

secret_key=b'henry bang bang bang'
def conn_auth(conn):
    ''' 认证客户端链接'''
    print('开始验证新链接的合法性')
    msg=os.urandom(32)
    conn.sendall(msg)
    h=hmac.new(secret_key,msg)
    digest=h.digest()
    respone=conn.recv(len(digest))
    return hmac.compare_digest(respone,digest)

def data_handler(conn,bufsize=1024):
    if not conn_auth(conn):
        print('该链接不合法,关闭')
        conn.close()
        return
    print('链接合法,开始通信')
    while True:
        data=conn.recv(bufsize)
        if not data:break
        conn.sendall(data.upper())

def server_handler(ip_port,bufsize,backlog=5):
    '''只处理链接'''
    tcp_socket_server=socket(AF_INET,SOCK_STREAM)
    tcp_socket_server.bind(ip_port)
    tcp_socket_server.listen(backlog)
    while True:
        conn,addr=tcp_socket_server.accept()
        print('新连接[%s:%s]' %(addr[0],addr[1]))
        data_handler(conn,bufsize)

if __name__ == '__main__':
    ip_port=('127.0.0.1',9999)
    bufsize=1024
    server_handler(ip_port,bufsize)
# 客户端
__author__ = 'Linhaifeng'
from socket import *
import hmac,os

secret_key=b'linhaifeng bang bang bang'
def conn_auth(conn):
    '''验证客户端到服务器的链接'''
    msg=conn.recv(32)
    h=hmac.new(secret_key,msg)
    digest=h.digest()
    conn.sendall(digest)

def client_handler(ip_port,bufsize=1024):
    tcp_socket_client=socket(AF_INET,SOCK_STREAM)
    tcp_socket_client.connect(ip_port)
    conn_auth(tcp_socket_client)
    while True:
        data=input('>>: ').strip()
        if not data:continue            # tcp协议不支持发送数据为空
        if data.lower() == 'q':break

        tcp_socket_client.sendall(data.encode('utf-8'))
        respone=tcp_socket_client.recv(bufsize)
        print(respone.decode('utf-8'))
    tcp_socket_client.close()

if __name__ == '__main__':
    ip_port=('127.0.0.1',9999)
    bufsize=1024
    client_handler(ip_port,bufsize)

8.5 socketserver模块

1. socketserver模块

# server端
import socketserver                                 # socket是socketserver的底层模块和time,datetime一样
class Myserver(socketserver.BaseRequestHandler):
  def handle(self):                  # 自动触发handle方法,self.request == con
    print(self.request)                                 # con
server = socketsever.ThreadingTCPServer(('127.0.0.1', 9000), Myserver)
server.server_forever()

# client 
import socket
sk = socket.socket()
sk.connect(('127.0.0.1', 9000))

2. socketserver模块进阶

# 进阶示例
import socketserver
class Myserver(socketserver.BaseRequestHandler):
    def handle(self):
        self.data = self.request.recv(1024).strip()
        # self.client_address
        print("{} wrote:".format(self.client_address[0]))
        print(self.data)
        self.request.sendall(self.data.upper())

if __name__ == "__main__":
    HOST, PORT = "127.0.0.1", 9999
    # 设置allow_reuse_address允许服务器重用地址
    socketserver.TCPServer.allow_reuse_address = True
    # 创建一个server, 将服务地址绑定到127.0.0.1:9999
    server = socketserver.TCPServer((HOST, PORT),Myserver)
    # 让server永远运行下去,除非强制停止程序
    server.serve_forever()
   
# client端
import socket
HOST, PORT = "127.0.0.1", 9999
data = "hello"
# 创建一个socket链接,SOCK_STREAM代表使用TCP协议
with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as sock:
    sock.connect((HOST, PORT))                 # 链接到客户端
    sock.sendall(bytes(data + "\n", "utf-8"))  # 向服务端发送数据
    received = str(sock.recv(1024), "utf-8")   # 从服务端接收数据

print("Sent:     {}".format(data))
print("Received: {}".format(received))

第九章 并发编程

9.1 操作系统基础

  • 操作系统发展史
  • 并发和并行
  • 阻塞和非阻塞
  • 同步和异步
  • 进程:三状态图,唯一标示,开始和结束
  • 线程

1. 操作系统发展史

1.1 人机矛盾(cpu利用率低)

—>磁带存储+批处理(降低数据的读取时间,提高cpu的利用率)

—>多道操作系统:数据隔离、时空复用(能够遇到I/O操作的时候主动把cpu让出来,给其他任务使用,切换需要时间,由OS完成)

—> 短作业优先算法、先来先服务算法

—>分时OS:时间分片,CPU轮转,每一个程序分配一个时间片,降低了cpu利用率提高了用户体验

—>分时OS + 多道OS:多个程序一起执行,遇到IO切换,时间片到了也要切换

  • 多道技术介绍
  1. 产生背景:针对单核,实现并发
  2. 现在的主机一般是多核,那么每个核都会利用多道技术有4个cpu,运行于cpu1的某个程序遇到io阻塞,会等到io结束再重新调度,会被调度到4个 cpu中的任意一个,具体由操作系统调度算法决定。
  3. 空间上的复用:如内存中同时有多道程序
  4. 时间上的复用:复用一个cpu的时间片

Note:遇到io切,占用cpu时间过长也切,核心在于切之前将进程的状态保存下来,这样
才能保证下次切换回来时,能基于上次切走的位置继续运行。

2.2 操作系统分类(4)

OS作用:将应用程序对硬件资源的竞态请求变得有序化

  • 实时OS:实时控制,实时信息处理
  • 通用OS:多道、分时、实时处理或其两种以上
  • 网络OS:自带网络相关服务
  • 分布式OS:python中可使用:celery模块

2. 进程

2.1 进程:运行中的程序

  • 程序只是一个文件,进程是程序文件被cpu运行
  • 进程是计算机中最小的资源分配单位
  • 在OS中有唯一标示符PID

2.2 OS调度算法(4)

  • 短作业优先
  • 先来先服务
  • 时间片轮转
  • 多级反馈算法:分时+先来先服务+短作业优先

2.3 并行与并发

  1. 并发(concurrency):把任务在不同的时间点交给处理器进行处理。看起来程序同时执行,实际在同一时间点,任务并不会同时运行。
  2. 并行(parallelism):把每一个任务分配给每一个处理器独立完成。在同一时间点,任务一定是同时运行。
  3. 并发的本质:切换+保存状态

3. 同步异步阻塞非阻塞

  1. 同步:调用一个函数/方法,需要等待这个函数/方法结束
    • 一个功能调用时,没有得到结果之前,就不会返回,可以说是一种操作方式。
  2. 异步:程序同时运行,没有依赖等待关系,调用一个方法,不等待这个方法结束,不关心这个方法做了什么
  3. 阻塞:cpu不工作
    • 阻塞调用是指调用结果返回之前,当前线程会被挂起。函数只有在得到结果之后才会返回。
  4. 非阻塞:cpu工作
    • 指调用在不能立刻得到结果之前,该调用不会阻塞当前线程
  5. 同步阻塞
    • con.recv(),socket阻塞的tcp协议
  6. 同步非阻塞
    • 没有io操作的func()
    • socket非阻塞tcp协议; 调用自定义函数(不存在io操作)
  7. 异步非阻塞(重点)
    • 没有io操作,把func扔到其他任务里各自执行,cpu一直工作
  8. 异步阻塞
    • 程序中出现io操作

Note1(2)

  1. 同步和异步关注的是消息通信机制 (synchronous communication/ asynchronous communication)
  2. 阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态

4. 进程的三状态图

1. 进程状态

进程状态:运行(runing) 就绪(ready) 阻塞(blocking)

python之旅_第5张图片

2. 进程的创建与结束

  • 进程创建
  1. 系统初始化(ps)
  2. 一个进程开启了一个子进程(os.fork,subprocess.Popen)
  3. 用户交互式请求(用户双击app)
  4. 批处理作业的初始化(只在大型机的批处理系统中应用)
  • 进程结束
  1. 正常退出
  2. 出错退出
  3. 严重错误
  4. 被其他进程杀死(kill -9 pid)

9.2 进程

1. 进程与线程

1.1 分别做多件事

  • 如果是两个程序分别做两件事
    • 起两个进程
  • 如果是一个程序,要分别做两件事
    • 起线程,视频软件:下载电影1,电影2,电影3

1.2 进程解析

  1. 进程Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度基本单位,是OS结构的基础。

  2. 在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体。

  3. 顾名思义,进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。

  4. 进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重要的抽象概念之一。操作系统的其他所有内容都是围绕进程的概念展开的。

    PS:即使可以利用的cpu只有一个(早期的计算机确实如此),也能保证支持(伪)并发的能力。将一个单独的cpu变成多个虚拟的cpu(多道技术:时间多路复用和空间多路复用+硬件上支持隔离),没有进程的抽象,现代计算机将不复存在。

  5. 进程概念

    • 进程是一个程序实体。每一个进程都有它自己的地址空间,一般情况下,包括文本区域(text region)、数据区域(data region)和堆栈(stack region)。文本区域存储处理器执行的代码;数据区域存储变量和进程执行期间使用的动态分配的内存;堆栈区域存储着活动过程调用的指令和本地变量
    • 进程是一个“执行中的程序”。程序是一个没有生命的实体,只有处理器赋予程序生命时(操作系统执行之),它才能成为一个活动的实体,我们称其为进程。
    • 进程是操作系统中最基本、重要的概念。是多道程序系统出现后,为了刻画系统内部出现的动态情况,描述系统内部各道程序的活动规律引进的一个概念,所有多道程序设计操作系统都建立在进程的基础上。
  6. 特点

    • 是计算机中最小的资源分配单位数据隔离
    • 创建、销毁、切换进程时间开销大
    • 可以利用多核

1.3 线程(5)

  1. 线程是进程中的一部分,不能脱离进程存在
  2. 任何进程中至少有一个线程,负责执行代码,不负责存储共享的数据,也不负责资源分配
  3. 创建、销毁和切换的开销远远小于进程
  4. 线程是计算机中能被cpu调度的最小单位
    • 爬虫使用需要配合前端
  5. 一个进程中的多个线程可以共享这个进程的数据—— 数据共享

1.4 开销

  1. 线程的创建和销毁
    • 需要一些开销(一个存储局部变量的数据结构,记录状态)
    • 创建、销毁、切换开销远小于进程
  2. python中的线程比较特殊,所以进程也有可能被用到
  3. 进程:数据隔离、开销大、数据不安全、可以利用多核、os切换
  4. 线程:数据共享、开销小 、数据不安全、不可以利用多核、os切换

2. 进程的创建

  • 仔细说来,multiprocess不是一个模块而是python中一个操作、管理进程的包。 之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多,为了方便大家归类记忆,我将这部分大致分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享

2.1 multiprocessing

  • 基于process模块
# 获取进程的pid, 父进程的id及ppid
import os
import time
print('start')
time.sleep(20)
print(os.getpid(),os.getppid(),'end')

2.2 子进程和父进程

  1. pycharm中启动的所有py程序都是pycharm的子进程
# 把func函数交给子进程执行
import os
import time
from multiprocessing import Process

def func():
  print('start', os.getpid())
  time.sleep(1)
  print('end', os.getpid())

if __name__ == '__main__':    
  p = Process(target=func)              # 创建一个即将要执行的进程对象
  p.start()                                             # 开启一个进程,异步非阻塞
  p.join()                              # 同步阻塞,直到子进程执行完毕
  print('main', os.getpid())                    # 异步的程序,调用开启进程的方法,并不等待这个进程的开启
  1. 创建子进程注意

ps:__name__ 只有两种情况,文件名双下划线main字符串

# windows
通过(模块导入)执行父进程文件中的代码获取父进程中的变量
只要是不希望被子进程执行的代码,就写在if __name__ == '__mian__'下
进入导入时,父进程文件中的 __name__ != '__mian__'
# linux/macos
创建新的子进程是copy父进程内存空间,完成数据导入工作(fork),正常写就可以

公司开发环境都是linux,无需考虑win中的缺陷
# windows中相当于把主进程中的文件又从头执行了一遍

# linux,macos不执行代码,直接执行调用的函数在Windows操作系统中由于没有fork(linux操作系统中创建进程的机制),在创建子进程的时候会自动 import 启动它的这个文件,而在 import 的时候又执行了整个文件。因此如果将process() 直接写在文件中就会无限递归创建子进程报错。所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来,import 的时候  ,就不会递归运行了。
  • 父进程(主进程)存活周期

python之旅_第6张图片

Note2(5)

  1. 进程之间不能共享内存
  2. 主进程需要等待子进程结束,主进程负责创建回收子进程
  3. 子进程执行结束,若父进程没有回收资源,即僵尸进程。
  4. 主进程结束逻辑:主进程代码结束、所有子进程结束、回收子进程资源、主进程结束
  5. 进程里面无法进行input
    • 所有print都是向文件里数据
    • 只有主进程支持input操作,子进程不支持,会报错EOFError: EOF when reading a line

2.3 join方法

  • 把一个进程的结束事件封装成一个join方法
  • 执行join方法效果,阻塞,直到子进程结束,就结束
  • 所有的进程执行的先后是由OS控制的
# 在多个子进程中使用join方法
from multiprocessing import Process
def send_mail(i):
    print('邮件已发送', i)
if __name__ == '__main__':
    li = []
    for i in range(10):
        p = Process(target=send_mail, args=(i,))  # args必须是元组,给子进程中的函数传参数
        p.start()
    li.append(p)
    for p in li: p.join()               # 阻塞,知道所有子进程执行完毕
    print('100封邮件已发送')
# 主线程等待p终止(强调:是主线程处于等的状态,而p是处于运行的状态)。timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程 

9.3 锁&进程间通信

1. Process类

1.1 守护进程

  • 生产者消费者模型
  • 和守护线程做对比

p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建自己的新进程,必须在p.start()之前设置

import time
from multiprocessing import Process

def son1():
    while True:
        print('is alive')
        time.sleep(0.5)
    
def son2():
    for i in range(5):
      print('in son2')
      time.sleep(1)
              
if __name__ == '__main__':
    p = Process(target=son1)
    p.daemon = True                               # 把p子进程设置成了守护进程    
    p.start()
    p2 = Process(target=son2)
    p2.start()
    time.sleep(2)
# 守护进程是随着主进程‘代码’结束而结束
# 所有子进程都必须在主进程结束之前结束
# 守护进程内无法再开启子进程,否则抛出异常:AssertionError: daemonic processes are not allowed to have children

1.2 Process的方法

  • p.terminate(), p.is_alive(),current_process(current_process.ident/ name/ pid)
  • 异步非阻塞
    • 使用terminate方法后,再查看进程是否还存活时,会发现进程还存活,并没有等待OS关闭进程,说明terminate方法请求后,程序会继续执行
import time
from multiprocessing import Process

def son1():
    while True:
        print('is alive')
        time.sleep(0.5)
              
if __name__ == '__main__':
    p = Process(target=son1)
    p.start()                                           # 开启了一个进程
    print(p.is_alive)                             # 判断子进程时候存活, True和False
    time.sleep(1)
    p.terminate()                                     # “异步非阻塞”,强制结束一个子进程
    print(p.is_alive)                                  # True,os还没来得及关闭进程
    time.sleep(0.01)
    print(p.is_alive)                                  # False,OS已经响应了关闭进程的需求,再去检测的时候,结果是进程已经结束

1.3 面向对象开启进程

  • 当创建子进程需要传参时,需要使用**super().__init__()**
import os
import time
from multiprocessing import Process

class MyProcess(Process):
    def __init__(self, x, y):                      # 子进程如果不需要参数,可以省略
        self.x = x
        self.y = y
        super().__init__()        
        
    def run(self):
        while True:
            print(self.x, self.y, os.getpid())
            print('in myprocess')

if __name__ == '__main__':
    mp = MyProcess(1, 2)
    mp.daemon = True
    mp.start()                                        # 开启一个子进程,会调用run()方法
    time.sleep(1)
    mp.terminate()               # 结束进程,异步非阻塞                       
    print(mp.is_alive())                 # True
    time.sleep(0.01)                
    print(mp.is_alive())                 # False
  • p.join() : 同步阻塞
  • p.terminate() 和 p.start():异步非阻
  • p.is_alive():获取当前进程状态
  • daemon = True:设置为守护进程,守护进程在主进程代码执行结束而结束

2. 锁

  1. 在并发的场景下,设计某部分的内容
    • 需要修改一些所有进程共享数据资源
    • 需要加锁来维护数据的安全
  2. 在数据安全的基础上,才考虑效率问题
    • with lock:内部有异常处理
    • 在主进程中进行实例化
    • 把锁传递给子进程
  3. 在子进程中对需要加锁的代码进行with lock
    • with lock:相当于lock.acquire()和lock.release()
  4. 需要加锁的场景
    • 操作共享的数据资源
    • 对资源进行修改操作
    • 加锁之后能够保证数据的安全性,但会降低程序执行效率
# 数据操作时,不能同时进行修改
import json
from multiprocessing import Process, Lock  # 导入Lock

def search_ticket(user):
    with open('tickets.txt') as f:
        dic = json.load(f)
        print('%s查询结果:%s张余票' %(user, dic['count']))

def buy_ticket(user, lock):
    # with lock:
    lock.acquire()
    # time.sleep(0.01)
    with open('tickets.txt') as f:
        dic = json.load(f)
    if dic["count"] > 0:
        print('%s已买到票' % user)
        dic["count"] -= 1
    else:
        print('%s没买到票' % user)
    with open('tickets.txt', 'w') as f:
        json.dump(dic, f)
    lock.release()


if __name__ == '__main__':
    lock = Lock()                                    # 实例化一个对象
    for i in range(10):
        search_ticket('user%s '%(i+1),)
        p = Process(target=buy_ticket, args=('user%s '%(i+1), lock))
        p.start()

3. 进程间的通信

3.1 进程间数据隔离

from multiprocessing import Process
n = 100
def func():
    global n
  n -= 1
 
li = []
for i in range(10):
  p = Process(target=func)
  p.start()
  li.append(p)
  
 for p in li:p.join()
 print(n)

3.2 进程间通信

  • 文件或网络只有这两种
  • 进程间通信(IPC, inter-process communication):Queue和Pipe
  • Queue(3):先进先出,文件家族的socket,写文件基于pickle,基于Lock
    • 数据安全,Pipe管道:天生数据不安全(socket通信)
    • Queue = Pipe(socket + picket)+Lock
  • 第三方提供(5):redis,memcache,kafka,rabbitmq(消息中间件(消息转发))
    • 并发需求
    • 高可用
    • 实现集群的概念
    • 断电保存数据
    • 解耦
from multiprocessing import Process,Queue

def func(exp,q):
    res = eval(exp)
    q.put(res)

if __name__ == '__main__':
    q = Queue()
    p = Process(target=func, args=('1+2+3',q))
    p.start()
    print(q.get())

from multiprocessing import Pipe
pip = Pipe()
pip.send()
pip.recv()

# Process中的队列
import queue
from multiprocessing import Queue
q = Queue(3)                    # 可设置队列长度
q.put(1)
q.put(2)                        # 对列为满时,继续放数据会发生阻塞
q.put(3)
print('----------')
try:
    q.put_nowait(4)                           # 对列为满时,继续放数据会报错和丢失
except queue.Full:pass
print('----------')

q.get()
q.get()
q.get()                                                # 对列为空时,会发生阻塞
try:
    q.get_nowait()               # 对列为空时,会报错,阻塞会取消
except queue.Empty:pass

q.empty()                                               # 有缺陷
q.qsize()
q.full()

9.4 cp模型&线程

1. 生产者消费者模型

1.1 程序的解耦

  • 把写在一起的功能分开成多个小的功能处理
    • 修改和复用,增加可读性
    • 计算速度有差异,执行效率最大化,节省进程
  • 生产者:生产数据
  • 消费者:处理数据

python之旅_第7张图片

1.2 生产者和消费者

  1. 一个进程就是一个生产者/消费者
  2. 生产者和消费者之间的容器就是队列(队列有大小,控制内存消耗)
# 生产者消费者模型示例
import time
import random
from multiprocessing import Process, Queue

def producer(q, name, food):
    for i in range(10):
        time.sleep(random.random())
        fd = '%s%s' % (food, i)
        q.put(fd)
        print('%s生产了一个%s' % (name, food))

def consumer(q, name):
    while True:
        food = q.get()
        if not food:
            q.put(None)
            break
        time.sleep(random.randint(1, 3))
        print('%s吃了%s' % (name, food))

def cp(num1, num2):
    q = Queue(10)
    p_l = []
    for i in range(num1):
        p = Process(target=producer, args=(q, 'henry', 'food'))
        p.start()
        p_l.append(p)
    for i in range(num2):
        c = Process(target=consumer, args=(q, 'echo%s' % (i+1,)))
        c.start()
    for i in p_l:
        i.join()
    q.put(None)

if __name__ == '__main__':
    cp(1, 4)

# 生产者消费者模型示例之爬虫
import re
import requests
from multiprocessing import Process, Queue

def producer(q, url):
    response = requests.get(url)
    q.put(response.text)

def consumer(q):
    while True:
        s = q.get()
        if not s:
            q.put(None)
            break
        com = re.compile(
            '
.*?
.*?(?P\d+).*?(?P.*?)</span>' '.*?<span class="rating_num" .*?>(?P<rating_num>.*?)</span>.*?<span>(?P<comment_num>.*?)评价</span>', re.S) ret = com.finditer(s) for i in ret: print({ "id": i.group("id"), "title": i.group("title"), "rating_num": i.group("rating_num"), "comment_num": i.group("comment_num"), }) if __name__ == '__main__': count = 0 q = Queue() p_l = [] for i in range(10): count += 25 p = Process(target=producer, args=(q, 'https://movie.douban.com/top250?start=%s&filter=' % count)) p.start() p_l.append(p) for i in range(5): c = Process(target=consumer, args=(q,)) c.start() for i in p_l: i.join() q.put(None) </code></code></pre> <h4 id="joinablequeue">1.3 joinablequeue</h4> <ol> <li><strong>q.join()</strong>:阻塞,直到队列中所有内容被取走且<strong>q.task_done</strong> <ul> <li>生产者将使用此方法进行阻塞,直到队列中所有项目均被处理。阻塞将持续到为队列中的每个项目均调用</li> </ul></li> <li>先设置消费者为守护进程 <ul> <li><strong>c.daemon = True</strong></li> </ul></li> <li>阻塞生产者 <ul> <li>其中的队列阻塞结束后,才会结束</li> </ul></li> <li>在生产者中使用阻塞队列 <ul> <li>阻塞一结束,所有数据都已经消费完</li> </ul></li> <li>队列阻塞结束代表消费者,把所有生产数据消费完(<strong>jq.taks_done()操作</strong>) <ul> <li>使用者使用此方法发出信号,表示q.get()返回的项目已经被处理。如果调用此方法的次数大于从队列中删除的项目数量,将引发<strong>ValueError</strong>异常。<br><a href="http://img.e-com-net.com/image/info8/1c353f1b301f42b7867f2a40ef408376.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/1c353f1b301f42b7867f2a40ef408376.jpg" alt="python之旅_第8张图片" width="650" height="328" style="border:1px solid black;"></a></li> </ul></li> </ol> <p><a href="http://img.e-com-net.com/image/info8/ff9538d1fd8a44e0b126c2b8c48c41fe.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/ff9538d1fd8a44e0b126c2b8c48c41fe.jpg" alt="python之旅_第9张图片" width="650" height="300" style="border:1px solid black;"></a></p> <pre><code class="language-python"><code># joinable实现生产者、消费者模型 import time import random from multiprocessing import Process,JoinableQueue def producer(q, name, food): for i in range(10): time.sleep(random.random()) fd = '%s%s'%(food,i) print('%s生产了一个%s'%(name, food)) q.join() def consumer(q, name, food): while True: food = q.get() if not food: q.put(None) break time.sleep(random.randint(1, 3)) print('%s吃了%s'%(name, food)) q.task_done() if __name__ = '__main__': jq = JoinableQueue() p = Processor(target=producer, args=(jq, 'henry', 'food')) p.start() </code></code></pre> <h3 id="进程间数据共享">2. 进程间数据共享</h3> <ol> <li>与数据共享相关:<strong>Manager模块</strong>(Manager().list(), Manager().Queue)</li> <li>multiprocessing 中有一个manager类</li> <li>封装了所有和进程相关的<strong>数据共享</strong>、<strong>数据传递</strong></li> <li>但是对于dict、list这类进行数据操作时,会产生数据不安全</li> <li>m = Manager()也可以使用<strong>with Manager() as m</strong>:</li> </ol> <pre><code class="language-python"><code># 进程间数据是独立的,可以借助于队列或管道实现通信,二者都是基于消息传递的 # 虽然进程间数据独立,但可以通过Manager实现数据共享,事实上Manager的功能远不止于此 A manager object returned by Manager() controls a server process which holds Python objects and allows other processes to manipulate them using proxies. A manager returned by Manager() will support types list, dict, Namespace, Lock, RLock, Semaphore, BoundedSemaphore, Condition, Event, Barrier, Queue, Value and Array. </code></code></pre> <pre><code class="language-python"><code>from mutliprocessing import Manager,Lock def func(dic, lock): with lock: dic['count'] -= 1 if __name__ = '__main__': # m = Manager() lock = Lock() with Manager() as m: l = Lock() dic = m.dict({'count': 100}) # 共享的dict,list li = m.list([1,2,3]) p_l = [] for i in range(100): p = Process(target=func, args=(dic,lock)) p.start() p_l.append(p) for p in p_l:p.join() print(dic) </code></code></pre> <h3 id="线程">3. 线程</h3> <ol> <li><strong>调度和切换</strong>:线程<strong>上下文切换</strong>比进程上下文切换要快得多。</li> <li><strong>四核八线程</strong> <ul> <li>每个核心被虚拟成两个核心,可以同时执行8个线程。</li> <li>如果是计算复杂数据,会转换到四核</li> <li>https:加证书,需要购买</li> </ul></li> <li>在多线程的操作系统中,通常是在一个进程中包括多个线程,<strong>每个线程</strong>都是作为<strong>利用CPU的基本单位</strong>,是花费最小开销的实体。</li> <li><strong>线程具有以下属性(4)</strong> <ol> <li>线程中的实体基本上不拥有系统资源,只是<strong>有一点必不可少的、能保证独立运行的资源</strong>。 <ul> <li>独立调度和分派的基本单位。</li> <li>在多线程OS中,线程是能独立运行的基本单位,因而也是独立调度和分派的基本单位。由于线程很“轻”,故线程的切换非常迅速且开销小(在同一进程中的)。</li> </ul></li> <li>线程的实体包括<strong>程序</strong>、<strong>数据</strong>和<strong>TCB</strong>。<strong>线程是动态概念</strong>,它的动态特性由线程控制块<strong>TCB</strong>(Thread Control Block)描述。 <ul> <li>线程状态。</li> <li>当线程不运行时,被保存的现场资源。</li> <li>一组执行堆栈。</li> <li>存放每个线程的<strong>局部变量主存区</strong>。</li> <li>访问同一个进程中的主存和其它资源。</li> <li>用于指示被执行指令序列的<strong>程序计数器</strong>、<strong>保留局部变量</strong>、<strong>少数状态参数</strong>和<strong>返回地址</strong>等的一组寄存器和堆栈。</li> </ul></li> <li><strong>共享进程资源</strong> <ul> <li>线程在同一进程中的各个线程,都可以共享该进程所拥有的资源,</li> <li>这首先表现在:<strong>所有线程</strong>都具有<strong>相同的进程id</strong>,这意味着,线程可以访问该进程的每一个内存资源;</li> <li>此外,还可以访问进程所拥有的<strong>已打开文件</strong>、<strong>定时器</strong>、<strong>信号量机构</strong>等。由于同一个进程内的线程共享内存和文件,所以线程之间互相通信不必调用内核。</li> </ul></li> <li><strong>可并发执行</strong> <ul> <li>在一个进程中的多个线程之间,可以并发执行,甚至允许在一个进程中所有线程都能并发执行;</li> <li>同样,不同进程中的线程也能并发执行,充分利用和发挥了处理机与外围设备并行工作的能力。</li> </ul></li> </ol></li> </ol> <h4 id="垃圾回收机制">3.1垃圾回收机制</h4> <ol> <li><strong>cpython</strong>解释器不能实现多线程利用多核</li> <li>垃圾回收机制(gc):<strong>引用计数</strong> + <strong>分代回收</strong> <ul> <li>专门有一条线程完成垃圾回收机制,对每一个在程序中的变量<strong>统计引用计数</strong></li> </ul></li> </ol> <h4 id="gil锁">3.2 GIL锁</h4> <p><strong>GIL</strong>(global interpreter lock):<strong>全局解释器锁</strong></p> <ol> <li>保证了整个python程序中,只能有一个线程被CPU执行 <ul> <li>导致了py程序不能并行</li> <li>使用多线程并不影响高IO型操作,只会对高计算型程序有效率的影响</li> <li>遇到高计算:多进程+多线程,分布式</li> </ul></li> <li>原因:<strong>cpython</strong>解释器中特殊的垃圾回收机制</li> <li>cpython、pypy,jpython(先翻译为java字节码,在java上执行)、iron python</li> </ol> <h4 id="遇到io操作的时候">3.3 遇到IO操作的时候</h4> <ol> <li>5-6亿条cpu指令</li> <li>5-6cpu指令 == 一句python代码</li> <li>几千万条python代码</li> </ol> <h4 id="web框架几乎都是多线程">3.4 web框架几乎都是多线程</h4> <ul> <li>利用IO操作,类似多道系统</li> </ul> <h3 id="python操作线程重点">4. python操作线程(重点)</h3> <h4 id="开启线程">4.1 开启线程</h4> <ul> <li>使用<strong>Threading</strong>类</li> </ul> <pre><code class="language-python"><code># multiprocessing 是完全仿照Threading类的 import os import time from threading imoprt Thread def func(): print('start son thread') time.sleep(1) print('end son thread', os.getpid()) Thread(target=func).start() # 开启一个线程的速度非常快 print('start') time.sleep(0.5) print('end', os.getpid()) </code></code></pre> <pre><code class="language-python"><code># 开启多个线程 import os import time from threading imoprt Thread def func(): print('start son thread') time.sleep(1) print('end son thread', os.getpid()) for i in range(10): Thread(target=func).start() # 开启一个线程的速度非常快 # 线程的调度由OS决定 </code></code></pre> <h4 id="join方法-1">4.2 join方法</h4> <ol> <li>join阻塞知道子线程执行结束</li> </ol> <ul> <li><strong>主线程</strong>如果结束了,<strong>主进程</strong>也就结束了</li> <li><strong>主线程</strong>需要等待<strong>所有子线程结束</strong>才能结束</li> </ul> <pre><code class="language-python"><code>import os import time from threading imoprt Thread def func(): print('start son thread') time.sleep(1) print('end son thread', os.getpid()) t_l = [] for i in range(10): t = Thread(target=func) t.start() t_l.append(t) for i in t_l:i.join() print('子线程执行结束') </code></code></pre> <h4 id="面向对象启动线程">4.3 面向对象启动线程</h4> <ul> <li>self.ident / current_thread:查看线程id</li> <li>enumerate / active_count:查看线程存活情况</li> </ul> <pre><code class="language-python"><code>from threading import Thread class MyThread(Thread): def __init__(self, i): self.i = i super().__init__() # 注意变量名避免与父类init中的变量重名 def run(self): print(self.i, self.ident) # 通过self.ident,查看子线程的id t_l = [] for i in range(100): t = MyThread(i) t_l.append(t) t.start() # start 方法封装了开启线程的方法和run方法 for t in t_l: t.join() print('主进程结束') </code></code></pre> <h4 id="线程中的其他方法3大类">4.4 线程中的其他方法(3大类)</h4> <pre><code class="language-python"><code>from threading import current_thread, enumerate, active_count def func(): print('start son thread', i , current_thread()) time.sleep(1) print('end son thread', os.getpid()) t = Thread(target=func) t.start() print(t.ident) print(current_thread().ident) # current_ident()在哪个线程,就得到这个线程id print(enumerate()) # 统计当前进程中多少线程活着,包含主线程 print(active_count()) # 统计当前进程中多少线程活着,个数,包含主线程 # 线程中不能从主线程结束一个子线程 current_thread().name # 当前线程名称 current_thread().ident # 当前线程id current_thread().isalive() # 当前线程是否存活 current_thread().isdaemon() # 当前线程是否是守护线程 </code></code></pre> <h4 id="效率差">4.5 效率差</h4> <pre><code class="language-python"><code>import time from threading import Thread from multiprocessing import Process def func(a, b): c = a + b if __name__ == '__main__': p_l = [] start = time.time() for i in range(100): p = Process(target=func, args=(i, i*2)) p.start() p_l.append(p) for i in P_l:i.join() print(time.time() - start) t_l = [] start = time.time() for i in range(100): t = Thread(target=func, args=(i, i*2)) t.start() t_l.append(t) for i in t_l:i.join() print(time.time() - start) </code></code></pre> <h4 id="数据共享">4.6 数据共享</h4> <pre><code class="language-python"><code># 不要在子线程里随便修改全局变量 from threading import Thread n = 100 def son(): global n n -= 1 t_l = [] for i in range(100): t = Thread(target=son) t_l.append(t) t.start() for t in t_l:t.join() print(n) </code></code></pre> <h4 id="守护线程">4.7 守护线程</h4> <ul> <li>守护线程会一直等到所有非守护线程结束之后才结束</li> <li>除了<strong>守护主线程</strong>的代码之外,也会<strong>守护子线程</strong></li> <li>只要有非守护线程存在,主进程就不会结束</li> </ul> <pre><code class="language-python"><code>import time from threading imoprt Thread def son(): while True: time.sleep(0.5) def son2(): for i in range(5): t = Thread(target=son) t.daemon = True t.start() time.sleep(3) </code></code></pre> <h4 id="note32-1">Note3(2)</h4> <ol> <li>对<strong>主进程</strong>来说,运行完毕指的是主进程<strong>代码运行完毕</strong> <ul> <li>主进程在其代码结束后就已经运行完毕了(守护进程在此时就被回收),然后主进程会一直等非守护进程都运行完毕后回收子进程资源(否则会产生僵尸进程),才会结束。</li> </ul></li> <li>对<strong>主线程</strong>来说,运行完毕指的是主线程所在的进程内所有<strong>非守护线程执行完毕</strong> <ul> <li>主线程在其他非守护线程运行完毕后才算运行完毕(守护线程在此时就被回收),因为主线程的结束意味着进程的结束,进程整体的资源都将被回收,而进程必须保证非守护线程都运行完毕后才能结束。</li> </ul></li> </ol> <h2 id="锁池">9.5 锁&池</h2> <h3 id="互斥锁">1. 互斥锁</h3> <h4 id="互斥锁-1">1.1 互斥锁</h4> <pre><code class="language-python"><code># 线程数据同样不安全 import dis a = 0 def func(): global a a += 1 dis.dis(func) # 返回cpu指令 </code></code></pre> <ul> <li>即便是线程,有GIL锁, 也会出现<strong>数据不安全</strong>的问题</li> <li><strong>STORE_GLOBAL</strong>:一旦有这种方法,就会有数据安全问题</li> <li><strong>操作是全局变量</strong></li> <li><strong>操作以下方法</strong> <ul> <li>+= , -= , *=, /=(在操作线程全局变量时,注意)</li> <li>li[0] += 1, dic['key'] -= 1</li> <li>对同一文件进行写操作</li> </ul></li> </ul> <pre><code class="language-python"><code># 使用互斥锁解决线程全局变量数据不安全问题 from threading import Thread, Lock a = 0 def add_f(lock): global a with lock: for i in range(2000000): a += 1 def sub_f(lock): global a with lock: for i in range(2000000): a -= 1 lock = Lock() t1 = Thread(target=add_f, args=(lock,)) t1.start() t2 = Thread(target=sub_f, args=(lock,)) t2.start() t1.join() t2.join() print(a) </code></code></pre> <p><strong>互斥锁</strong>:是锁中的一种,在同一线程中,不能连续lock.acquire()多次</p> <pre><code class="language-python"><code>from threading import Lock lock = Lock() lock.acquire() print('-------------') lock.acquite() print('-------------') </code></code></pre> <h4 id="单例模式-1">1.2 单例模式</h4> <pre><code class="language-python"><code>import time import random from threading import Thread class Singleton: from threading import Lock # 复用性考虑 __instance = None lock = Lock() def __new__(cls, *args, **kwargs): with cls.lock: if not cls.__instance: time.sleep(random.random()) # 切换GIL锁 cls.__instance = super().__new__(cls) return cls.__instance def fun(): print(Singleton()) li = [] for i in range(10): t = Thread(target=fun) li.append(t) t.start() for t in li: t.join() </code></code></pre> <h3 id="死锁">2. 死锁</h3> <h4 id="原因2">2.1 原因(2)</h4> <ul> <li>有<strong>多把锁</strong>(一把以上)</li> <li>多把锁<strong>交替使用</strong></li> </ul> <pre><code class="language-python"><code>from threading import Thread,Lock noodle_lock = Lock() fork_lock = Lock() def eat1(name,noddle_lock, fork_lock): noddle_lock.acquire() print('%s抢到面了'%name) fork_lock.acquire() print('%s抢到叉子了'%name) print('%s吃了一口面'%name) noddle_lock.release() print('%s放下面了'%name) fork_lock.release() print('%s放下叉子了'%name) def eat2(name,noddle_lock, fork_lock): fork_lock.acquire() print('%s抢到叉子了'%name) noddle_lock.acquire() print('%s抢到面了'%name) print('%s吃了一口面'%name) noddle_lock.release() print('%s放下面了'%name) fork_lock.release() print('%s放下叉子了'%name) </code></code></pre> <h4 id="解决方案">2.2 解决方案</h4> <ol> <li><strong>递归锁</strong> <ul> <li>递归锁在同一线程中,可以连续<strong>acquire多次</strong>不会阻塞</li> <li><strong>本质</strong>:一把锁</li> <li>acquire和release次数要一致</li> <li><strong>优点</strong>:在同一线程中多次acquire也不会发生阻塞</li> <li><strong>缺点</strong>:<strong>占用</strong>了更多的<strong>资源</strong></li> </ul></li> <li><strong>多把递归锁</strong>也会产生<strong>死锁</strong>现象 <ul> <li>使用递归锁,永远不要使用多把</li> <li>互斥锁效率更高,递归锁效率较低</li> </ul></li> </ol> <pre><code class="language-python"><code>import time from threading import RLock, Thread noodle_lock = fork_lock = RLock() # 将多把互斥锁变成了一把递归锁 def eat1(name, noodle_lock, fork_lock): noodle_lock.acquire() print('%s抢到面了' % name) fork_lock.acquire() print('%s抢到叉子了' % name) print('%s吃了一口面' % name) time.sleep(0.1) fork_lock.release() print('%s放下叉子了' % name) noodle_lock.release() print('%s放下面了' % name) def eat2(name, noodle_lock, fork_lock): fork_lock.acquire() print('%s抢到叉子了' % name) noodle_lock.acquire() print('%s抢到面了' % name) print('%s吃了一口面' % name) time.sleep(0.1) noodle_lock.release() print('%s放下面了' % name) fork_lock.release() print('%s放下叉子了' % name) lst = ['henry', 'echo', 'dean', 'daniel'] Thread(target=eat1, args=(lst[0], noodle_lock, fork_lock)).start() Thread(target=eat2, args=(lst[1], noodle_lock, fork_lock)).start() Thread(target=eat1, args=(lst[2], noodle_lock, fork_lock)).start() Thread(target=eat2, args=(lst[3], noodle_lock, fork_lock)).start() </code></code></pre> <ol> <li><strong>代码优化</strong></li> </ol> <pre><code class="language-python"><code># 使用互斥锁解决问题 import time from threading import Lock, Thread lock = Lock() def eat1(name, lock): lock.acquire() print('%s抢到面了' % name) print('%s抢到叉子了' % name) print('%s吃了一口面' % name) time.sleep(0.1) print('%s放下叉子了' % name) print('%s放下面了' % name) lock.release() def eat2(name, lock): lock.acquire() print('%s抢到叉子了' % name) print('%s抢到面了' % name) print('%s吃了一口面' % name) time.sleep(0.1) print('%s放下面了' % name) print('%s放下叉子了' % name) lock.release() lst = ['henry', 'echo', 'dean', 'daniel] Thread(target=eat1, args=(lst[0], lock)).start() Thread(target=eat2, args=(lst[1], lock)).start() Thread(target=eat1, args=(lst[2], lock)).start() Thread(target=eat2, args=(lst[3], lock)).start() </code></code></pre> <h3 id="队列">3. 队列</h3> <ul> <li>线程之间的通信,线程安全</li> </ul> <pre><code class="language-python"><code>import queue # 先进先出队列:服务 from queue import Queue q = Queue(5) q.put(1) q.get() # 后进先出队列:算法 from queue import LifoQueue lfq = LifiQueue(4) lfq.put(1) lfq.put(2) lfq.get() lfq.get() # 优先级队列:自动排序、vip用户、告警级别 from queue import PriorityQueue pq = PriorityQueue() pq.put((10, 'henry')) pq.put((6, 'echo')) pq.put((10, 'dean')) pq.get() pq.get() pq.get() </code></code></pre> <ul> <li>FIFO:所有的请求放在对列里,先来先服务思想</li> <li>LIFO:一般用于算法</li> </ul> <h3 id="池">4. 池</h3> <ul> <li>进程,线程开启关闭切换需要时间</li> <li>进程池一般和cpu核心说有关,个数一般为cpu核心数或加一</li> <li>节省了进程创建和销毁的时间</li> </ul> <h4 id="池-1">4.1 池</h4> <ul> <li>预先开启固定个数的进程数,当任务来临时,直接提交给开好的进程,让这个进行执行,从而减轻了os调度的负担</li> </ul> <h4 id="concurrent">4.2 concurrent</h4> <ul> <li><strong>concurrent.futures模块(3)</strong></li> <li>3.4版本之后出现</li> <li><strong>进程池</strong></li> </ul> <pre><code class="language-python"><code># 进程池。 p.submit, p.shutdown import os,time, random from concurrent.futrures import ProcessPoolExecutor def func(i): print('start', os.getpid()) time.sleep(random.randint(1,3)) print('end', os.getpid()) return '%s * %s' %(i, os.getpid()) if __name__ == '__main__': p = ProcessPoolExecutor(5) # cpu核心数或多一 ret_l = [] for i in range(10): ret = p.submit(func, i) # 提交进程,参数直接放在其后 ret_l.append(ret) # ret为future对象,ret.result()取值 # 关闭池,不能提交任务,阻塞,直到已经提交的任务执行完毕 p.shutdown() for ret in ret_l: # 会阻塞,相当于q.get() print('------>',ret.result()) # result,同步阻塞 print('main', os.getpid()) </code></code></pre> <ul> <li>一个进程池中的任务个数,限制了我们程序的并发个数</li> <li><strong>线程池</strong></li> </ul> <pre><code class="language-python"><code># 线程池。p.submit(), p.shutdown(), ret.result() from concurrent.futures import ThreadPoolExecutor def func(i): print('start', os.getpid()) time.sleep(random.randint(1,3)) print('end', os.getpid()) return '%s * %s' %(i, os.getpid()) tp = ThreadPoolExecutor(20) # 线程个数一般为cpu核心数4-5倍 ret_l = [] for i in range(100): ret = tp.submit(func, 1) ret_l.append(ret) for ret in ret_l: print('------->', ret.result()) p.shutdown() print('main') </code></code></pre> <ul> <li>tp.map(func, <strong>可迭代对象</strong>):参数只能传输一个</li> </ul> <pre><code class="language-python"><code># 线程池。p.submit(), p.shutdown(), ret.result() from concurrent.futures import ThreadPoolExecutor def func(i): print('start', os.getpid()) time.sleep(random.randint(1,3)) print('end', os.getpid()) return '%s * %s' %(i, os.getpid()) tp = ThreadPoolExecutor(20) # 线程个数一般为cpu核心数4-5倍 ret = tp.map(func, range(20)) # tp.map()方法 for i in ret:print(i) # ret 为生成器对象 </code></code></pre> <h4 id="回调函数">4.3 回调函数</h4> <ul> <li>ret.add_done_callback:回调函数</li> <li>先来先响应,会提高整体的处理速度</li> <li>会监听obj值:直到obj.result()有值为止</li> </ul> <pre><code class="language-python"><code>from concurrent.futures import ThreadPoolExecutor def get_page(url): content = requests.get(url) return {'url':url, 'content':content.text} def parserpage(dic): print(dic.result()['url']) for url in url_l: ret = get_page(url) ret.add_done_callback(parserpage) # 先执行完,先调用parserpage函数 # ret=add_done_callback(函数名) </code></code></pre> <pre><code class="language-python"><code>from concurrent.futures import ProcessPoolExecutor import requests import os def get_page(url): print('<进程%s> get %s' % (os.getpid(), url)) respone = requests.get(url) if respone.status_code == 200: return {'url': url, 'text': respone.text} def parse_page(res): res = res.result() print('<进程%s> parse %s' % (os.getpid(), res['url'])) parse_res = 'url:<%s> size:[%s]\n' % (res['url'], len(res['text'])) with open('db.txt', 'a') as f: f.write(parse_res) if __name__ == '__main__': urls = ['https://www.baidu.com', 'https://www.openstack.org', 'http://www.sina.com.cn/', 'https://www.tencent.com'] p = ProcessPoolExecutor(3) for url in urls: p.submit(get_page, url).add_done_callback(parse_page) # parse_page拿到的是一个future对象obj,需要用obj.result()拿到结果 </code></code></pre> <h2 id="协程">9.6 协程</h2> <h3 id="协程概念">1. 协程概念</h3> <ol> <li><p><strong>协程</strong>:是单线程下的并发,又称<strong>微线程</strong>,<strong>纤程</strong>。英文名<strong>Coroutine</strong>。一句话说明什么是协程:<strong>协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的</strong>,多个任务在一条线程上来回切换。</p></li> <li><p><strong>协程</strong>:用户级别,自己写的py代码;控制切换是OS不可见的</p> <ol> <li>一个线程中的阻塞都被其他的各种任务占满了</li> <li>让OS认为这个线程很忙,尽量减少这个线程进入阻塞状态</li> <li>提高了<strong>单线程对cpu的利用率</strong> <ul> <li>多个任务在同一个线程中执行,也达到了一个并发的效果</li> </ul></li> <li>规避了每个任务的io操作,减少了线程的个数,减轻了OS负担</li> </ol></li> <li><p>在<strong>Cpython</strong>解释器:<strong>协程和线程</strong>都不能利用<strong>多核</strong></p> <ol> <li>由于多线程本身不能利用多核</li> <li>即便开启了多线程也只能<strong>轮流在一个cpu上执行</strong></li> <li>协程如果把所有<strong>io操作都规避掉</strong>,只剩下需要使用cpu的操作</li> </ol></li> <li><p>线程和协程<strong>对比</strong></p> <ol> <li><strong>线程</strong> <ul> <li>切换需要OS,开销大,os不可控,给os的压力大</li> <li>os对io操作的感知更加敏感</li> </ul></li> <li><strong>协程</strong></li> </ol> <ul> <li>切换需要py代码,开销小,用户操作可控,完全不会增加os压力 <ul> <li>用户级别对io操作感知较低 <ul> <li>协程切换开销几乎和函数调用一致</li> </ul></li> </ul></li> </ul></li> <li><p><strong>协程特点</strong></p> <ol> <li>必须在只有一个单线程里实现并发</li> <li><strong>修改共享数据</strong>不需加锁</li> <li>用户程序里自己保存多个控制流的上下文栈</li> <li>附加:一个协程遇到IO操作自动切换到其它协程(如何实现检测IO,yield、greenlet都无法实现,就用到了gevent模块(<strong>select机制</strong>))</li> </ol></li> <li><p>对比OS控制线程的切换,用户在<strong>单线程内</strong>控制协程的切换</p> <p><strong>优点如下</strong>:</p> <ol> <li>协程的切换开销更小,属于程序级别的切换,操作系统完全感知不到,因而更加轻量级</li> <li>单线程内就可以实现并发的效果,最大限度地利用cpu</li> </ol><p><strong>缺点如下</strong>:</p> <ol> <li>协程的<strong>本质</strong>是单线程下,无法利用多核,可以是一个程序开启多个进程,每个进程内开启多个线程,每个线程内开启协程</li> <li><strong>协程指的是单个线程</strong>,因而一旦协程出现阻塞,将会<strong>阻塞整个线程</strong></li> </ol></li> </ol> <h3 id="greenletgevent">2. greenlet&gevent</h3> <h4 id="原生python完成">2.1 原生python完成</h4> <ul> <li>asynicio:<strong>使用yield</strong></li> <li>能够在一个线程下的多个任务之间来回切换,那么每一个任务都是协程</li> </ul> <pre><code class="language-python"><code># 切换,协程任务 def func1(): 1 + 2 2 + 3 yield 1 sleep(1) def func2(): g = func1() next(g) next(g) </code></code></pre> <h4 id="c语言完成的py模块">2.2 C语言完成的py模块</h4> <ul> <li>greenlet</li> <li>gevent</li> </ul> <ol> <li>greenlet模块</li> </ol> <pre><code class="language-python"><code># 完成切换 import time from greenlet import greenlet def func1(): print(123) time.sleep(0.5) g2.switch() print(123) def func2(): print(456) time.sleep(0.5) print(456) g1.switch() g1 = greenlet(func1) g2 = greenlet(func2) g1.switch() </code></code></pre> <ol> <li><strong>协程切换原理</strong> <ul> <li><strong>事件循环</strong>:第三者一直在循环所有任务调度所有任务</li> </ul></li> </ol> <pre><code class="language-python"><code>def sleep(num): t = num + time.time() yield t print('sleep 结束') g1 = sleep(1) g2 = sleep(2) t1 = next(g1) t2 = next(g2) lst = [t1, t2] min_t = min(lst) time.sleep(min_t - time.time()) g1.next() min_t = min(lst) time.sleep(min_t - time.time()) g2.next()</code></code></pre> <ol> <li>gevent模块 <ul> <li>基于greenlet</li> <li>gevent.sleep/ gevent.<strong>spawn(func)</strong> / gevent.<strong>joinall(func_li)</strong> / g.<strong>join</strong>()</li> </ul></li> </ol> <pre><code class="language-python"><code># gevent不认识time.sleep import time import gevent from gevent import monkey monkey.patch_all() # 可能的阻塞方法 def func1(): print(123) gevent.sleep(1) print(123) def func2(): print(456) gevnet.sleep(1) print(456) g1 = gevent.spawn(fun1) g2 = gevent.spawn(fun2) # gevent.sleep(2) # 遇到阻塞才会切换 # g1.join() # 阻塞直到g1任务完成为止 # g2.join() gevent.joinall([g1, g2]) g_l = [] for i in range(10): g = gevent.spawn(func1) g_l.append(g) gevent.joinall(g_l) </code></code></pre> <pre><code class="language-python"><code># 示例大变身 import gevent from gevent import monkey,time monkey.patch_all() # 对io操作进行重现实现 def func1(): print(123) time.sleep(3) print(456) def func2(): print('---------') time.sleep(1) print('=========') g1 = gevent.spawn(func1) g2 = gevent.spawn(func2) gevent.joinall([g1, g2]) # 阻塞列表中的所有协程 print('main') </code></code></pre> <ul> <li>获取返回值</li> </ul> <pre><code class="language-python"><code>print(g1.value ) # value是属性,如果没有执行则为None</code></code></pre> <ul> <li>协程实现socket</li> </ul> <pre><code class="language-python"><code>import socket import gevent from gevent import monkey monkey.patch_all() sk = socket.socket() sk.bind(('127.0.0.1', 9000)) sk.listen() def chat(con): while True: msg = con.recv(1024).decode('utf-8') con.send(msg.upper().encode('utf-8')) while True: con, _ = sk.accept() gevent.spawn(chat, con) </code></code></pre> <h3 id="asynico">3. asynico</h3> <ul> <li>python原生底层的协程模块 <ul> <li>爬虫、webserver框架</li> <li>提高网编的效率和并发效果</li> </ul></li> </ul> <h4 id="启动一个任务">3.1 启动一个任务</h4> <pre><code class="language-python"><code>import asyncio # 只识别自身的方法 # 起一个任务 async def demo(): # 必须要async修饰,协程方法 print('start') await asyncio.sleep(1) # 阻塞,await关键字 + 协程函数 print('end') loop = asyncio.get_event_loop() # 创建一个事件循环 loop.run_until_complete(demo()) # 阻塞,直到协程执行完毕 # 把demo任务丢到事件循环中执行 </code></code></pre> <h4 id="启动多个任务">3.2 启动多个任务</h4> <ol> <li><strong>没有返回值</strong> <ul> <li>创建一个事件循环</li> <li>等待</li> <li>阻塞</li> </ul></li> </ol> <pre><code class="language-python"><code>import asyncio # 只识别自身的方法 async def demo(): # 必须要async修饰,协程方法 print('start') await asyncio.sleep(1) # 阻塞,await关键字 + 协程函数 print('end') loop = asyncio.get_event_loop() # 创建一个事件循环 wait_obj = asyncio.wait([demo(), demo(), demo()]) loop.run_until_complete(wait_obj) # 没有返回值 </code></code></pre> <ol> <li><strong>有返回值</strong> <ul> <li>创建一个事件循环</li> <li>loop.creat_task(func(arg1, arg2 …))</li> <li>asyncio.wait([task1, taks2 …]):得到一个任务列表对象</li> <li>loop.run_until)_complete(wait_obj)</li> <li>task列表中即为返回值(<strong>task对象</strong>)</li> </ul></li> </ol> <pre><code class="language-python"><code># 同步取返回值 import asyncio async def demo(): print('start') await asyncio.sleep(1) print('end') return 123 loop = asyncio.get_event_loop() # 创建一个事件循环 t1 = loop.create_task(demo()) t2 = loop.create_task(demo()) tasks = [t1, t2] # 任务列表 wait_obj = asyncio.wait([t1, t2]) loop.run_until_complete(wait_obj) for task in tasks: print(t.result()) # 获取返回值 </code></code></pre> <ol> <li><strong>异步取返回值</strong> <ul> <li>task = asyncio.ensure_future(func(arg1, arg2...))</li> <li>asyncio.as_compeleted(task_l):可迭代对象</li> <li>i await i</li> </ul></li> </ol> <pre><code class="language-python"><code>import asyncio async def demo(i): print('start') await asyncio.sleep(10-i) print('end') return i, 123 async def main(): task_l = [] for i in range(10): task = asyncio.ensure_future(demo(i)) task_l.append(task) for ret in asyncio.as_compeleted(task_l): res = await ret print(res) loop = asyncio.get_event_loop() loop.run_until_compeleted(main()) </code></code></pre> <h4 id="note32-2">Note3(2)</h4> <ol> <li><strong>await</strong> 阻塞事件,协程函数从这里切换出去,还能保证切回来 <ul> <li>必须写在<strong>async</strong>里面,async函数是个协程函数(调用时并不执行)</li> </ul></li> <li><strong>loop</strong>是事件循环,所有的协程执行、调度、都离不开<strong>loop</strong></li> </ol> <h3 id="协程的上下文切换">4. 协程的上下文切换</h3> <ol> <li>在一个基于协程的应用程序中,可能会产生数以千计的协程,所有这些协程,会有一个的<strong>调度器来统一调度</strong>。</li> <li>另外我们知道,高性能的程序首要注意的就是<strong>避免程序阻塞</strong>。</li> <li>那么,在以<strong>协程为最小运行单位</strong>的程序中,同样也需要确保这一点,即每一个协程都不能发生阻塞。</li> <li>因为<strong>只要某一个协程发生了阻塞</strong>,那么整个调度器就阻塞住了,后续等待的协程得不到运行,整个程序此时也将死翘翘了。</li> <li>CPU<strong>只认识线程</strong>,不会像线程一样把<strong>上下文保存在CPU寄存器</strong>,协程是用户控制的。</li> <li>协程的<strong>优缺点</strong> <ol> <li><strong>优点</strong> <ul> <li>无需线程上下文切换的开销,用yield的时候,只是在函数之间来回切换</li> <li>无需原子操作锁定及同步的开销,<strong>没有异步锁</strong>之类的东西,因为协程就是单线程</li> <li>方便切换控制流,简化编程模型</li> <li>高并发-高扩展-低成本,一个CPU支持<strong>上万个协程</strong>都不成问题</li> </ul></li> <li><strong>缺点</strong> <ul> <li>由于是单线程的无法利用多核资源,协程本质上是单线程</li> <li>协程需要和进程配合才能运行在多CPU上</li> <li>协程阻塞时会阻塞整个程序</li> </ul></li> </ol></li> </ol> </div> <p>转载于:https://www.cnblogs.com/henryw/p/10987095.html</p> </div> </div> </div> </div> </div> <!--PC和WAP自适应版--> <div id="SOHUCS" sid="1290384787806167040"></div> <script type="text/javascript" src="/views/front/js/chanyan.js"></script> <!-- 文章页-底部 动态广告位 --> <div class="youdao-fixed-ad" id="detail_ad_bottom"></div> </div> <div class="col-md-3"> <div class="row" id="ad"> <!-- 文章页-右侧1 动态广告位 --> <div id="right-1" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_1"> </div> </div> <!-- 文章页-右侧2 动态广告位 --> <div id="right-2" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_2"></div> </div> <!-- 文章页-右侧3 动态广告位 --> <div id="right-3" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_3"></div> </div> </div> </div> </div> </div> </div> <div class="container"> <h4 class="pt20 mb15 mt0 border-top">你可能感兴趣的:(python之旅)</h4> <div id="paradigm-article-related"> <div class="recommend-post mb30"> <ul class="widget-links"> <li><a href="/article/1835511912843014144.htm" title="理解Gunicorn:Python WSGI服务器的基石" target="_blank">理解Gunicorn:Python WSGI服务器的基石</a> <span class="text-muted">范范0825</span> <a class="tag" taget="_blank" href="/search/ipython/1.htm">ipython</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4/1.htm">运维</a> <div>理解Gunicorn:PythonWSGI服务器的基石介绍Gunicorn,全称GreenUnicorn,是一个为PythonWSGI(WebServerGatewayInterface)应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具,Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置,帮助初学者快速上手。1.什么是Gunico</div> </li> <li><a href="/article/1835506869838376960.htm" title="Python数据分析与可视化实战指南" target="_blank">Python数据分析与可视化实战指南</a> <span class="text-muted">William数据分析</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE/1.htm">数据</a> <div>在数据驱动的时代,Python因其简洁的语法、强大的库生态系统以及活跃的社区,成为了数据分析与可视化的首选语言。本文将通过一个详细的案例,带领大家学习如何使用Python进行数据分析,并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前,我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学</div> </li> <li><a href="/article/1835505858939809792.htm" title="python os.environ" target="_blank">python os.environ</a> <span class="text-muted">江湖偌大</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/1.htm">深度学习</a> <div>os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值,输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息(INFO)os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息(INFO\WARNING)os.environ['TF_CPP_MIN_LOG_LEVEL']='</div> </li> <li><a href="/article/1835505606245576704.htm" title="Python中os.environ基本介绍及使用方法" target="_blank">Python中os.environ基本介绍及使用方法</a> <span class="text-muted">鹤冲天Pro</span> <a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi</div> </li> <li><a href="/article/1835505226933694464.htm" title="Pyecharts数据可视化大屏:打造沉浸式数据分析体验" target="_blank">Pyecharts数据可视化大屏:打造沉浸式数据分析体验</a> <span class="text-muted">我的运维人生</span> <a class="tag" taget="_blank" href="/search/%E4%BF%A1%E6%81%AF%E5%8F%AF%E8%A7%86%E5%8C%96/1.htm">信息可视化</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98/1.htm">数据挖掘</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4%E5%BC%80%E5%8F%91/1.htm">运维开发</a><a class="tag" taget="_blank" href="/search/%E6%8A%80%E6%9C%AF%E5%85%B1%E4%BA%AB/1.htm">技术共享</a> <div>Pyecharts数据可视化大屏:打造沉浸式数据分析体验在当今这个数据驱动的时代,如何将海量数据以直观、生动的方式展现出来,成为了数据分析师和企业决策者关注的焦点。Pyecharts,作为一款基于Python的开源数据可视化库,凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力,成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏,并通过实际代码案例</div> </li> <li><a href="/article/1835504217729626112.htm" title="Python教程:一文了解使用Python处理XPath" target="_blank">Python教程:一文了解使用Python处理XPath</a> <span class="text-muted">旦莫</span> <a class="tag" taget="_blank" href="/search/Python%E8%BF%9B%E9%98%B6/1.htm">Python进阶</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath?2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代</div> </li> <li><a href="/article/1835503965563875328.htm" title="python os.environ_python os.environ 读取和设置环境变量" target="_blank">python os.environ_python os.environ 读取和设置环境变量</a> <span class="text-muted">weixin_39605414</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/os.environ/1.htm">os.environ</a> <div>>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA</div> </li> <li><a href="/article/1835497664922349568.htm" title="使用Faiss进行高效相似度搜索" target="_blank">使用Faiss进行高效相似度搜索</a> <span class="text-muted">llzwxh888</span> <a class="tag" taget="_blank" href="/search/faiss/1.htm">faiss</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>在现代AI应用中,快速和高效的相似度搜索是至关重要的。Faiss(FacebookAISimilaritySearch)是一个专门用于快速相似度搜索和聚类的库,特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索,并结合Python代码演示其基本用法。什么是Faiss?Faiss是一个由FacebookAIResearch团队开发的开源库,主要用于高维向量的相似性搜索和聚类。Faiss</div> </li> <li><a href="/article/1835497665853485056.htm" title="python是什么意思中文-在python中%是什么意思" target="_blank">python是什么意思中文-在python中%是什么意思</a> <span class="text-muted">编程大乐趣</span> <div>Python中%有两种:1、数值运算:%代表取模,返回除法的余数。如:>>>7%212、%操作符(字符串格式化,stringformatting),说明如下:%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+,-,''或0。+表示右对齐。-表示左对齐。''为一个空格,表示在正数的左侧填充一个空格,从而与负数对齐。0表示使用0填</div> </li> <li><a href="/article/1835495644123459584.htm" title="Day1笔记-Python简介&标识符和关键字&输入输出" target="_blank">Day1笔记-Python简介&标识符和关键字&输入输出</a> <span class="text-muted">~在杰难逃~</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98/1.htm">数据挖掘</a> <div>大家好,从今天开始呢,杰哥开展一个新的专栏,当然,数据分析部分也会不定时更新的,这个新的专栏主要是讲解一些Python的基础语法和知识,帮助0基础的小伙伴入门和学习Python,感兴趣的小伙伴可以开始认真学习啦!一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码,再通过语言处理程序执行向计算机发送指令,让计算机完成对应的工作,编程</div> </li> <li><a href="/article/1835495517774245888.htm" title="python八股文面试题分享及解析(1)" target="_blank">python八股文面试题分享及解析(1)</a> <span class="text-muted">Shawn________</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果:21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型,不仅仅改变</div> </li> <li><a href="/article/1835493753557708800.htm" title="每日算法&面试题,大厂特训二十八天——第二十天(树)" target="_blank">每日算法&面试题,大厂特训二十八天——第二十天(树)</a> <span class="text-muted">肥学</span> <a class="tag" taget="_blank" href="/search/%E2%9A%A1%E7%AE%97%E6%B3%95%E9%A2%98%E2%9A%A1%E9%9D%A2%E8%AF%95%E9%A2%98%E6%AF%8F%E6%97%A5%E7%B2%BE%E8%BF%9B/1.htm">⚡算法题⚡面试题每日精进</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a> <div>目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题,最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧!!特别介绍小白练手专栏,适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章</div> </li> <li><a href="/article/1835493626688401408.htm" title="Python快速入门 —— 第三节:类与对象" target="_blank">Python快速入门 —— 第三节:类与对象</a> <span class="text-muted">孤华暗香</span> <a class="tag" taget="_blank" href="/search/Python%E5%BF%AB%E9%80%9F%E5%85%A5%E9%97%A8/1.htm">Python快速入门</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>第三节:类与对象目标:了解面向对象编程的基础概念,并学会如何定义类和创建对象。内容:类与对象:定义类:class关键字。类的构造函数:__init__()。类的属性和方法。对象的创建与使用。示例:classStudent:def__init__(self,name,age,major):self.name&#</div> </li> <li><a href="/article/1835492869062881280.htm" title="pyecharts——绘制柱形图折线图" target="_blank">pyecharts——绘制柱形图折线图</a> <span class="text-muted">2224070247</span> <a class="tag" taget="_blank" href="/search/%E4%BF%A1%E6%81%AF%E5%8F%AF%E8%A7%86%E5%8C%96/1.htm">信息可视化</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96/1.htm">数据可视化</a> <div>一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd)数据可视化团队研发的ECharts1.0发布到GitHub网站以来,ECharts一直备受业界权威的关注并获得广泛好评,成为目前成熟且流行的数据可视化图表工具,被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言,也加入ECharts的使用行列,并研发出方便Python开发者使用的数据</div> </li> <li><a href="/article/1835491859351302144.htm" title="Python 实现图片裁剪(附代码) | Python工具" target="_blank">Python 实现图片裁剪(附代码) | Python工具</a> <span class="text-muted">剑客阿良_ALiang</span> <div>前言本文提供将图片按照自定义尺寸进行裁剪的工具方法,一如既往的实用主义。环境依赖ffmpeg环境安装,可以参考我的另一篇文章:windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg,而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装:pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了,上代码</div> </li> <li><a href="/article/1835491353451130880.htm" title="【华为OD技术面试真题 - 技术面】- python八股文真题题库(4)" target="_blank">【华为OD技术面试真题 - 技术面】- python八股文真题题库(4)</a> <span class="text-muted">算法大师</span> <a class="tag" taget="_blank" href="/search/%E5%8D%8E%E4%B8%BAod/1.htm">华为od</a><a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>华为OD面试真题精选专栏:华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例:文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片(Slicing)操作**基本切片语法</div> </li> <li><a href="/article/1835490974911000576.htm" title="python os 环境变量" target="_blank">python os 环境变量</a> <span class="text-muted">CV矿工</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/numpy/1.htm">numpy</a> <div>环境变量:环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里,比如数据库密码,个人账户密码,如果写进自己本机的环境变量里,程序用的时候通过os.environ.get()取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量:os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类</div> </li> <li><a href="/article/1835490218845761536.htm" title="Python爬虫解析工具之xpath使用详解" target="_blank">Python爬虫解析工具之xpath使用详解</a> <span class="text-muted">eqa11</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E7%88%AC%E8%99%AB/1.htm">爬虫</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中,数据提取是一个至关重要的环节。xpath作为一门</div> </li> <li><a href="/article/1835483915071090688.htm" title="【华为OD技术面试真题 - 技术面】- python八股文真题题库(1)" target="_blank">【华为OD技术面试真题 - 技术面】- python八股文真题题库(1)</a> <span class="text-muted">算法大师</span> <a class="tag" taget="_blank" href="/search/%E5%8D%8E%E4%B8%BAod/1.htm">华为od</a><a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>华为OD面试真题精选专栏:华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归(LinearRegression)模型形式:关键点:逻辑回归(LogisticRegression)模型形式:关键点:参数估计与评估:3.python浅拷贝及深拷贝浅拷贝(Shal</div> </li> <li><a href="/article/1835483159630802944.htm" title="nosql数据库技术与应用知识点" target="_blank">nosql数据库技术与应用知识点</a> <span class="text-muted">皆过客,揽星河</span> <a class="tag" taget="_blank" href="/search/NoSQL/1.htm">NoSQL</a><a class="tag" taget="_blank" href="/search/nosql/1.htm">nosql</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">数据库</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/%E9%9D%9E%E5%85%B3%E7%B3%BB%E5%9E%8B%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">非关系型数据库</a> <div>Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)</div> </li> <li><a href="/article/1835481269690003456.htm" title="《Python数据分析实战终极指南》" target="_blank">《Python数据分析实战终极指南》</a> <span class="text-muted">xjt921122</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>对于分析师来说,大家在学习Python数据分析的路上,多多少少都遇到过很多大坑**,有关于技能和思维的**:Excel已经没办法处理现有的数据量了,应该学Python吗?找了一大堆Python和Pandas的资料来学习,为什么自己动手就懵了?跟着比赛类公开数据分析案例练了很久,为什么当自己面对数据需求还是只会数据处理而没有分析思路?学了对比、细分、聚类分析,也会用PEST、波特五力这类分析法,为啥</div> </li> <li><a href="/article/1835479518656163840.htm" title="【勾心原创】《去年夏天》" target="_blank">【勾心原创】《去年夏天》</a> <span class="text-muted">不勾心的豆角</span> <div>(原创作者:不勾心的豆角)本期【勾心原创】,继续本人不勾心的豆角的现代诗创作之旅。《去年夏天》原创作者:不勾心的豆角那里芳草茵茵绿柳成行澄净蓝天下屋顶们相亲相爱闪着橙色紫色的馨香溪流温柔偎依着村庄牛儿羊儿信步徜徉还有成群的白鸽在尖顶的教堂盘旋歌唱孩子们是自由的蒲公英奔跑在希望的田野上任由天真的笑声肆无忌惮烂漫这人间天堂夜幕小心翼翼呵护着甜美的梦乡只剩尽职的晚风陪伴顽皮的星子们游荡快告诉我心爱的姑娘</div> </li> <li><a href="/article/1835477362700021760.htm" title="Python中深拷贝与浅拷贝的区别" target="_blank">Python中深拷贝与浅拷贝的区别</a> <span class="text-muted">yuxiaoyu.</span> <div>转自:http://blog.csdn.net/u014745194/article/details/70271868定义:在Python中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复</div> </li> <li><a href="/article/1835476983614631936.htm" title="Python开发常用的三方模块如下:" target="_blank">Python开发常用的三方模块如下:</a> <span class="text-muted">换个网名有点难</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>Python是一门功能强大的编程语言,拥有丰富的第三方库,这些库为开发者提供了极大的便利。以下是100个常用的Python库,涵盖了多个领域:1、NumPy,用于科学计算的基础库。2、Pandas,提供数据结构和数据分析工具。3、Matplotlib,一个绘图库。4、Scikit-learn,机器学习库。5、SciPy,用于数学、科学和工程的库。6、TensorFlow,由Google开发的开源机</div> </li> <li><a href="/article/1835473704432267264.htm" title="Python编译器" target="_blank">Python编译器</a> <span class="text-muted">鹿鹿~</span> <a class="tag" taget="_blank" href="/search/Python%E7%BC%96%E8%AF%91%E5%99%A8/1.htm">Python编译器</a><a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E5%90%8E%E7%AB%AF/1.htm">后端</a> <div>嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的,也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用,其实你还说对了这个还真的不可以吃也不可以穿,但是它用来干嘛的呢。用来编译你所打出的代码进行运行(可能这里说的有点不对但是只是个人认为)现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE,带有一整套可以帮助用户在使用Pyt</div> </li> <li><a href="/article/1835471437754888192.htm" title="一文掌握python面向对象魔术方法(二)" target="_blank">一文掌握python面向对象魔术方法(二)</a> <span class="text-muted">程序员neil</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>接上篇:一文掌握python面向对象魔术方法(一)-CSDN博客目录六、迭代和序列化:1、__iter__(self):定义迭代器,使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作,如obj[key]。3、__setitem__(self,key,value):定义赋值操作,如obj[key]=value。4、__delitem__(self,key):定义</div> </li> <li><a href="/article/1835471185589137408.htm" title="一文掌握python常用的list(列表)操作" target="_blank">一文掌握python常用的list(列表)操作</a> <span class="text-muted">程序员neil</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>目录一、创建列表1.直接创建列表:2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素,索引从0开始:2.还可以使用切片操作访问列表的一部分:三、修改列表元素四、添加元素1.append():在末尾添加元素2.insert():在指定位置插入元素五、删除元素1.del:删除指定位置的元素2.remove():删除指定值的第一个匹配项3.pop():</div> </li> <li><a href="/article/1835469798838988800.htm" title="Python实现简单的机器学习算法" target="_blank">Python实现简单的机器学习算法</a> <span class="text-muted">master_chenchengg</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%8A%9E%E5%85%AC%E6%95%88%E7%8E%87/1.htm">办公效率</a><a class="tag" taget="_blank" href="/search/python%E5%BC%80%E5%8F%91/1.htm">python开发</a><a class="tag" taget="_blank" href="/search/IT/1.htm">IT</a> <div>Python实现简单的机器学习算法开篇:初探机器学习的奇妙之旅搭建环境:一切从安装开始必备工具箱第一步:安装Anaconda和JupyterNotebook小贴士:如何配置Python环境变量算法初体验:从零开始的Python机器学习线性回归:让数据说话数据准备:从哪里找数据编码实战:Python实现线性回归模型评估:如何判断模型好坏逻辑回归:从分类开始理论入门:什么是逻辑回归代码实现:使用skl</div> </li> <li><a href="/article/1835465134710026240.htm" title="python中的深拷贝与浅拷贝" target="_blank">python中的深拷贝与浅拷贝</a> <span class="text-muted">anshejd70787</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>深拷贝和浅拷贝浅拷贝的时候,修改原来的对象,浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用:当创建一个对象,然后将这个对象赋值给另外一个变量的时候,python并没有拷贝这个对象,而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候,总是传递原始对象的引用,而不是一个副本。如下所示:>>>aList=["kel","abc",123]>>>bLis</div> </li> <li><a href="/article/1835463874560749568.htm" title="用Python实现简单的猜数字游戏" target="_blank">用Python实现简单的猜数字游戏</a> <span class="text-muted">程序媛了了</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%B8%B8%E6%88%8F/1.htm">游戏</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>猜数字游戏代码:importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字:"))whilen!=a:ifn>a:print("很遗憾,猜大了")n=int(input("请再次输入你猜想的数字:"))elifna::如果玩家猜的数字n大于随机数字a,则输出"很遗憾,猜大了",并提示玩家再次输入。elifn<a::如</div> </li> <li><a href="/article/87.htm" title="面向对象面向过程" target="_blank">面向对象面向过程</a> <span class="text-muted">3213213333332132</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>面向对象:把要完成的一件事,通过对象间的协作实现。 面向过程:把要完成的一件事,通过循序依次调用各个模块实现。 我把大象装进冰箱这件事为例,用面向对象和面向过程实现,都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian</div> </li> <li><a href="/article/214.htm" title="Java Hotspot: Remove the Permanent Generation" target="_blank">Java Hotspot: Remove the Permanent Generation</a> <span class="text-muted">bookjovi</span> <a class="tag" taget="_blank" href="/search/HotSpot/1.htm">HotSpot</a> <div>  openjdk上关于hotspot将移除永久带的描述非常详细,http://openjdk.java.net/jeps/122   JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/</div> </li> <li><a href="/article/341.htm" title="正则表达式向前查找向后查找,环绕或零宽断言" target="_blank">正则表达式向前查找向后查找,环绕或零宽断言</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F/1.htm">正则表达式</a> <div>向前查找和向后查找 1. 向前查找:根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。     对于向前查找,出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找:一个要匹配的字符序列前面有或者没有指定的</div> </li> <li><a href="/article/468.htm" title="BaseDao" target="_blank">BaseDao</a> <span class="text-muted">171815164</span> <a class="tag" taget="_blank" href="/search/seda/1.htm">seda</a> <div> import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn</div> </li> <li><a href="/article/595.htm" title="Ant标签详解--Java命令" target="_blank">Ant标签详解--Java命令</a> <span class="text-muted">g21121</span> <a class="tag" taget="_blank" href="/search/Java%E5%91%BD%E4%BB%A4/1.htm">Java命令</a> <div>        这一篇主要介绍与java相关标签的使用         终于开始重头戏了,Java部分是我们关注的重点也是项目中用处最多的部分。           1</div> </li> <li><a href="/article/722.htm" title="[简单]代码片段_电梯数字排列" target="_blank">[简单]代码片段_电梯数字排列</a> <span class="text-muted">53873039oycg</span> <a class="tag" taget="_blank" href="/search/%E4%BB%A3%E7%A0%81/1.htm">代码</a> <div>       今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子,如下:       import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S</div> </li> <li><a href="/article/849.htm" title="Hessian原理" target="_blank">Hessian原理</a> <span class="text-muted">云端月影</span> <a class="tag" taget="_blank" href="/search/hessian%E5%8E%9F%E7%90%86/1.htm">hessian原理</a> <div>Hessian 原理分析 一.      远程通讯协议的基本原理 网络通信需要做的就是将流从一台计算机传输到另外一台计算机,基于传输协议和网络 IO 来实现,其中传输协议比较出名的有 http 、 tcp 、 udp 等等, http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协</div> </li> <li><a href="/article/976.htm" title="区分Activity的四种加载模式----以及Intent的setFlags" target="_blank">区分Activity的四种加载模式----以及Intent的setFlags</a> <span class="text-muted">aijuans</span> <a class="tag" taget="_blank" href="/search/android/1.htm">android</a> <div>  在多Activity开发中,有可能是自己应用之间的Activity跳转,或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例,而不是产生大量重复的Activity。 这需要为Activity配置特定的加载模式,而不是使用默认的加载模式。 加载模式分类及在哪里配置 Activity有四种加载模式: standard singleTop</div> </li> <li><a href="/article/1103.htm" title="hibernate几个核心API及其查询分析" target="_blank">hibernate几个核心API及其查询分析</a> <span class="text-muted">antonyup_2006</span> <a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/.net/1.htm">.net</a><a class="tag" taget="_blank" href="/search/Hibernate/1.htm">Hibernate</a><a class="tag" taget="_blank" href="/search/xml/1.htm">xml</a><a class="tag" taget="_blank" href="/search/%E9%85%8D%E7%BD%AE%E7%AE%A1%E7%90%86/1.htm">配置管理</a> <div>(一)  org.hibernate.cfg.Configuration类         读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.)         Configuration co</div> </li> <li><a href="/article/1230.htm" title="PL/SQL的流程控制" target="_blank">PL/SQL的流程控制</a> <span class="text-muted">百合不是茶</span> <a class="tag" taget="_blank" href="/search/oracle/1.htm">oracle</a><a class="tag" taget="_blank" href="/search/PL%2FSQL%E7%BC%96%E7%A8%8B/1.htm">PL/SQL编程</a><a class="tag" taget="_blank" href="/search/%E5%BE%AA%E7%8E%AF%E6%8E%A7%E5%88%B6/1.htm">循环控制</a> <div>PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有   流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop </div> </li> <li><a href="/article/1357.htm" title="强大的Mockito测试框架" target="_blank">强大的Mockito测试框架</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/mockito/1.htm">mockito</a><a class="tag" taget="_blank" href="/search/%E5%8D%95%E5%85%83%E6%B5%8B%E8%AF%95/1.htm">单元测试</a> <div>一.自动生成Mock类        在需要Mock的属性上标记@Mock注解,然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类  &nbs</div> </li> <li><a href="/article/1484.htm" title="精通Oracle10编程SQL(11)开发子程序" target="_blank">精通Oracle10编程SQL(11)开发子程序</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/oracle/1.htm">oracle</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">数据库</a><a class="tag" taget="_blank" href="/search/plsql/1.htm">plsql</a> <div>/* *开发子程序 */ --子程序目是指被命名的PL/SQL块,这种块可以带有参数,可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序:过程和函数 --开发过程 --建立过程:不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E</div> </li> <li><a href="/article/1611.htm" title="【EhCache一】EhCache版Hello World" target="_blank">【EhCache一】EhCache版Hello World</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/Hello+world/1.htm">Hello world</a> <div>本篇是EhCache系列的第一篇,总体介绍使用EhCache缓存进行CRUD的API的基本使用,更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍   环境准备 1.新建Maven项目   2.添加EhCache的Maven依赖 <dependency> <groupId>ne</div> </li> <li><a href="/article/1738.htm" title="学习EJB3基础知识笔记" target="_blank">学习EJB3基础知识笔记</a> <span class="text-muted">白糖_</span> <a class="tag" taget="_blank" href="/search/bean/1.htm">bean</a><a class="tag" taget="_blank" href="/search/Hibernate/1.htm">Hibernate</a><a class="tag" taget="_blank" href="/search/jboss/1.htm">jboss</a><a class="tag" taget="_blank" href="/search/webservice/1.htm">webservice</a><a class="tag" taget="_blank" href="/search/ejb/1.htm">ejb</a> <div>最近项目进入系统测试阶段,全赖袁大虾领导有力,保持一周零bug记录,这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了,EJB基本的知识也有些了解,在这记录下EJB的部分知识,以供自己以后复习使用。   EJB是sun的服务器端组件模型,最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分,定义了一个用于开发基</div> </li> <li><a href="/article/1865.htm" title="angular.bootstrap" target="_blank">angular.bootstrap</a> <span class="text-muted">boyitech</span> <a class="tag" taget="_blank" href="/search/AngularJS/1.htm">AngularJS</a><a class="tag" taget="_blank" href="/search/AngularJS+API/1.htm">AngularJS API</a><a class="tag" taget="_blank" href="/search/angular%E4%B8%AD%E6%96%87api/1.htm">angular中文api</a> <div>angular.bootstrap 描述:     手动初始化angular。     这个函数会自动检测创建的module有没有被加载多次,如果有则会在浏览器的控制台打出警告日志,并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。   使用方法:     angular .</div> </li> <li><a href="/article/1992.htm" title="java-谷歌面试题-给定一个固定长度的数组,将递增整数序列写入这个数组。当写到数组尾部时,返回数组开始重新写,并覆盖先前写过的数" target="_blank">java-谷歌面试题-给定一个固定长度的数组,将递增整数序列写入这个数组。当写到数组尾部时,返回数组开始重新写,并覆盖先前写过的数</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div> public class SearchInShiftedArray { /** * 题目:给定一个固定长度的数组,将递增整数序列写入这个数组。当写到数组尾部时,返回数组开始重新写,并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答: * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl</div> </li> <li><a href="/article/2119.htm" title="天使还是魔鬼?都是我们制造" target="_blank">天使还是魔鬼?都是我们制造</a> <span class="text-muted">ducklsl</span> <a class="tag" taget="_blank" href="/search/%E7%94%9F%E6%B4%BB/1.htm">生活</a><a class="tag" taget="_blank" href="/search/%E6%95%99%E8%82%B2/1.htm">教育</a><a class="tag" taget="_blank" href="/search/%E6%83%85%E6%84%9F/1.htm">情感</a> <div>----------------------------剧透请原谅,有兴趣的朋友可以自己看看电影,互相讨论哦!!!     从厦门回来的动车上,无意中瞟到了书中推荐的几部关于儿童的电影。当然,这几部电影可能会另大家失望,并不是类似小鬼当家的电影,而是关于“坏小孩”的电影!     自己挑了两部先看了看,但是发现看完之后,心里久久不能平</div> </li> <li><a href="/article/2246.htm" title="[机器智能与生物]研究生物智能的问题" target="_blank">[机器智能与生物]研究生物智能的问题</a> <span class="text-muted">comsci</span> <a class="tag" taget="_blank" href="/search/%E7%94%9F%E7%89%A9/1.htm">生物</a> <div>       我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别....       但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把</div> </li> <li><a href="/article/2373.htm" title="获取Android Device的信息" target="_blank">获取Android Device的信息</a> <span class="text-muted">dai_lm</span> <a class="tag" taget="_blank" href="/search/android/1.htm">android</a> <div> String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph</div> </li> <li><a href="/article/2500.htm" title="最佳字符串匹配算法(Damerau-Levenshtein距离算法)的Java实现" target="_blank">最佳字符串匹配算法(Damerau-Levenshtein距离算法)的Java实现</a> <span class="text-muted">datamachine</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%8C%B9%E9%85%8D/1.htm">字符串匹配</a> <div>原文:http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------</div> </li> <li><a href="/article/2627.htm" title="小学5年级英语单词背诵第一课" target="_blank">小学5年级英语单词背诵第一课</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/english/1.htm">english</a><a class="tag" taget="_blank" href="/search/word/1.htm">word</a> <div>long 长的 show 给...看,出示 mouth 口,嘴 write 写   use 用,使用 take 拿,带来 hand 手 clever 聪明的   often 经常 wash 洗 slow 慢的 house 房子   water 水 clean 清洁的 supper 晚餐 out 在外   face 脸,</div> </li> <li><a href="/article/2754.htm" title="macvim的使用实战" target="_blank">macvim的使用实战</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/mac/1.htm">mac</a><a class="tag" taget="_blank" href="/search/vim/1.htm">vim</a> <div>macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳   1. 下载macvim https://code.google.com/p/macvim/   2. 了解macvim :h               vim的使用帮助信息 :h macvim  </div> </li> <li><a href="/article/2881.htm" title="java二分法查找" target="_blank">java二分法查找</a> <span class="text-muted">蕃薯耀</span> <a class="tag" taget="_blank" href="/search/java%E4%BA%8C%E5%88%86%E6%B3%95%E6%9F%A5%E6%89%BE/1.htm">java二分法查找</a><a class="tag" taget="_blank" href="/search/%E4%BA%8C%E5%88%86%E6%B3%95/1.htm">二分法</a><a class="tag" taget="_blank" href="/search/java%E4%BA%8C%E5%88%86%E6%B3%95/1.htm">java二分法</a> <div>java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/</div> </li> <li><a href="/article/3008.htm" title="Spring Cache注解+Memcached" target="_blank">Spring Cache注解+Memcached</a> <span class="text-muted">hanqunfeng</span> <a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a><a class="tag" taget="_blank" href="/search/memcached/1.htm">memcached</a> <div>Spring3.1 Cache注解  依赖jar包: <!-- simple-spring-memcached --> <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s</div> </li> <li><a href="/article/3135.htm" title="apache commons io包快速入门" target="_blank">apache commons io包快速入门</a> <span class="text-muted">jackyrong</span> <a class="tag" taget="_blank" href="/search/apache+commons/1.htm">apache commons</a> <div>原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html   Apache Commons IO 包绝对是好东西,地址在http://commons.apache.org/proper/commons-io/,下面用例子分别介绍:   1)  工具类   2</div> </li> <li><a href="/article/3262.htm" title="如何学习编程" target="_blank">如何学习编程</a> <span class="text-muted">lampcy</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/C%2B%2B/1.htm">C++</a><a class="tag" taget="_blank" href="/search/c/1.htm">c</a> <div>首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有</div> </li> <li><a href="/article/3389.htm" title="架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy" target="_blank">架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy</a> <span class="text-muted">nannan408</span> <a class="tag" taget="_blank" href="/search/Spring3/1.htm">Spring3</a> <div>1.前言。    如题。 2.描述。    @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法,使用该Annotation时可以指定一个字符串数组作为参数,每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp</div> </li> <li><a href="/article/3516.htm" title="Spring4+quartz2的配置和代码方式调度" target="_blank">Spring4+quartz2的配置和代码方式调度</a> <span class="text-muted">Everyday都不同</span> <a class="tag" taget="_blank" href="/search/%E4%BB%A3%E7%A0%81/1.htm">代码</a><a class="tag" taget="_blank" href="/search/%E9%85%8D%E7%BD%AE/1.htm">配置</a><a class="tag" taget="_blank" href="/search/spring4/1.htm">spring4</a><a class="tag" taget="_blank" href="/search/quartz2.x/1.htm">quartz2.x</a><a class="tag" taget="_blank" href="/search/%E5%AE%9A%E6%97%B6%E4%BB%BB%E5%8A%A1/1.htm">定时任务</a> <div>前言:这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多,所以,只好自己去查阅底层API……   quartz定时任务必须搞清楚几个概念: JobDetail——处理类 Trigger——触发器,指定触发时间,必须要有JobDetail属性,即触发对象 Scheduler——调度器,组织处理类和触发器,配置方式一般只需指定触发</div> </li> <li><a href="/article/3643.htm" title="Hibernate入门" target="_blank">Hibernate入门</a> <span class="text-muted">tntxia</span> <a class="tag" taget="_blank" href="/search/Hibernate/1.htm">Hibernate</a> <div>  前言   使用面向对象的语言和关系型的数据库,开发起来很繁琐,费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM(Object/Relational Mapping)解决方案。   Hibernte不仅关心把Java对象对应到数据库的表中,而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。   如</div> </li> <li><a href="/article/3770.htm" title="Math类" target="_blank">Math类</a> <span class="text-muted">xiaoxing598</span> <a class="tag" taget="_blank" href="/search/Math/1.htm">Math</a> <div>一、Java中的数字(Math)类是final类,不可继承。 1、常数 PI:double圆周率 E:double自然对数 2、截取(注意方法的返回类型) double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round</div> </li> </ul> </div> </div> </div> <div> <div class="container"> <div class="indexes"> <strong>按字母分类:</strong> <a href="/tags/A/1.htm" target="_blank">A</a><a href="/tags/B/1.htm" target="_blank">B</a><a href="/tags/C/1.htm" target="_blank">C</a><a href="/tags/D/1.htm" target="_blank">D</a><a href="/tags/E/1.htm" target="_blank">E</a><a href="/tags/F/1.htm" target="_blank">F</a><a href="/tags/G/1.htm" target="_blank">G</a><a href="/tags/H/1.htm" target="_blank">H</a><a href="/tags/I/1.htm" target="_blank">I</a><a href="/tags/J/1.htm" target="_blank">J</a><a href="/tags/K/1.htm" target="_blank">K</a><a href="/tags/L/1.htm" target="_blank">L</a><a href="/tags/M/1.htm" target="_blank">M</a><a href="/tags/N/1.htm" target="_blank">N</a><a href="/tags/O/1.htm" target="_blank">O</a><a href="/tags/P/1.htm" target="_blank">P</a><a href="/tags/Q/1.htm" target="_blank">Q</a><a href="/tags/R/1.htm" target="_blank">R</a><a href="/tags/S/1.htm" target="_blank">S</a><a href="/tags/T/1.htm" target="_blank">T</a><a href="/tags/U/1.htm" target="_blank">U</a><a href="/tags/V/1.htm" target="_blank">V</a><a href="/tags/W/1.htm" target="_blank">W</a><a href="/tags/X/1.htm" target="_blank">X</a><a href="/tags/Y/1.htm" target="_blank">Y</a><a href="/tags/Z/1.htm" target="_blank">Z</a><a href="/tags/0/1.htm" target="_blank">其他</a> </div> </div> </div> <footer id="footer" class="mb30 mt30"> <div class="container"> <div class="footBglm"> <a target="_blank" href="/">首页</a> - <a target="_blank" href="/custom/about.htm">关于我们</a> - <a target="_blank" href="/search/Java/1.htm">站内搜索</a> - <a target="_blank" href="/sitemap.txt">Sitemap</a> - <a target="_blank" href="/custom/delete.htm">侵权投诉</a> </div> <div class="copyright">版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved. <!-- <a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank">京ICP备09083238号</a><br>--> </div> </div> </footer> <!-- 代码高亮 --> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shCore.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shLegacy.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shAutoloader.js"></script> <link type="text/css" rel="stylesheet" href="/static/syntaxhighlighter/styles/shCoreDefault.css"/> <script type="text/javascript" src="/static/syntaxhighlighter/src/my_start_1.js"></script> </body> </html><script data-cfasync="false" src="/cdn-cgi/scripts/5c5dd728/cloudflare-static/email-decode.min.js"></script>