weixin_39870150

fluent python epub_《Fluent Python》杂记

Python is a language for consenting adults. —Alan Runyan

1.Python 数据模型

Python data model 可以看下 python 文档关于 data model 的讨论

2. 序列构成的数组

容器序列(存放引用)：list、tuple、collections.deque 扁平序列(存放值)：str、bytes、bytearray、memoryview、array.array

python2.7 列表推导有变量泄露问题，所以推导的临时变量不要和外部重名

t = (1, 2, [1,2])

t[2] += [1,2] # t 变成 (1, 2, [1,2,1,2]) 同时抛出异常，用dis模块查看

# t[2].extend([1,2]) 没问题

尽量不要把可变类型放在 tuple 里;增量赋值不是原子的； += *= 对于可变和不可变对象区分对待，不可变对象会生成新对象(str除外,cpython优化过)

python 使用的排序算法 Timsort 是稳定的内存视图：memoryview:让用户在不复制内容的情况下操作同一个数组的不同切片。

collections.deque 线程安全

3 字典和集合

可散列：如果一个对象是可散列的，在这个对象的生命周期中，它的散列值是不变的。而且需要实现__hash__,__eq__

class StrKeyDict0(dict):

"""如果一个类继承了dict，然后这个集成类提供了__missing__方法，

那么__getitem__找不到键的时候，会自动调用它，而不是抛出Keyerror

"""

def __missing__(self, key):

if isinstance(key, str): # 如果 str 的 key 还找不到就抛出 KeyError，没有这句会无限递归

raise KeyError(key)

return self[str(key)]

def get(self, key, default):

try:

return self[key]

except KeyError: # 说明 __missing__ 也失败了

return default

def __contains__(self, key):

"""这个方法也是必须的，因为继承来的 __contains__ 没有找到也会去掉用__missing__"""

return key in self.keys() or str(key) in self.keys()

dict 变种：collections.OrderedDict: 保持 key 的顺序

collections.ChainMap: 容纳多个不同的映射对象

collections.Counter: 计数器

collections.UserDict : 其实就是把标准 dict 用纯 python 实习一遍

import UserDict

class StrKeyDict(UserDict):

def __missing__(self, key):

if isinstance(key, str): # 如果 str 的 key 还找不到就抛出 KeyError，没有这句会无限递归

raise KeyError(key)

return self[str(key)]

def __setitem__(self, key, item):

self.data[str(key)] = item

def __contains__(self, key):

return str(key) in self.data

不可变映射类型： types.MappingProxyType (>=python3.3)

不要在迭代字段和set 的同时修改它。可以先迭代获取需要的内容后放到一个新的dict里。 dict 实现是稀疏列表。

dict特点：元素可散列

内存开销大

键查询很快

键次序取决于添加顺序

往字典里添加新键可能会改变已有键的顺序

set特点：元素必须可散列

消耗内存

高效判断是否存在一个元素

元素次序取决于添加顺序

往字典里添加新元素可能会改变已有元素的次序

4 文本和字节序列人类使用文本，计算机使用字节序列

字符的标识(码位)，十进制数字，在unicode 中以4-6个十六进制数字表示字符的具体表示取决于使用的编码，编码是在码位和字节序列之间转换时使用的算法编码：码位-> 字节序列解码：字节序列 -> 码位

Unicode 三明治：我们可以用一个简单的原则处理编码问题：字节序列->字符串->字节序列。就是说程序中应当仅处理字符串，当需要保存到文件系统或者传输的时候，编码为字节序列

BOM：用来标记字节序

UnicodeEncodeError：字符串转成二进制序列。文本转成字节序列时，如果目标编码没有定义某个字符就会抛异常

UnicodeDecodeError: 二进制转成字符串。遇到无法转换的字节序列

chardet 检测文件编码

处理文本：在多系统中运行的代码需要指定打开和写入的编码，不要依赖默认的编码。除非想判断编码，否则不要在二进制模式中打开文本文件。

使用 unicodedata.normalize 函数对 unicode 规范化(标准等价物)。保存文本之前用 normalize('NFC', user_text) 清洗字符串

Unicode 排序：unicode collation algorith, UCA 使用 PyUCA 库。

双模式 API：根据接受的参数是字节序列或字符串自动处理。re 和 os 模块

cpython 16 位窄构建(narrow build) 32 位宽构建 (wild build) sys.maxunicode。窄构建无法处理 U+FFFF 以上码位

5 一等函数

高阶函数(higher-order function): 接受函数作为参数，或者把函数作为结果返回的函数。比如 map,filter,reduce 等(大部分可以被列表推导替代)

匿名函数：lambda 用于创建匿名函数。不过 lambda 定义体中无法赋值，也无法使用 while, try 等python 语句

可调用对象：内置的 callable() 函数判断是否可以调用

用户定义的可调用类型：任何 python 对象只要是先了 __call__ 方法都可以表现得像函数

函数内省：使用 inspect 模块提取函数的签名、参数等

python3 函数注解： def clip(text:str, max_len:'int > 0'=80) -> str: 注解会存储在函数的 __annotations__(一个dict) 属性中。注解对 python 解释器没有任何意义，只是给 IDE、框架、装饰器等工具使用。

支持函数式编程：operator 模块：常用的有 attrgetter、itemgetter、methodcaller

functools 模块：reduce、partial(基于一个函数创建一个新的可调用对象，把原函数的某些参数固定)、dispatch、wraps

6 使用一等函数实现设计模式

程序设计语言会影响人们理解问题的出发点。

本章举了两个例子说明动态语言是如何简化设计模式的。(我个人感觉举的例子不是很好吧，有点过度设计的感觉) 之前曾经总结过使用 Python 实现设计模式，感兴趣的可以参考：

7 函数装饰器和闭包

装饰器：可调用的对象，其参数是另一个函数。(说白了就是以函数作为参数的函数)两个特性：能把被装饰的函数替换为其他函数

装饰器在加载模块时立即执行，通常是在导入时(即python加载模块时)。被装饰的函数只有在明确调用时运行

装饰器语法糖:

# 等价于 target = decorate(target)

@decorate

def target():

print('hehe')

闭包:闭包指延伸了作用域的函数，其中包含函数定义体中引用、但是不在定义体中定义的非全局变量。比如被装饰的函数能访问装饰器函数中定义的变量(非全局的)

自由变量：

def make_averager():

series = []

def averager(new_value):

# series 在 averager 中叫做自由变量(free variable)，指未在本地作用域中绑定的变量

series.append(new_value)

total = sum(series)

return total / len(series)

nonlocal 声明：先来看个例子：

def make_averager():

count = 0

total = 0

def averager(new_value):

# 直接运行到这里会报错，UnboundLocalError，因为对于非可变类型，会隐式创建局部变量 count，count 不是自由变量了

count += 1

total += new_value

return total

使用 python3 引入的 nonlocal 刻意把变量标记为自由变量。

def make_averager():

count = 0

total = 0

def averager(new_value):

nonlocal count, total # python2 可以用 [count] 把需要修改的变量存储为可变对象

count += 1

total += new_value

return total

functools.wraps 装饰器：把相关属性从被装饰函数复制到装饰器函数中

标准库中的装饰器：property、classmethod、staticmehtod、functools.lru_cache、functools.singledispatch

- lru_cache: 采用 least recent used 算法实现的缓存装饰器

- singledispatch: 为函数提供重载功能。被其装饰的函数会成为泛函数(generic function):根据第一个参数的类型，用不同的方式执行相同操作的一组函数。替代多个 if/else isinstance 判断类型执行不同分之

叠放装饰器:

# 下边等价于 f = d1(d2(f))

@d1

@d2

def f():

print('f')

参数化装饰器: 创建一个装饰器工厂函数，把参数传给它，返回一个装饰器，然后再把它应用到要装饰的函数上。

registry = set() # <1>

def register(active=True): # <2> 工厂函数

def decorate(func): # <3>

print('running register(active=%s)->decorate(%s)'

% (active, func))

else:

registry.discard(func) # <5>

return func # <6>

return decorate # <7>

@register(active=False) # <8>

def f1():

print('running f1()')

@register() # <9> # 即使没有参数，工厂函数必须写成调用的形式

def f2():

print('running f2()')

使用 class 实现装饰器：看上边多重嵌套的装饰器是不是有点不太优雅，其实复杂的装饰器笔者更喜欢用 class 实现。还记得 __call__ 方法吗，改写下上边这个例子

class register(object):

registry = set()

def __init__(self, active=True):

self.active = active

def __call__(self, func):

print('running register(active=%s)->decorate(%s)'

% (self.active, func))

if self.active:

self.registry.add(func)

else:

self.registry.discard(func)

return func

8 对象引用、可变性和垃圾回收

变量：我们可以把变量理解为对象的标注(便利贴)，多个标注就是别名。变量保存的是对象的引用

比较对象：判断是同一个对象: id(obj1) == id(obj2) 或者 obj1 is obj2。比较两个对象的值用 obj1 == obj2 (obj1.eq(obj2))。你会发现一般我们用 some_obj is None 来判断一个对象是否是 None，说明 None 是个单例对象

元祖的相对不可变性：元祖的不可变指的是保存的引用不可变，与引用的对象无关。比如如果元祖的元素是个 list，我们是可以修改这个 list 的。这也会导致有些元祖无法散列

默认做浅复制：构造函数或者 [:] 方法默认是浅复制。如果元素都是不可变的，浅复制没有问题。

深拷贝: copy.deepcopy 和 copy.copy 能为任意对象做深复制和浅复制。我们可以自定义 __copy__() 和 __deepcopy__() 控制拷贝行为

函数的参数作为引用时：python 唯一支持的传参模式是共享传参(call by sharing)，指函数的各个形式参数获得实参中各个引用的副本。也就是说，函数内部的形参是实参的别名。这个方案的结果就是，函数可能会修改作为参数传入的可变对象，但是无法修改那些对象的标识(即不能把一个对象替换成另一个对象)。(笔者觉得这章解释非常好，之前网上一大堆讨论python究竟是值传递还是引用传递的都是不准确的)

不要使用可变类型作为参数的默认值：这个坑写 py 写多的人应该都碰到过。函数默认值在定义函数时计算(通常是加载模块时)，因此默认值变成了函数对象的属性。如果默认值是可变对象，而且修改了它的值，后续的函数调用就会受影响。一般我们用 None 作为占位符。

def func(l=None): # 不要写 def func(l=[]):

# 使用 None 作为占位符(pylint 默认会提示可变类型参数作为默认值，所以俺经常安利用 pylint 检测代码，防范风险)

l = None or []

所以，一般对于一个函数，要么确认是要修改可变参数，要么返回新的值(使用参数的拷贝)，请不要两者同时做。(笔者在小书 web guide 中明确提醒过)

del 和垃圾回收: del 语句删除名称，而不是对象(删除引用而不是对象)。只有对象变量保存的是对象的最后一个引用的时候，才会被回收。Cpython 中垃圾回收主要使用的是引用计数。不要轻易自定义 __del__ 方法，很难用对。

弱引用(weakref)：有时候需要引用对象，而又不让对象存在的时间超过所需时间，经常用在缓存中。弱引用不会增加对象的引用数量，不会妨碍所指的对象被当做垃圾回收WeakValueDictionary: 一种可变映射，值是对象的弱引用。还有 WeakKeyDictionary、WeakSet、finalize。

Python 对不可变类型施加的把戏(CPython 实现细节)对于元祖 t, t[:] 和 tuple(t) 不会创建副本，返回的是引用(这点和list 不同)。str, bytes 和 frozenset 也有这种行为

9 符合 Python 风格的对象

鸭子类型(duck typing): 只需按照预定行为实现对象所需的方法即可。

对象的表示形式: repr() 让开发者理解的方式返回对象的字符串表示。str() 用户理解的方式返回对象的字符串表示

classmethod 和 staticmehtod: classmethod 定义操作类而不是操作实例的方法，第一个参数是类本身，最常见的用途是定义定义备选构造方法(返回 cls(*))。staticmehtod 方法就是普通函数，只是碰巧在类的定义体中。

Python的私有属性和『受保护』属性：python没有 private修饰符，可以通过双下划线 __attr 的形式定义，python 的子类会在存储属性名的时候在前面加上一个下划线和类名。这个语言特性成为名称改写(name mangling)。通常受保护的属性使用一个下划线作为前缀，算是一种命名约定，调用者不应该在类外部访问这种属性。

python 没有访问控制和 java 设计迥然不同，本章最后的杂谈讨论了这两种设计。在 python 中，我们可以先使用公开属性，等需要时再变成特性。

使用__slots__类属性节省空间：默认情况下，python在各个中名为__dict__的字典存储实力属性，当生成大量对象时字典会消耗大量内存(底层是稀疏数组)，通过__slots__类属性，让解释器在元祖而不是字典中存储实例属性，能大大节省内存。(不支持继承)每个子类都需要定义 __slots__，解释器会忽略继承的 __slots__属性

实例只能拥有 __slots__ 属性，除非把 __dict__ 也加到 __slots__ 里(这样就失去了节省内存的功效)

覆盖类属性：python有个独特的特性，类属性可以为实例属性提供默认值

10 序列的修改、散列和切片

协议和鸭子类型: python中我们刻意创建序列类型而无需使用继承，只需实现符合序列协议的方法。

鸭子类型：在面向对象编程中，协议是非正式的接口，只在文档中定义，在代码中不定义。例如 python 序列协议只需要实现 __lens__ 和 __getitem__ 两个方法。只关心行为而不关心类型。

我们可以模仿 python 对象的内置方法来编写符合 python 风格的类。(具体的大家还是看下书中的代码示例吧，这一章举得例子不错)

11 接口：从协议到抽象基类

使用猴子补丁在运行时实现协议：

运行时修改类或者模块，而不改动源码。可以在运行时让类实现协议

抽象基类：collections.abc 模块Iterable，Container 和 Sized:：Iterable 通过 __iter__ 支持迭代，Container 通过 __contains__支持 in 操作符, Sized 通过 __len__ 支持 len() 函数

Sequence， Mapping and Set ：不可变集合类型

MappingView: 映射方法 .items()，.kesy()，.values() 返回的对象分别是 ItemsView,KeysView 和 ValuesView 实例

Callable 和 Hashable: 主要作用市委内置 isinstance 提供支持，以丠��种安全的方式判断对象能不能调用或散列。python 提供了callable 内置函数却没有提供 hashable() ，用 isinstance(obj, Hashable) 判断

Iterator

numbers包：Number, Complex，Real，Rational，Integral

定义并使用抽象基类

import abc

class Base(abc.ABC): # py3， py2 中使用 __metaclass__ = abc.ABCMeta

@abc.abstractmethod # 该装饰器应该放在最里层

def some_method(self): # 这里可以只有 docstring 省略函数体

"""抽象方法，在抽象基类出现之前抽象方法用 Raise NotImplementedError 语句表明由子类实现"""

使用 register 方法注册虚拟子类:

在抽象基类上调用 register 方法注册其虚拟子类，issubclass 和 isinstance 都能识别，但是注册的的类不会从抽象基类中继承任何方法和属性。查看虚拟子类的 __mro__ 会发现抽象基类不在其中(没继承其属性和方法)

__subclasshook__ : 即使不注册，抽象基类也能把一个类识别为虚拟子类。定义 __subclasshook__ 方法动态识别子类。参考 abc.Sized 源码

强类型和弱类型：

如果一门语言很少隐式转换类型，说明它是强类型语言(java/c++/python)。如果经常这么做，是弱类型语言(php,javascript,perl)。强类型能及早发现缺陷

静态和动态类型：

在编译时期检查类型的语言是静态语言，运行时检查类型的语言是动态语言。静态类型需要类型声明(有些现代语言使用类型推导避免部分类型声明)。静态类型便于编译器和 IDE 及早分析代码、找出错误和提供其他服务(优化、重构等)。动态类型便于代码重用，代码行数更少，而且能让接口自然成为协议而不提早实行。

12 继承的优缺点

子类化内置类型：

内置类型的方法不会调用子类覆盖的方法。不要子类化C语言实现的内置类型(list,dict等)，用户自定义的类应该继承自 collections 模块。collections.UserDict, UserList and UserString

多重继承和方法解析顺序

任何支持多重继承的语言都要处理潜在的明明冲突问题，菱形继承问题。python 会按照方法解析顺序MRO(method resolution order) 遍历继承图。类都有一个 __mro__ 属性，它的值是一个tuple，按照顺序列出各个超类，直到 object 类。MRO 根据 C3 算法计算

处理多重继承

多重继承增加了可选方案和复杂度把接口继承和实现继承区分开。明确一开始为什么创建子类。1.继承接口，创建子类型，实现『是什么』关系。2.继承实现，重用代码。通过继承重用代码是实现细节，通常可换成组合和委托。接口继承是框架的支柱

使用抽象基类显示表示接口

通过 mixin 重用代码。mixin 不定义新类型, 只是打包方法，便于重用。mixin 类绝对不能实例化，应该提供某方面的特定行为，只是实现少量关系非常紧密的方法

明确指名 mixin。类应该以 mixin 后缀

抽象基类可以作为 mixin，但是反过来不成立

不要子类化多个具体类。具体类的超类中除了一个具体类，其他都应该是抽象基类或者 mixin

class MyConcreteClass(Alpha, Beta, Gamma):

""" 如果 Alpha 是具体类，Beta 和 Gamma 必须是抽象基类或者 mixin"""

pass创建聚合类。django 中的 ListView，tinker中的 Widget

class Widget(BaseWidget, Pack, Place, Grid):

pass优先使用组合而非继承。子类化是一种紧耦合，不要过度使用

13 正确重载运算符

python 不允许用户随意创建运算符，禁止重载内置类型的运算符。python支持运算符重载是其在科学计算领域使用广泛的原因。一元运算符：始终返回一个新对象。

NotImplemented 是个特殊的单例值，如果中缀运算符特殊方法不能处理给定的操作数，要把它返回给解释器。NotImplementedError 是一种异常，抽象类中的方法把它 raise 出，提醒子类必须覆盖。

def __add__(self, other):

try:

pairs = itertools.zip_longest(self, other, fillvalue=0.0)

return Vector(a + b for a, b in pairs)

except TypeError:

# 返回 NotImplemented 解释器会尝试调用反向运算符方法 __radd__

return NotImplemented

def __radd__(self, other):

return self + other增量赋值运算符不会修改不可变目标，而是新建实例，然后重新绑定。

14 可迭代对象、迭代器和生成器

解释器需要迭代对象 x 时，会自动调用 iter(x)。内置的 iter 有以下作用：检查对象是否实现了 __iter__ ，如果实现了就调用它获取一个迭代器

如果没有实现 __iter__ 方法，但是实现了 __getitem__ 方法，python 会创建一个迭代器，尝试按照顺序(从索引0)获取元素

如果尝试失败，抛出 TypeError 异常

可迭代对象:

如果对象实现了能返回迭代器的 __iter__ 方法，就是可迭代的。序列都可以迭代；实现了__getitem__ 方法，而且其参数是从 0 开始的索引，这种对象也可以迭代。

标准迭代器接口有两个方法：__next__: 返回下一个可用的元素，没有元素抛出 StopIteration

__iter__: 返回 self，以便在应该使用可迭代对象的地方使用迭代器，例如 for 循环中

检查对象是否是迭代器的最好方法是调用 isinstance(x, abc.Iterator)

迭代器:

实现了无参数的 __next__ 方法，返回序列中下一个元素；如果没有元素了，抛出 StopIteration 异常。python中的迭代器还实现了 __iter__ 方法，因此迭代器也可以迭代。

二者区别：

迭代器可以迭代，但是可迭代的对象不是迭代器。可迭代的对象一定不能是自身的迭代器。也就是说，可迭代对象必须实现 __iter__ ，但是不能实现 __next__

生成器函数

只要 python 的函数体中有 yield 关键字，该函数就是生成器函数。调用生成器函数会返回一个生成器对象。生成器函数是生成器工厂

标准库的中生成器函数用于过滤的生成器函数: itertools.takewhile/compress/dropwhile/filter/filterfalse/islice/

用于映射的生成器函数: 内置的 enumerate/map itertools.accumulate/starmap

用于合并的生成器函数：itertools.chain/from_iterable/product/zip_longest 内置的 zip

从一个元素产生多个值，扩展输入的可迭代对象: itertools.combinations/combinations_with_replacement/count/cycle/permutations/repeat

产出输入可迭代对象的全部元素，以某种方式排列：itertools.groupby/tee 内置的 reversed

可迭代的规约函数

归约函数：接受一个可迭代的对象，返回单个结果。all/any/max/mini/functools.reduce/sum all/any 有短路特性

把生成器当协程

.send() 方法致使生成器前进到下一个 yield 语句，还允许使用生成器的客户把数据发给自己，不管传给 send 方法什么参数，那个参数都会成为生成器函数定义体中对应的 yield 表达式的值。

15 上下文管理器和 else 块

EAFP vs LBYLEAFP: easier to ask for forgiveness than permission

LBYL: look before you leap

上下文管理器和 with 块

with 语句用来简化 try/finally 模式。经常用在管理事务，维护锁、条件和信号，给对象打补丁等。

class LookingGlass:

def __enter__(self): # <1>

import sys

self.original_write = sys.stdout.write # <2>

sys.stdout.write = self.reverse_write # <3>

return 'JABBERWOCKY' # <4>

def reverse_write(self, text): # <5>

self.original_write(text[::-1])

def __exit__(self, exc_type, exc_value, traceback): # <6>

import sys # <7>

sys.stdout.write = self.original_write # <8>

if exc_type is ZeroDivisionError: # <9>

print('Please DO NOT divide by zero!')

return True # <10>

contextlib 模块中的实用工具

@contextmanager 装饰器能减少创建上下文管理器的样板代码。只需要实现一个 yield 语句的生成器，生成想让 __enter__ 方法返回的值。

@contextlib.contextmanager

def looking_glass():

import sys

original_write = sys.stdout.write

def reverse_write(text):

original_write(text[::-1])

sys.stdout.write = reverse_write

msg = '' # <1>

try:

yield 'JABBERWOCKY' # 产出一个值，这个值会绑定到with语句中的 as 子句的目标变量上

except ZeroDivisionError: # <2>

msg = 'Please DO NOT divide by zero!'

finally:

sys.stdout.write = original_write # <3>

if msg:

print(msg) # <4>

16 协程

句法上看，协程和生成器类似，都是定义体中包含 yield 关键字的函数。但在协程中，yield 通常出现在表达式右边(datum = yield)，可以产出值，也可以不产出。如果yield 关键字后边没有表达式，那么生成器产出 None。调用方可以用 send 方法把数据提供给协程。从根本上把 yield 视作控制流程的方式。

生成器如何进化成协程

python2.5 之后yield 关键在能在表达式中使用，而且生成器 api 中增加了 .send(value) 方法。生成器的调用方可以用 send 发送数据，发送的数据会成为生成器函数中 yield 表达式的值。因此生成器能当做协程使用。协程是指一个过程，这个过程与调用方协作，产出由调用方提供的值。

协程使用 next 函数预激(prime)，即让协程向前执行到第一个 yield 表达式。

预激(prime)协程的装饰器

启动协程之前需要 prime，方法是调用 send(None) 或者 next() 。为了简化协程的语法，有时候会使用一个预激装饰器。比如 tornado.gen 装饰器。yield from 调用协程会自动预激

from functools import wraps

def coroutine(func):

"""向前执行到第一个 yield 表达式，预激 func """

@wraps(func)

def primer(*args, **kwargs):

gen = func(*args, **kwargs) # 获取生成器对象

next(gen) # prime

return gen

return primer

终止协程和异常处理

协程中未处理的异常会向上冒泡generator.throw(exc_type)

generator.close()

让协程返回值

协程中 return 表达式的值会偷偷传给调用方，赋值给 StopIteration 异常的一个属性 value

try:

coro.send(None)

except StopIteration as exc:

result = exc.value

yield from(python3)

RESULT = yield from EXPR 等效代码如下，虽然比较复杂，但是能帮助我们理解 yield from 如何工作

_i = iter(EXPR) # EXPR 是任何可迭代对象

try:

_y = next(_i) # 预激(prime) 子生成器

except StopIteration as _e:

_r = _e.value # 如果抛出 StopIteration 获取 value 属性(返回值)

else:

while 1: # 运行这个循环时，委派生成器会阻塞，只作为调用方和子生成器之间的通道

try:

_s = yield _y # 产出字生成器当前产出元素；等待调用方发送 _s 中保存的值

except GeneratorExit as _e: # 用于关闭委派生成器和子生成器

try:

_m = _i.close

except AttributeError: # 子生成器是任何可迭代对象，所以可能没有 close 方法

pass

else:

_m()

raise _e

except BaseException as _e: # 处理调用方通过 throw 方法传入的异常

_x = sys.exc_info()

try:

_m = _i.throw

except AttributeError: # 子生成器是任何可迭代对象，所以可能没有 throw 方法

raise _e

else: # 如果子生成器有 throw 方法，调用它并传入调用方发来的异常

try:

_y = _m(*_x)

except StopIteration as _e:

_r = _e.value

break

else: # 如果产出值时没有异常

try: 尝试让子生成器向前执行

if _s is None: # <11>

_y = next(_i)

else:

_y = _i.send(_s)

except StopIteration as _e: # <12>

_r = _e.value

break

RESULT = _r # 返回的值是 _r，即整个 yield from 表达式的值

17 使用 concurrent.futures 处理并发

python3.2 后引入了 concurrent.futers 模块用来处理并发。该模块引入了 TreadPoolExecutor 和 ProcessPoolExecutor 类，这两个类实现的接口能分别在不同的线程和进程中执行可调用的对象。

from concurrent import futures

from flags import save_flag, get_flag, show, main # <1>

MAX_WORKERS = 20 # <2>

def download_one(cc): # <3>

image = get_flag(cc)

show(cc)

save_flag(image, cc.lower() + '.gif')

return cc

def download_many(cc_list):

workers = min(MAX_WORKERS, len(cc_list)) # <4>

with futures.ThreadPoolExecutor(workers) as executor: # <5>

res = executor.map(download_one, sorted(cc_list)) # <6>

return len(list(res)) # <7>

if __name__ == '__main__':

main(download_many) # <8>

Future(期物)(中文版翻译感觉这个名字怪怪的)

concurrent.futures.Future: Feature 类的实例都表示可能已经完成或者尚未完成的延迟计算，可以调用它的 result() 方法获取结果

def download_many(cc_list):

cc_list = cc_list[:5] # <1>

with futures.ThreadPoolExecutor(max_workers=3) as executor: # <2>

to_do = []

for cc in sorted(cc_list): # <3>

future = executor.submit(download_one, cc) # <4>

to_do.append(future) # <5>

msg = 'Scheduled for {}: {}'

print(msg.format(cc, future)) # <6>

results = []

for future in futures.as_completed(to_do): # <7>

res = future.result() # <8>

msg = '{} result: {!r}'

print(msg.format(future, res)) # <9>

results.append(res)

return len(results)

阻塞型 IO 和 GIL

GIL 一次只允许一个线程执行 python 字节码。但是标准库中所有执行阻塞型 I/O 操作的函数，在等待操作系统返回的结果时都会释放 GIL，这意味着python 在这个层次上能使用多线程，一个 python 线程等待网络请求时，阻塞型 I/O 会释放(sleep 函数也会) GIL，运行另一个线程。因此尽管有 GIL，python 线程还是能在 IO 密集型应用中发挥作用。

concurrent.futures.ProcessPoolExecutor 绕开 GIL

18 使用 asyncio 处理并发

asyncio 使用事件循环驱动的协程实现并发

import asyncio

import aiohttp # <1>

from flags import BASE_URL, save_flag, show, main # <2>

@asyncio.coroutine # <3>

def get_flag(cc):

url = '{}/{cc}/{cc}.gif'.format(BASE_URL, cc=cc.lower())

resp = yield from aiohttp.request('GET', url) # <4>

image = yield from resp.read() # <5>

return image

@asyncio.coroutine

def download_one(cc): # <6>

image = yield from get_flag(cc) # <7>

show(cc)

save_flag(image, cc.lower() + '.gif')

return cc

def download_many(cc_list):

loop = asyncio.get_event_loop() # <8>

to_do = [download_one(cc) for cc in sorted(cc_list)] # <9>

wait_coro = asyncio.wait(to_do) # <10>

res, _ = loop.run_until_complete(wait_coro) # <11>

loop.close() # <12>

return len(res)

if __name__ == '__main__':

main(download_many)

避免阻塞型调用

两种方式避免阻塞型调用中止整个应用程序的进程：在单独的线程中运行各个阻塞型操作

把每个阻塞型调用操作转成非阻塞的异步调用

在 asyncio 中使用 Executor 对象，防止阻塞事件循环

python 访问本地文件系统会阻塞，硬盘IO 阻塞会浪费几百万个 cpu 周期。解决方法是使用时间循环对象的 run_in_executor 方法。

@asyncio.coroutine

def download_one(cc, base_url, semaphore, verbose):

try:

with (yield from semaphore):

image = yield from get_flag(base_url, cc)

except web.HTTPNotFound:

status = HTTPStatus.not_found

msg = 'not found'

except Exception as exc:

raise FetchError(cc) from exc

else:

loop = asyncio.get_event_loop() # 获取事件循环对象的引用

loop.run_in_executor(None, # None 使用默认的 TrreadPoolExecutor 实例

save_flag, image, cc.lower() + '.gif') # 传入可调用对象

status = HTTPStatus.ok

msg = 'OK'

if verbose and msg:

print(cc, msg)

return Result(status, cc)

asyncio 的事件循环背后维护一个 ThreadPoolExecutor 对象，我们可以调用 run_in_executor 方法，把可调用的对象发给它执行。

从回调到 Futures 和协程

回调地狱：如果一个操作需要依赖之前操作的结果，那就得嵌套回调。

python 中的回调地狱：

def stage1(response1):

request2 = step1(response1)

api_call2(request2, stage2)

def stage2(response2):

request3 = step2(response2)

api_call3(request3, stage3)

def stage3(response3):

step3(response3)

api_call1(request1, step1)

使用协程和 yield from 结构做异步编程，无需用回调

@asyncio.coroutine

def three_stages(request1):

response1 = yield from api_call1()

request2 = step1(response1)

response2 = yield from api_call2(request2)

request3 = step2(response2)

response3 = yield from api_call3(request3)

step3(response3)

# 协程不能直接调用，必须用事件循环显示指定协程的执行时间，或者在其他排定了执行时间的协程中使用 yield from 表达式把它激活

loop.create_task(three_stages(request1))

何时使用 yield from：基本原则很简单，yield from 只能用于协程和 asyncio.Future 实例(包括 Task 实例)。有些肆意混淆了协程和普通函数的 api 比较棘手。

驱动协程：只有驱动协程，协程才能做事，而驱动 asyncio.coroutine 装饰的协程有两种方法，要么使用 yield from，要么传给 asyncio 包中某个参数为协程或者 Futures 的函数，例如 run_until_complete

使用 asyncio 包编写服务器

可以使用 asyncio 编写 tcp/udp 服务器，使用 aiohttp 编写 web 服务器。具体看各自的文档吧。

19 动态属性(attribute)和特性(property)

python 中，数据的属性和处理数据的方法统称为属性(attribute)，方法是可调用的属性。特性(property)是不改变类接口的前提下，使用存取方法(读值和设值)修改数据属性。

统一访问原则：不管服务是由存取还是计算实现的，一个模块提供的所有服务都应该统一的方式使用。

使用动态属性转换数据

使用动态属性访问数据

from collections import abc

class FrozenJSON:

"""A read-only façade for navigating a JSON-like object

using attribute notation

"""

def __init__(self, mapping):

self.__data = dict(mapping) # <1>

def __getattr__(self, name): # <2>

if hasattr(self.__data, name):

return getattr(self.__data, name) # <3>

else:

return FrozenJSON.build(self.__data[name]) # <4>

@classmethod

def build(cls, obj): # <5>

if isinstance(obj, abc.Mapping): # <6>

return cls(obj)

elif isinstance(obj, abc.MutableSequence): # <7>

return [cls.build(item) for item in obj]

else: # <8>

return obj

处理无效属性名

def __init__(self, mapping):

self.__data = {}

for key, value in mapping.items():

if keyword.iskeyword(key): # <1>

key += '_' # 和 python 重名的关键字加上下划线

self.__data[key] = value

使用 __new__ 以灵活的方式创建对象

实际上用来构建对象的方法是 __new__，__init__ 是初始化方法。__new__ 必须返回一个实例，作为 __init__ 方法的第一个参数。

def __new__(cls, arg): # <1>

if isinstance(arg, abc.Mapping):

return super().__new__(cls) # <2>

elif isinstance(arg, abc.MutableSequence): # <3>

return [cls(item) for item in arg]

else:

return arg

使用特性验证属性

class LineItem:

def __init__(self, description, weight, price):

self.description = description

self.weight = weight # <1>

self.price = price

def subtotal(self):

return self.weight * self.price

@property # <2>

def weight(self): # <3>

return self.__weight # <4>

@weight.setter # <5>

def weight(self, value):

if value > 0:

self.__weight = value # <6>

else:

raise ValueError('value must be > 0') # <7>

解析 property

property 签名

class property(fget=None, fset=None, fdel=None, doc=None)特性会覆盖实例属性。特性都是【类属性】，但是特性管理的其实是实例属性的存取。obj.attr 这样的表达式不会从 obj 开始寻找 attr，而是从 obj.__class__ 开始，且仅当类中没有 attr 的属性时， python 才会在 obj 实例中寻找。

定义一个特性工厂函数

def quantity(storage_name): # <1>

def qty_getter(instance): # <2>

return instance.__dict__[storage_name] # <3>

def qty_setter(instance, value): # <4>

if value > 0:

instance.__dict__[storage_name] = value # <5>

else:

raise ValueError('value must be > 0')

return property(qty_getter, qty_setter) # <6>

class LineItem:

weight = quantity('weight') # <1>

price = quantity('price') # <2>

def __init__(self, description, weight, price):

self.description = description

self.weight = weight # <3>

self.price = price

def subtotal(self):

return self.weight * self.price # <4>

处理属性删除操作

class BlackKnight:

def __init__(self):

self.members = ['an arm', 'another arm',

'a leg', 'another leg']

self.phrases = ["'Tis but a scratch.",

"It's just a flesh wound.",

"I'm invincible!",

"All right, we'll call it a draw."]

@property

def member(self):

print('next member is:')

return self.members[0]

@member.deleter

def member(self):

text = 'BLACK KNIGHT (loses {})\n-- {}'

print(text.format(self.members.pop(0), self.phrases.pop(0)))

处理属性的重要属性和函数

影响属性处理方式的特殊属性__class__: 对象所属类的引用。 obj.__class__ 与 type(obj) 作用相同。python的某些特殊方法比如 __getattr__，只在对象的类中寻找，而不在实例中寻找

__dict__: 存储对象或者类的可写属性。

__slots__: 字符串tuple，限制允许有的属性。

处理属性的内置函数dir: 列出对象的大多数属性

getattr: 从 obj 对象中获取对应��称的属性。获取的属性可能来自对象所属的类或者超类。

hasattr: 判断对象中存在指定的属性

setattr: 创建新属性或者覆盖现有属性

vars：返回对象的 __dict__ 属性

处理属性的特殊方法__delatttr__(self, name) 使用 del 删除属性就会调用这个方法

__dir__(self): 把对象传给 dir 函数时候调用

__getattr__: 仅当获取指定的属性失败，搜索过 obj、Class、和超类之后调用

__getattribute__: 尝试获取指定的属性时总会调用这个方法，寻找的属性是特殊属性或者特殊方法时候除外。为了防止获取 obj 的属性无限递归， __getattribute__ 方法的实现要使用super().__getattribute__(obj, name)

__setattr__: 尝试设置指定的属性总会调用20 属性描述符

描述符是对多个属性运用相同存储逻辑的一种方式。例如 orm 中的字段类型是描述符。描述符是实现了特定协议的类，这个协议包括 __get__ __set__ __delete__ 方法。描述符的用法是创建一个实例，作为另一个类的类属性。

class Quantity: # <1>

def __init__(self, storage_name):

self.storage_name = storage_name # <2>

def __set__(self, instance, value): # <3>

if value > 0:

instance.__dict__[self.storage_name] = value # <4>

else:

raise ValueError('value must be > 0')

class LineItem:

weight = Quantity('weight') # <5>

price = Quantity('price') # <6>

def __init__(self, description, weight, price): # <7>

self.description = description

self.weight = weight

self.price = price

def subtotal(self):

return self.weight * self.price

覆盖型描述符：实现 __set__ 方法的描述符属于覆盖型描述符。非覆盖型描述符：没有实现 __set__方法的描述符。

方法是描述符

描述符用法建议：使用 property 以保持简单: 内置的 property 实现的其实是覆盖型描述符

只读描述符必须有 __set__ 方法: 如果使用描述符类实现只读属性， __get__ __set__ 两个方法必须定义，否则实例的同名属性会遮盖描述符。只读属性的 __set__ 只需抛出 AttributeError 异常，并提供合适的错误消息

用于验证的描述符可以只有 __set__

只有 __get__ 方法的描述符可以实现高效缓存

非特殊的方法可以被实例属性覆盖

21 类元编程

元编程是指在运行时创建或者定制类的技术。除非开发框架，否则不要编写元类类装饰器能以较为简单的的方式做到需要使用元类去做的事情-创建时定制类。缺点是无法继承

导入时和运行时比较

python 中的 import 不只是声明，进程首次导入模块时，还会运行所导入模块中的全部顶层代码。导入时，解释器会执行执行每个类的定义体. (原书有段代码示例非常好地解释了导入的问题)

元类基础

感觉这一章写得不如笔者之前写的一篇博客《简单的python元类》好理解。

class EntityMeta(type):

"""Metaclass for business entities with validated fields"""

def __init__(cls, name, bases, attr_dict):

super().__init__(name, bases, attr_dict) # <1>

for key, attr in attr_dict.items(): # <2>

if isinstance(attr, Validated):

type_name = type(attr).__name__

attr.storage_name = '_{}#{}'.format(type_name, key)

class Entity(metaclass=EntityMeta): # <3>

"""Business entity with validated fields"""

元类的特殊方法 __prepare__

某些应用中可能想知道属性定义的顺序，解决办法是使用 python3 引入的 __prepare__ 。这个特殊方法只在元类中有用，而且必须是类方法。解释器调用元类的 __new__ 之前会先调用 __prepare__，使用类定义体中的属性创建映射。元类构建新类时， __prepare__ 方法返回的映射会传给 __new__ 的最后一个参数，然后再传给 __init__ 方法。

class EntityMeta(type):

"""Metaclass for business entities with validated fields"""

@classmethod

def __prepare__(cls, name, bases): # py3, must be a class method

return collections.OrderedDict() # <1> return empty OrderedDict, where the class attritubes will be stored

def __init__(cls, name, bases, attr_dict):

super().__init__(name, bases, attr_dict)

cls._field_names = [] # <2>

for key, attr in attr_dict.items(): # <3> # in order

if isinstance(attr, Validated):

type_name = type(attr).__name__

attr.storage_name = '_{}#{}'.format(type_name, key)

cls._field_names.append(key) # <4>

class Entity(metaclass=EntityMeta):

"""Business entity with validated fields"""

@classmethod

def field_names(cls): # <5>

for name in cls._field_names:

yield name

元类使用场景验证属性

一次把装饰器依附到多个方法上

序列化对象或者转换数据

对象关系映射(ORM框架)

基于对象的持久存储

动态转换使用其他语言编写的类结构

类作为对象cls.__bases__: 类的基类组成的元祖

cls.__qualname__: py3 引入，值是类或函数的限定名称，即从模块的全局作用域到类的点分路径

cls.__subclasses__()：返回一个list，包含类的直接子类。其实现使用弱引用，防止超类和子类之间出现循环引用。这个方法返回的列表是内存里现存的子类。

cls.mro(): 构建类时，如果需要获取存储在类属性 __mro__ 中的超类元组，解释器会调用这个方法。元类可以覆盖这个方法。

你可能感兴趣的:(fluent,python,epub)

Python基础-day8：迭代器和生成器的区别及其各自实现方式和使用场景
1.迭代器迭代器提供了一种惰性（lazyevaluation）获取数据的方法，使得我们能够逐步访问序列中的元素，而无需一次性加载所有数据。其主要优点包括节省内存、提高性能、支持自定义遍历逻辑等。1.1实现协议__iter__()：返回自身。__next__()：返回下一个元素；如果没有更多元素，则抛出StopIteration异常。注意：可迭代对象（Iterable）与迭代器不同：可迭代对象实现_
【day1】Python基础知识-pycharm版 m0_56051615 pycharm python ide
内容：IDLE介绍使用、建立python源文件、python程序格式（缩进和注释）、海龟绘图、对象的组成、栈内存和堆内存、标识符、变量安装PyCharm和AnacondaAnaconda是可以便捷获取包且对包能够进行管理，同时对环境可以统一管理的发行版本。包含了conda、Python在内的超过180个科学包及其依赖项。其包含的科学包包括：numpy,pandas,ipythonnotebook等
嵌入式学习-PyTorch（3）-day20 LGGGGGQ 学习 pytorch 人工智能
transforms结构及用法transforms.yp是一个工具箱就是将一个特定格式的图片经过这个工具的到想要的变换Tensor数据类型一、transforms的使用（Python）fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransformswriter=Summar
Python初识-day3：复合类型里的序列类型、映射类型和集合类型梌 python 开发语言
目录1.复合类型初识1.1列表类型（list）1.1.1列表的创建1.1.2列表的运算1.1.3列表的访问1.1.4列表的具体示例1.1.5列表的常见API1.2元组类型（tuple）1.2.1元组的创建1.2.2元组的运算1.2.3元组不可变1.2.4元组的具体示例1.2.5元组的常见API1.3字典类型（dict）1.3.1字典的创建1.3.2字典的运算1.3.3字典的访问1.3.4字典的特性
Django数据库迁移番茄码 django 数据库 django oracle
在Django中进行数据库迁移的命令是`pythonmanage.pymigrate`。下面是一些常用的数据库迁移命令及其用途：1.`pythonmanage.pymakemigrations`：生成数据库迁移文件。当你修改了模型（Model）或创建了新的模型时，需要运行该命令来生成一个包含最新更改的迁移文件。2.`pythonmanage.pymigrate`：应用数据库迁移。运行该命令会将生成
Django基础(一)———创建与启动【本人】 PythonWeb django python 后端
前言从这篇文章开始，我将给大家介绍Python中的一个框架Django我将从基础开始一步一步带领大家深入了解Django框架并完成实战案例一、Django是什么？Django是一个免费、开源、高级的PythonWeb框架。它的核心目标是使开发复杂的、数据库驱动的网站变得快速、简单和安全。Django遵循“Don'tRepeatYourself”的设计哲学，强调代码复用和组件化。它奉行“包含电池”的
套数据分析模板（含 Python 代码和示例数据）女码农的重启开发语言数据清洗 python java 数据分析
一、销售数据分析模板（1-10套）模板1：月度销售趋势分析示例数据（sales_monthly.csv）月份,销售额,销量,客单价2023-01,120000,500,2402023-02,135000,550,245.452023-03,150000,600,250...Python代码importpandasaspdimportmatplotlib.pyplotasplt#设置中文显示plt.
Python面向对象编程：类、对象与实例方法的深度解析女码农的重启 python 开发语言
在软件开发领域，面向对象编程（Object-OrientedProgramming，简称OOP）是一种极为重要的编程范式。它以对象为核心，通过封装、继承和多态等特性，让代码的组织和管理更加高效、灵活。Python作为一门高级编程语言，对面向对象编程提供了强大且简洁的支持。本文将深入探讨Python中面向对象编程的核心概念——类、对象和实例方法，帮助读者理解并掌握这些重要知识。一、类的概念与定义类（
Python 线程与进程在实际项目中的问题及应对策略女码农的重启 python java 线程进程
一、引言在Python编程里，线程（Thread）和进程（Process）是实现并发与并行计算的关键工具，能有效提升程序执行效率与资源利用率。然而，实际项目应用中，因二者特性及Python运行环境（如GIL，全局解释器锁）等因素，会遭遇诸多问题。本文深入剖析这些问题，并给出应对方案。二、Python线程的问题与解决（一）GIL引发的性能瓶颈Python的全局解释器锁，限制了同一进程内多个线程并行执
Django模板——自定义过滤器折月竹酒 Django django 模板过滤器自定义
文章目录Django模板——自定义过滤器1代码布局1.1app特有模板标签1.2可复用标签2定义过滤器2.1模板过滤器的本质3注册过滤器4使用5.期望字符串的模板过滤器Django模板——自定义过滤器1代码布局1.1app特有模板标签app目录下创建名为templatetags的包templatetags目录下创建python模块（通常只需创建.py文件）1.2可复用标签专门创建一个做模板标签的a
Django母婴商城项目实践（二）- 商城项目环境配置 ITB业生 Django django 数据库 python
2、母婴商城项目环境配置环境配置：Python3.12解释器PycharmProfessional2025.1编辑器Django4.2（或Django5.x）MySQL8.0.28数据库1、Django框架介绍Django是一个高级的PythonWeb应用框架，可以快速开发安全和可维护的网站。由经验丰富的开发者构建，Django负责处理网站开发中麻烦的部分，可以专注于编写应用程序，而无需重新开发。
Django母婴商城项目实践（三）- Django框架使用之电商项目配置 ITB业生 Django django python 后端
3Django框架使用1、项目与应用1、创建项目操作创建项目存储目录，并切换至该路径执行创建Django项目的命令创建Django项目命令：python-mdjangostartproject项目名#切换到存储项目路径$C:\Users\blning>cdC:\ProjectManager\PythonWeb#创建Django项目$C:\ProjectManager\PythonWeb>pytho
Python 进程间的通信：原理剖析与项目实战女码农的重启 java 进程通信 python
在Python编程中，当涉及多进程编程时，进程间的通信（Inter-ProcessCommunication，简称IPC）是一个重要的课题。多个进程在运行过程中，常常需要交换数据、传递状态或协同工作，这就离不开进程间通信机制。本文将深入讲解Python进程间通信的原理，并结合实际项目案例，展示其在项目中的具体使用方法。一、Python进程间通信原理操作系统为进程提供了多种通信机制，Python在标
K近邻算法【python】【sklearn】 weixin_44985842 python 近邻算法 sklearn
0定义K近邻算法（K-NearestNeighbors,KNN）是一种基于实例的监督学习算法，主要用于分类和回归任务。其核心思想是：在特征空间中，对于待预测的样本，找到与其距离最近的k个已知样本（“邻居”），根据这k个邻居的类别（分类任务）或属性值（回归任务）来决定该样本的预测结果，，常用欧氏距离公式：对于两个n维样本点xi=(xi1,xi2,...,xin)x_i=(x_{i1},x_{i2},
python学智能算法（二十五）|SVM-拉格朗日乘数法理解
引言前序学习进程中，已经对最佳超平面的求解有了一定认识。刚好在此梳理一下:函数距离首先有函数距离F，也可以称为函数间隔F：F=min⁡i=1...myi(w⋅xi+b)F=\min_{i=1...m}y_{i}(w\cdotx_{i}+b)F=i=1...mminyi(w⋅xi+b)几何距离然后有几何距离δ，也可以称为几何间隔δ：δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delt
python爬虫运行_Python爬虫杂记 - python运行js weixin_39727402 python爬虫运行
execjs使用有了selenium+ChromeHeadless加载页面为什么还要用execjs来运行js？selenium+ChromeHeadless必然是爬虫的一大利器，可是缺点依然存在，性能问题不可忽视。但这构不成舍弃它而不用的理由。我认为舍弃包括ChromeHeadless、PhantomJS在内的无头浏览器的原因主要有以下几点：1.页面结构改变、弹窗(一些网站的页面结构经常无规则改变
python3 pyv8 linux,Python3.5安装PyV8 左瑶 python3 pyv8 linux
Python3.5安装PyV8时，报错，PyV8版本：PyV8-0.5。错误如下：C:UsersAdministratorAppDataLocalProgramsPythonPython35Libsite-packages>pipinstallPyV8CollectingPyV8Usingcachedhttps://files.pythonhosted.or...683f439e7bdd67f95
python 安装PyV8 和 lxml
近来在玩python爬虫，需要使用PyV8模块和lxml模块。但是执行pipinstallxx或者easy_installxx指令都会提示一些错误。这些错误有些是提示pip版本过低或者缺少vc++9.0环境，再或者一些头文件无法引用等等。我也懒得找错误解决方法。就直接下载Pyv8模块的安装包和lxml的安装包。Pyv8的安装包链接：1.针对win32+python2.7的安装包PyV8-1.0-p
力扣25.7.15每日一题——有效单词一个OI蒟蒻 LeetCode leetcode 算法职场和发展
Description应该都能看懂吧……Solution一道简单的模拟题。按照题意枚举字符串，判断元/辅音；判断合法即可。也不知道今天的题为什么怎么淼Code（C++、Python3）C++classSolution{public:boolisValid(stringword){if(word.size()bool:iflen(word)<3:returnFalsee=f=Falseforcinw
OpenCV 入门指南 —— 从环境搭建到图像处理 m0_74751715 opencv 图像处理人工智能 python
文章目录前言一、什么是OpenCV？二、环境准备与安装1.Python虚拟环境2.安装OpenCV3.验证安装三、读取与显示图像四、常见图像处理操作1.色彩空间转换2.图像平滑（模糊）3.边缘检测（Canny算法）4.在图像上绘制图形与文字五、视频与摄像头操作六、推荐学习路线七、参考资料前言在计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）凭借其开源、
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
Python PyV8: 在Python中运行JavaScript的利器莱财一哥
本文还有配套的精品资源，点击获取简介：PythonPyV8是一个在Python环境中执行JavaScript代码的库，基于Google的V8JavaScript引擎，实现Python与JavaScript之间的互操作性。本文将详细讨论PyV8的安装方法，包括通过pip安装和自行编译安装特定版本的步骤，以及如何在Python程序中使用PyV8执行JavaScript代码。1.PythonPyV8库介
Pycharm开发Djnago项目部署详细教程（2021更新） af9f873c915c
项目部署：这里用的是非常干净的ubuntu16.04系统环境，没有使用任何云服务器，原因是因为不同的云服务器环境都不一样。我们就从零开始来完成部署。在开发机上的准备工作：确认项目没有bug。用pipfreeze>requirements.txt将当前环境的包导出到requirements.txt文件中，方便部署的时候安装。把dysms_python文件准备好。因为短信验证码的这个包必须通过将项目上
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
在医疗AI爆发式增长的今天，单一数据库已无法满足多模态医疗数据的处理需求。本文将揭秘医疗融合数据库的核心架构，通过真实代码示例展示如何破解医疗数据整合的世纪难题。###一、医疗数据的"四维挑战"####1.多模态数据洪流```python#典型患者数据组成patient_data={"时序数据":"ECG/EEG波形(1000Hz采样)","影像数据":"CT/MRI(单次扫描2GB+)","文本
PyQt5学习笔记，带例子源码
一、很程序员，都喜欢开发windows桌面应用系统，基于python3开发，效率高二、PyQt5开发的桌面应用系统是可以跨平台的，可以在Mac上、Window上、Linux桌面系统上运行，以下为学习笔记及总级三、源码下载登录后复制1、QDateTimeEdit日期输入框setCalendarPopup弹出日期选择框setDisplayFormat("yyyy-MM-ddHH:mm:ss")设置展示
Python爬虫实战：高效提取与解析JSON格式数据 Python爬虫项目 python 爬虫宽度优先数据库 json 深度优先开发语言
1.JSON数据爬取概述在当今互联网时代，JSON(JavaScriptObjectNotation)已成为最流行的数据交换格式之一。相比传统的HTML页面，JSON格式数据具有结构清晰、体积小、解析方便等优势，使得它成为API接口的首选数据格式。1.1为什么选择JSON数据爬取数据结构化：JSON数据本身就是结构化的，不需要像HTML那样进行复杂的解析传输高效：JSON通常比HTML体积小，传输
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
使用LangChain构建多代理系统实现复杂任务自动化 LCG元工具 langchain 自动化运维
目录一、系统架构设计模块说明：二、核心工作流程（双流程图对比）横向对比：单代理vs多代理纵向核心流程三、企业级实现方案1.Python核心代码（LangChain0.1.8+）2.TypeScript前端集成代码四、性能对比测试五、生产级部署方案安全审计要点：高可用部署拓扑：六、技术前瞻性分析附录：完整技术图谱摘要：本文深度解析如何基于LangChain框架构建企业级多代理系统，通过模块化架构设计
时序数据库选型避坑全攻略：IoTDB性能与成本双杀的秘密！ LCG元数据库时序数据库 iotdb java
文章目录一、架构设计深度解析1.1IoTDB架构图谱1.2核心流程对比二、企业级实战代码2.1Python数据写入示例2.2TypeScript客户端实现2.3集群配置YAML三、性能对比分析四、生产部署方案4.1安全加固配置4.2安全策略实施五、技术前瞻分析5.1云原生演进路径5.2新型存储引擎预测六、技术图谱附录一、架构设计深度解析1.1IoTDB架构图谱数据写入协议适配层内存表管理持久化引擎
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数