Roy_Allen

Python实用编程技巧（二）

文章目录

文件IO
- 问题：如何读写文本文件
- 问题：如何处理二进制文件
- 问题：如何设置文件的缓冲
- 问题：如何将文件映射到内存
- 问题：如何访问文件的状态
- 问题：如何使用临时文件
类与对象
- 问题：如何派生内置不可变类型
- 问题：如何为创建大量实例节省内存
- 问题：如何让对象支持上下文管理
- 问题：如何创建可管理的对象属性
- 如何让类支持比较操作
- 问题：如何使用描述符对实例属性做类型检查
- 问题：如何在环状数据结构中管理内存
- 问题：如何通过方法名的字符串调用方法
多线程并发
- 问题：如何使用多线程
- 问题：如何实现线程间通信
- 问题：如何实现线程间事件通知
- 问题：如何使用线程本地数据
- 问题：如何使用线程池
- 问题：如何使用多进程
装饰器
- 问题：如何使用装饰器
- 问题：如何保存原函数的信息
- 问题：如何定义带参数的装饰器
- 问题：如何实现属性可修改的函数装饰器
- 问题：如何在类中定义装饰器
小结

文件IO

文件IO效率相关问题和技巧

问题：如何读写文本文件

这里需要关注一个变化
- 也就是说，在python3中所有文本默认实用Unicode编码，无需加u''，str类型
- python2中读写文件需要解码编码（因为是字节串），python3中默认以t方式打开文件（真正的字符串），可以通过encoding指明编码即可，更便捷

问题：如何处理二进制文件

案例：处理wav文件，获取头部信息，这里需要了解wav文件的数据结构（包格式）
这里咱就用个文本文件，指定二进制模式b，就不是t了，读取的是字节也不是str

struct模块的unpack方法可以解析二进制数据

import struct
f = open('opera.txt', 'rb')
fc = f.read()
print(type(fc)) # 
print(struct.unpack('h', fc[0:2]))  # (-30490,) 解析出来是元组！

二进制数据可以用f.readinto方法写入到numpy.zeros()创建的buffer中，然后用其tofile方法直接写入文件

问题：如何设置文件的缓冲

为了减少IO操作次数（费时且按块执行），需要设置缓冲

一般分为全缓冲、行缓冲、无缓冲

# 可以在Linux中打开要写入的文件，然后
f = open('opera.txt', 'wb')
f.write(b'abc')	# 此时会发现打开的文件没有变化，因为内容在缓冲区
# 缓冲区大小和磁盘的blocksize有关，可以在系统使用相关命令查看
# 假设为4096字节
f.write(b'a'*4093)
f.write(b'b')	# 查看此时使用tail打开的文件是否已写入

当我们已t默认模式打开的时候，会发现写了4096以上的字符仍然没有刷盘
- 这是因为python3中的t模式其实是基于二进制模式的，他的缓冲容量为8192
以上是文本模式的全缓冲；行缓冲是遇到换行就读入，常见的bash就是行缓冲模式，一个命令敲回车就执行

使用python，可以指定无缓冲

f = open('opera.txt', 'wb', buffering=0)	# 指定为1就是行缓冲，但是只能在文本模式下！！！
f.write(b'abc')	# buffer=0可以在b模式

问题：如何将文件映射到内存

实际案例：
- 大文件都是保存在磁盘中的（使用时装载，操作系统决定），如果希望能统一加载到内存操作
使用标准库中的mmap，将文件映射到进程的内存地址空间；具体操作可以查资料，知道有这么一种场景即可！

问题：如何访问文件的状态

文件信息
- 文件类型
- 访问权限
- 最后的修改/访问时间
- 文件大小

都是通过系统调用完成，python中使用os模块

import os
print(os.stat('opera.txt'))
# os.stat_result(st_mode=33206, st_ino=3659174697950400, st_dev=752934806, st_nlink=1,
# st_uid=0, st_gid=0, st_size=18, st_atime=1633529209, st_mtime=1633529209, st_ctime=1633529209)
os.path.isfile('opera.txt')	# os.path也可以获得一些信息

fd = os.open('opera.txt', os.O_RDONLY)
print(fd)   # 4     文件描述符

fn = os.read(fd, 5) # 传入file description    5字节
print(fn)   # b'abc'

st_nlink是硬链接，指针指向！软连接是只保存了数据路径
其他参数包括了文件的所有信息

问题：如何使用临时文件

有事保存了大量的临时数据做数据分析，使用后依旧占用空间

from tempfile import TemporaryFile
# 这是系统级别的临时文件，直接使用os.open
tf = TemporaryFile()
tf.write(b'*'*4096)
tf.seek(0)  # 必须回到起点
print(tf.read(512))
tf.close()  # 临时文件销毁
# 没有名字，也找不到

有名字的临时文件，多进程想同时使用

from tempfile import NamedTemporaryFile
ntf = NamedTemporaryFile(delete=False)  # 关闭不删
print(ntf.name) # C:\Users\WINDOW~1\AppData\Local\Temp\tmp_4m8z61i

import tempfile
print(tempfile.gettempprefix()) # 前缀tmp

这一部分还是遇到实际问题更容易理解一些！了解即可

类与对象

类与对象深度问题

问题：如何派生内置不可变类型

实战案例：

我们可以自定义这个类，在构造方法中过滤，然后传递给父类的构造方法

# 代码大致是这个样子
class IntTuple(tuple):
    def __init__(self, iter):
        int_tup = (i for i in iter if isinstance(i, int) and i>0)
        super().__init__(int_tup)

这里会出现问题，

# TypeError: object.__init__() takes exactly one argument (the instance to initialize)

错误提示调用了父类object的init构造方法

区别是这样的
- 所有的对象归根结底都是有object类的__new__()方法创建，这个方法使用cls（我们定义的类名）作为参数（源）
- 我们观察下面的显式调用的例子就懂了：
也就是说，有的类（list）会经过new和init两个方法产生对象；一般是在init中，所以我们也叫它构造方法

有的类（tuple）在new的时候就已经产生了对象，根本没有实现init方法（is父类的init方法）

class IntTuple(tuple):
    def __new__(cls, iter):
        int_tup = (i for i in iter if isinstance(i, int) and i>0)
        return super().__new__(cls, int_tup)    # 返回对象

it = IntTuple(['aa', 1, 2, 3, '6'])
print(it)   # (1, 2, 3)

问题：如何为创建大量实例节省内存

案例：

这里用到__slots__变量

class Person1():
    def __init__(self, name, uuid, age):
        self.name = name
        self.uuid = uuid
        self.age = age

class Person2():
    __slots__ = ['name', 'uuid', 'age']
    def __init__(self, name, uuid, age):
        self.name = name
        self.uuid = uuid
        self.age = age

p1 = Person1('Roy', 1002, 18)
p2 = Person2('Roy', 1002, 18)
# dir() 函数不带参数时，返回当前范围内的变量、方法和定义的类型列表
# 带参数时，返回参数的属性、方法列表
# __dir__()被定义就会调用，未定义就尽可能收集信息
alist = set(dir(p1))-set(dir(p2))   # 求差集
print(alist)    # {'__weakref__', '__dict__'}

p1.w = 120
# p2.w = 140  # AttributeError: 'Person2' object has no attribute 'w'
print(p1.__dict__)  # {'name': 'Roy', 'uuid': 1002, 'age': 18, 'w': 120}

import sys
print(sys.getsizeof(p1.__dict__))   # 144B
print(sys.getsizeof(p1.name))   # 52B
print(sys.getsizeof(p1.uuid))   # 28B
print(sys.getsizeof(p1.age))   # 28B
print(sys.getsizeof(p1.w))   # 28B

__dict__中存储的就是成员变量和定义的临时变量
定义了__slot__就无法添加临时变量，关闭动态绑定属性！

怎么证明这一点呢？

import tracemalloc
tracemalloc.start()
# 分别打开创建p1和p2的注释，运行程序，发现p2占用内存明显少
# p1 = [Person1(1,2,3) for _ in range(10000)]     # 1567K
p2 = [Person2(1,2,3) for _ in range(10000)]     # 630K
snap = tracemalloc.take_snapshot()
top = snap.statistics('filename')   # 整个文件占用的内存     lineno看某行代码耗费的内存
for i in top[:10]:
    print(i)    # 前10

问题：如何让对象支持上下文管理

常见的上下文管理器就是with，可以优雅的打开和关闭文件
- 工作流程解析：其实是调用了__enter__和__exit__方法
同样的，我们可以借助with并自定义上述方法实现自己的上下文管理
- 可以捕获异常不让他向上抛出

问题：如何创建可管理的对象属性

方法是对象的接口，一般获取属性也使用方法
使用方法繁琐，直接获取属性太暴露；所以希望在形式上是直接访问属性，实际上内部调用的是方法

简单+安全，使用property实现

import math

class Circle():
    def __init__(self,radius):
        self.radius = radius

    def get_r(self):
        return round(self.radius,2) # 保留两位

    def set_r(self, r):
        if not isinstance(r, (int, float)):
            raise TypeError('请输入整数或者小数')
        self.radius = r

    @property
    def S(self): # get_area
        return self.radius**2 * math.pi

    @S.setter
    def S(self, s): # set_area
        self.radius = math.sqrt(s/math.pi)

    R = property(get_r, set_r)  # 这是一种形式，还可以使用装饰器

c = Circle(3)
print(c.R)  # 4
c.R = 4
print(c.R)  # 4

print(c.S)
print(c.R)
c.S = 80
print(c.S)  # 80.00000000000001
print(c.R)  # 5.05

上面通过两种方法通过property创建可管理属性，安全便捷

如何让类支持比较操作

很简单，根据需求，对比较运算符进行重载

这里使用total_ordering，只需定义两个比较方法，就能自动推算，无需重写所有！

from functools import total_ordering

@total_ordering
class Rect():
    def __init__(self, w, h):
        self.width = w
        self.height = h

    def get_area(self):
        return self.width * self.height

    def __lt__(self, obj):
        return self.get_area() < obj.get_area()

    def __eq__(self, obj):
        return self.get_area() == obj.get_area()

r1 = Rect(2,3)
r2 = Rect(3,4)
print(r1 < r2)  # True
print(r1 <= r2) # True
print(r1 >= r2) # False

如果我们定义类时忘了定义area之类的方法，就尴尬了，可以使用继承的方法限定

from functools import total_ordering
from abc import ABCMeta

@total_ordering
class Shape(metaclass=ABCMeta):
    @classmethod
    def get_area(self):
        pass

    def __lt__(self, obj):
        return self.get_area() < obj.get_area()

    def __eq__(self, obj):
        return self.get_area() == obj.get_area()

class Rect(Shape):
    def __init__(self, w, h):
        self.width = w
        self.height = h

    def get_area(self):
        return self.width * self.height

    def __lt__(self, obj):
        return self.get_area() < obj.get_area()

    def __eq__(self, obj):
        return self.get_area() == obj.get_area()

r1 = Rect(2,3)
r2 = Rect(3,4)
print(r1 < r2)  # True
print(r1 <= r2) # True
print(r1 >= r2) # False

问题：如何使用描述符对实例属性做类型检查

这个描述符其实就是自定义一个重写了一些方法的类，可以在业务类中校验属性

class Desc:
    def __init__(self, key):
        self.key = key

    def __set__(self, instance, value):
        '''
        :param instance: 实例化的类对象
        :param value: 设置的值
        :return:
        '''
        instance.__dict__[self.key] = value

    def __get__(self, instance, owner):
        print('get', instance,owner)
        return instance.__dict__[self.key]

    def __delete__(self, instance):
        del instance.__dict__[self.key]

class Student:
    name = Desc('Roy')
    age = Desc(18)

好的，改写一下，做类型校验，不过要注意这里的类定义，不需再按照传统方式

class Desc:
    def __init__(self, key, _type):
        self.key = key
        self._type = _type

    def __set__(self, instance, value):
        '''
        :param instance: 实例化的类对象
        :param value: 设置的值
        :return:
        '''
        if not isinstance(value, self._type):
            raise TypeError('不是想要的类型')
        instance.__dict__[self.key] = value	# 动态绑定

    def __get__(self, instance, owner):
        print('get', instance,owner)
        return instance.__dict__[self.key]

    def __delete__(self, instance):
        del instance.__dict__[self.key]

class Student:
    # def __init__(self, name, age):    # 在init中Desc不起作用
    #     self.name = Desc(name, str)
    #     self.age = Desc(age, int)
    name = Desc('Roy', str)
    age = Desc(18, int)

s = Student()
# s.name = 15 # TypeError: 不是想要的类型
s.name = 'roy'
s.age = 23
s.name = 18
print(s.name)   # roy

问题：如何在环状数据结构中管理内存

循环引用会让对象垃圾不能被及时回收

可以通过__del__方法查看析构的过程，通过下面的例子可以证明循环引用带来的问题

class Node:
    '''
    双向链表，链表：抓住一个节点就OK
    '''
    def __init__(self, data):
        self.data = data
        self.right = None
        self.left = None

    def add_right(self, node):
        # 只能右端添加节点
        self.right = node
        node.left = self

    def __str__(self):
        # 打印链表节点值
        return 'Node:<%s>'%self.data

    def __del__(self):
        # 析构
        print('__del__',self)

def double_link(n):
    '''
    常见有n个节点的列表
    :param n:
    :return:
    '''
    head = current = Node(1)
    for i in range(2, n+1):
        node = Node(i)
        current.add_right(node)
        current = node
    return head

head = double_link(20)
head = None # 按道理讲应该析构，但是没，如果data中存的是其他内容？内存开销严重

import time
for i in range(5):
    time.sleep(1)
    print('run...')

左指针使用弱引用，不增加引用计数；注意属性访问方式的变化（使用property，属性变函数，简单安全）

import weakref

class Node:
    '''
    双向链表，链表：抓住一个节点就OK
    '''
    def __init__(self, data):
        self.data = data
        self.right = None
        self._left = None

    def add_right(self, node):
        # 只能右端添加节点
        self.right = node
        # 右边是引用（指出去），左边为弱引用（被指向），不增加引用计数
        node.left = weakref.ref(self)   # 当我们head=None，就会析构后续节点

    @property
    def left(self):
        return self._left() # 统一访问方式，   实例.left

    def __str__(self):
        # 打印链表节点值
        return 'Node:<%s>'%self.data

    def __del__(self):
        # 析构
        print('__del__',self)

def double_link(n):
    '''
    常见有n个节点的列表
    :param n:
    :return:
    '''
    head = current = Node(1)
    for i in range(2, n+1):
        node = Node(i)
        # node.left()   # 弱引用，必须用left()
        current.add_right(node)
        current = node
    return head

head = double_link(20)
head = None # 按道理讲应该析构，但是没，如果data中存的是其他内容？内存开销严重

import time
for i in range(5):
    time.sleep(1)
    print('run...')

问题：如何通过方法名的字符串调用方法

有时不同类的相同作用的方法，其名称不同，如何通过名称调用？可以借助getattr

还可以使用operator中的方法

# 演示：
from operator import methodcaller
s = '15de55dsab45e'
print(methodcaller('find', 'ab')(s))    # 8 方法，参数	 后面传对象，反着的！

多线程并发

多线程并发相关问题与解决技巧

问题：如何使用多线程

例如要下载某个接口的数据并保存，可以使用多线程加速

我们通过访问网站下载CSV资源来说明问题

import requests
import base64
from io import StringIO
import csv
from xml.etree.ElementTree import ElementTree, Element, SubElement

USERNAME = b'7f304a2df40829cd4f1b17d10cda0304'
PASSWORD = b'aff978c42479491f9541ace709081b99'

def download_csv(page_number):
    print('download csv data [page=%s]' % page_number)
    # 网站中提供的API
    url = "http://api.intrinio.com/prices.csv?ticker=AAPL&hide_paging=true&page_size=200&page_number=%s" % page_number
    auth = b'Basic ' + base64.b64encode(b'%s:%s' % (USERNAME, PASSWORD))
    headers = {'Authorization' : auth}
    response = requests.get(url, headers=headers)

    if response.ok:
        return StringIO(response.text)

def csv_to_xml(csv_file, xml_path):
    # 转换CSV为xml格式
    print('Convert csv data to %s' % xml_path)
    reader = csv.reader(csv_file)
    headers = next(reader)

    root = Element('Data')
    root.text = '\n\t'
    root.tail = '\n'

    for row in reader:
        book = SubElement(root, 'Row')
        book.text = '\n\t\t'
        book.tail = '\n\t'

        for tag, text in zip(headers, row):
            e = SubElement(book, tag)
            e.text = text
            e.tail = '\n\t\t'
        e.tail = '\n\t'

    ElementTree(root).write(xml_path, encoding='utf8')

def download_and_save(page_number, xml_path):
    # IO
    csv_file = None
    while not csv_file:
        csv_file = download_csv(page_number)
    # CPU
    # csv_to_xml(csv_file, 'data%s.xml' % page_number)
    csv_to_xml(csv_file, 'data%s.xml' % xml_path)

from threading import Thread
# 多线程使用方法一：面向对象
class MyThread(Thread):
    def __init__(self, page_number, xml_path):
        super().__init__()  # 必须调用父类init
        self.page_number = page_number
        self.xml_path = xml_path

    def run(self):
        # 相当于start()
        download_and_save(self.page_number, self.xml_path)

if __name__ == '__main__':
    import time
    t0 = time.time()
    thread_list = []
    for i in range(1, 6):
        t = MyThread(i, 'data%s.xml' % i)
        t.start()
        thread_list.append(t)

    for t in thread_list:
        t.join()    # 每个都join，阻塞主线程事后在结束

    # 多线程使用方法二：
    # 直接使用
    # i = 1
    # t = Thread(target=download_and_save(i, 'data%s'%i))
    # t.start()
    # t.join()


    # 串行：不适用多线程
    # for i in range(1, 6):
    #      download_and_save(i, 'data%s.xml' % i)
    print(time.time() - t0)
    print('main thread end.')

在主要的download_and_save函数中，下载属于IO密集型操作，转换属于CPU密集操作
多线程只能加速IO操作，可以同时请求并下载（无需CPU过多参与），但不能加速CPU密集操作，除非多核并行（但这也不叫多线程加速了，属于多进程）

问题：如何实现线程间通信

上面说不能加速CPU密集型运算，为什么呢？
- 这是由于全局解释器锁（GIL）的存在
- 在同一进程（当前任务）的各个线程中，当我们给每个线程分配一个CPU核加速运算，各线程都要先拿到这个GIL才能执行，所以多核和一核并无区别
- 对IO操作是没有这个限制的，GIL锁会自动释放
- 可以用一个线程和两个线程试一下，使用top命令监控CPU状态
- 多进程是独立的，不受影响

更改一下上面的代码架构

多个线程下载资源，使用标准库中的queue.Queue（线程安全的），放入队列
一个线程进行转换，从队列中取数据（生产者-消费者模型）

线程安全的意思是Queue自带了加锁机制，多线程访问时可以避免混乱

import requests
import base64
from io import StringIO
import csv
from xml.etree.ElementTree import ElementTree, Element, SubElement
from threading import Thread

USERNAME = b'7f304a2df40829cd4f1b17d10cda0304'
PASSWORD = b'aff978c42479491f9541ace709081b99'

# class MyThread(Thread):
#     def __init__(self, page_number, xml_path):
#         super().__init__()
#         self.page_number = page_number
#         self.xml_path = xml_path
#
#     def run(self):
#         download_and_save(self.page_number, self.xml_path)

class DownloadThread(Thread):
    def __init__(self, page_number, queue):
        super().__init__()
        self.page_number = page_number
        self.queue = queue

    def run(self):
        csv_file = None
        while not csv_file:
            csv_file = self.download_csv(self.page_number)
        self.queue.put((self.page_number, csv_file))

    def download_csv(self, page_number):
        print('download csv data [page=%s]' % page_number)
        url = "http://api.intrinio.com/prices.csv?ticker=AAPL&hide_paging=true&page_size=200&page_number=%s" % page_number
        auth = b'Basic ' + base64.b64encode(b'%s:%s' % (USERNAME, PASSWORD))
        headers = {'Authorization' : auth}
        response = requests.get(url, headers=headers)

        if response.ok:
            return StringIO(response.text)

class ConvertThread(Thread):
    def __init__(self, queue):
        super().__init__()
        self.queue = queue

    def run(self):
        # 这样写不能自动结束，怎么判断？
        while True:
            page_number, csv_file = self.queue.get()
            self.csv_to_xml(csv_file, 'data%s.xml' % page_number)

    def csv_to_xml(self, csv_file, xml_path):
        print('Convert csv data to %s' % xml_path)
        reader = csv.reader(csv_file)
        headers = next(reader)

        root = Element('Data')
        root.text = '\n\t'
        root.tail = '\n'

        for row in reader:
            book = SubElement(root, 'Row')
            book.text = '\n\t\t'
            book.tail = '\n\t'

            for tag, text in zip(headers, row):
                e = SubElement(book, tag)
                e.text = text
                e.tail = '\n\t\t'
            e.tail = '\n\t'

        ElementTree(root).write(xml_path, encoding='utf8')


from queue import Queue

if __name__ == '__main__':
    queue = Queue()
    thread_list = []
    for i in range(1, 6):
        t = DownloadThread(i, queue)
        t.start()
        thread_list.append(t)

    convert_thread = ConvertThread(queue)
    convert_thread.start()

    for t in thread_list:
        t.join()
    print('main thread end.')

我们分别定义下载线程和转换线程，使用队列作为参数
思考：线程安全如何实现的？

问题：如何实现线程间事件通知

接着上面的任务

我们可以使用threading.Event，并使用tarfile包，增加一个打包的线程

import requests
import base64
from io import StringIO
import csv
from xml.etree.ElementTree import ElementTree, Element, SubElement
from threading import Thread
from queue import Queue
import tarfile
import os

USERNAME = b'7f304a2df40829cd4f1b17d10cda0304'
PASSWORD = b'aff978c42479491f9541ace709081b99'


class DownloadThread(Thread):
    def __init__(self, page_number, queue):
        super().__init__()
        self.page_number = page_number
        self.queue = queue

    def run(self):
        csv_file = None
        while not csv_file:
            csv_file = self.download_csv(self.page_number)
        self.queue.put((self.page_number, csv_file))

    def download_csv(self, page_number):
        print('download csv data [page=%s]' % page_number)
        url = "http://api.intrinio.com/prices.csv?ticker=AAPL&hide_paging=true&page_size=100&page_number=%s" % page_number
        auth = b'Basic ' + base64.b64encode(b'%s:%s' % (USERNAME, PASSWORD))
        headers = {'Authorization': auth}
        response = requests.get(url, headers=headers)

        if response.ok:
            return StringIO(response.text)


class ConvertThread(Thread):
    '''
    需要和打包线程通知状态
    '''
    def __init__(self, queue, c_event, t_event):
        super().__init__()
        self.queue = queue
        self.c_event = c_event
        self.t_event = t_event

    def run(self):
        count = 0
        while True:
            page_number, csv_file = self.queue.get()    # 会阻塞
            if page_number == -1:   # 没有file可取，退出
                self.c_event.set()  # 通知：转换事件已结束
                self.t_event.wait() # 等待通知，打包事件状态
                break

            self.csv_to_xml(csv_file, 'data%s.xml' % page_number)
            count += 1
            if count == 2:  # 两个一打包
                count = 0
                # 通知转换完成
                self.c_event.set()  # 通知：转换事件已结束，可以打包

                # 等待打包完成
                self.t_event.wait() # 等待通知，打包事件状态
                self.t_event.clear()# wait和clear一般都是是一起的
                # 循环继续

    def csv_to_xml(self, csv_file, xml_path):
        print('Convert csv data to %s' % xml_path)
        reader = csv.reader(csv_file)
        headers = next(reader)

        root = Element('Data')
        root.text = '\n\t'
        root.tail = '\n'

        for row in reader:
            book = SubElement(root, 'Row')
            book.text = '\n\t\t'
            book.tail = '\n\t'

            for tag, text in zip(headers, row):
                e = SubElement(book, tag)
                e.text = text
                e.tail = '\n\t\t'
            e.tail = '\n\t'

        ElementTree(root).write(xml_path, encoding='utf8')


class TarThread(Thread):
    '''
    打包线程，等待来自转换线程的通知
    '''
    def __init__(self, c_event, t_event):
        '''
        :param c_event: 转换线程事件
        :param t_event: 打包线程事件
        '''
        super().__init__(daemon=True)   # 主线程结束，子线程跟着退出；这里设不设都一样，在转换线程中阻塞住了，这边完成了主线程才退出！
        self.count = 0
        self.c_event = c_event
        self.t_event = t_event

    def run(self):
        while True:
            # 阻塞，等待足够的xml打包，那边转换好了调用set()方法这边就能开闸放水
            self.c_event.wait()
            # 相当于更新事件，后面还会有阻塞通知
            self.c_event.clear()

            print('打包......')
            # 打包方法
            self.tar_xml()

            # 通知打包完成
            self.t_event.set()

    def tar_xml(self):
        self.count += 1
        tfname = 'data%s.tgz' % self.count
        print('tar %s...' % tfname)
        tf = tarfile.open(tfname, 'w:gz')   # 打gz方式的包
        for fname in os.listdir('.'):
            if fname.endswith('.xml'):
                tf.add(fname)   # 加入即可
                os.remove(fname)    # 打包并移除！
        tf.close()

        if not tf.members:
            os.remove(tfname)


from threading import Event

if __name__ == '__main__':
    queue = Queue()
    c_event = Event()
    t_event = Event()
    thread_list = []
    for i in range(1, 15):
        t = DownloadThread(i, queue)
        t.start()
        thread_list.append(t)

    convert_thread = ConvertThread(queue, c_event, t_event)
    convert_thread.start()

    tar_thread = TarThread(c_event, t_event)
    tar_thread.start()

    # 等待下载线程结束
    for t in thread_list:
        t.join()

    # 通知Convert线程退出，解决上个问题中无法自动退出的问题
    queue.put((-1, None))   # 如果是下载线程还没准备好文件put?

    # 等待转换线程结束
    convert_thread.join()

    # 无需等待打包线程
    print('main thread end.')

转换和打包共享两个Event，转换结束使用set解除打包中的wait，打包结束解除转换中的wait
思考：join的作用，上面使用put(-1)的方法，退出转换线程是否合理？
- 合理，join是阻塞，子线程完毕才会执行后面的代码！所以主线程中的start()一定要放在最前面
思考：一直在使用io包中的StringIO，特点是什么？
思考：除了消息队列，操作系统还用什么实现进程、线程间通信？

问题：如何使用线程本地数据

场景：使用opencv库实时监控，我们在本地使用http在浏览器获取视频数据

这里使用操作系统级别的管道os.pipe()发送摄像头数据给线程

import os, cv2, time, struct, threading
from http.server import HTTPServer, BaseHTTPRequestHandler
from socketserver import TCPServer, ThreadingTCPServer
from threading import Thread, RLock
from select import select

class JpegStreamer(Thread):
    def __init__(self, camera):
        super().__init__()
        self.cap = cv2.VideoCapture(camera)
        self.lock = RLock()
        self.pipes = {}

    def register(self):
        pr, pw = os.pipe()
        self.lock.acquire()
        self.pipes[pr] = pw
        self.lock.release()
        return pr

    def unregister(self, pr):
        self.lock.acquire()
        pw = self.pipes.pop(pr)
        self.lock.release()
        os.close(pr)
        os.close(pw)

    def capture(self):
        cap = self.cap
        while cap.isOpened():
            ret, frame = cap.read()
            if ret:
                ret, data = cv2.imencode('.jpg', frame, (cv2.IMWRITE_JPEG_QUALITY, 40))
                yield data.tostring()

    def send_frame(self, frame):
        n = struct.pack('l', len(frame))
        self.lock.acquire()
        if len(self.pipes):
            _, pipes, _ = select([], self.pipes.values(), [], 1)
            for pipe in pipes:
                os.write(pipe, n)
                os.write(pipe, frame)
        self.lock.release()

    def run(self):
        for frame in self.capture():
            self.send_frame(frame)

class JpegRetriever:
    def __init__(self, streamer):
        self.streamer = streamer
        self.local = threading.local()

    def retrieve(self):
        while True:
            ns = os.read(self.local.pipe, 8)
            n = struct.unpack('l', ns)[0]
            data = os.read(self.local.pipe, n)
            yield data

    def __enter__(self):
        if hasattr(self.local, 'pipe'):
            raise RuntimeError()

        self.local.pipe = streamer.register()
        return self.retrieve()

    def __exit__(self, *args):
        self.streamer.unregister(self.local.pipe)
        del self.local.pipe
        return True

class WebHandler(BaseHTTPRequestHandler):
    retriever = None

    @staticmethod
    def set_retriever(retriever):
        WebHandler.retriever = retriever

    def do_GET(self):
        if self.retriever is None:
            raise RuntimeError('no retriver')

        if self.path != '/':
            return

        self.send_response(200)
        self.send_header('Content-type', 'multipart/x-mixed-replace;boundary=jpeg_frame')
        self.end_headers()

        with self.retriever as frames:
            for frame in frames:
                self.send_frame(frame)

    def send_frame(self, frame):
        sh  = b'--jpeg_frame\r\n'
        sh += b'Content-Type: image/jpeg\r\n'
        sh += b'Content-Length: %d\r\n\r\n' % len(frame)
        self.wfile.write(sh)
        self.wfile.write(frame)

from concurrent.futures import ThreadPoolExecutor
class ThreadingPoolTCPServer(ThreadingTCPServer):
    def __init__(self, server_address, RequestHandlerClass, bind_and_activate=True, thread_n=100):
        super().__init__(server_address, RequestHandlerClass, bind_and_activate=True)

        self.executor = ThreadPoolExecutor(thread_n)

    def process_request(self, request, client_address):
        self.executor.submit(self.process_request_thread, request, client_address)

if __name__ == '__main__':
    # 创建Streamer，开启摄像头采集。
    streamer = JpegStreamer(0)
    streamer.start()

    # http服务创建Retriever
    retriever = JpegRetriever(streamer)
    WebHandler.set_retriever(retriever)

    # 开启http服务器
    HOST = 'localhost'
    PORT = 9000
    print('Start server... (http://%s:%s)' % (HOST, PORT))
    httpd = ThreadingPoolTCPServer((HOST, PORT), WebHandler, thread_n=3)
    #httpd = ThreadingTCPServer((HOST, PORT), WebHandler)
    httpd.serve_forever()

这里有个问题：只有一个客户端能获取到数据，也就是说无法共享
- 我们可以在第一个类中通过建立一个管道的字典，发送图像帧给多个客户端
上面使用threading.local，使用线程本地数据实现JpegRetriever类，单独建立管道；解释一下特点：
```
from threading import Thread, local

lo = local()
lo.x = 1

def ch_local(local):
    local.x = 2
    print(local.x)  # 2
Thread(target=ch_local, args=(lo,)).start()

print(lo.x) # 1
```
- 也就是说，函数中的local.x其实是调用时新创建的，属于这个线程的本地（私有）数据，和主线程独立
- 也是利用这个特性，多个WebHandler线程中，每个retriever都需要在注册管道时使用local变量，相当于创建独立的管道通信

问题：如何使用线程池

代码已经在上部分展示，使用线程池对连接请求做限制，避免资源耗尽！

使用线程池还能避免频繁创建消耗资源，演示一下：

import threading, time
from concurrent.futures import ThreadPoolExecutor

def func(a,b):
    print(threading.current_thread().name,a ,b)
    time.sleep(0.01)   # 必须睡一会儿，否则只是用一个线程
    return a+b

exe = ThreadPoolExecutor(3) # 3个线程的线程池
# result = exe.submit(func, 2, 3) # 
# print(result.result())  # 5

# 还可以使用map函数执行指定函数
result = exe.map(func, range(1,4), range(2,5))   # range返回迭代器，这里多出池内个数
# result是结果的迭代器
print(list(result)) # [3, 5, 7]
# 这里只有3个结果，池子里的不够用，占坑的还没释放，直接不干了
# ThreadPoolExecutor-0_0 1 2
# ThreadPoolExecutor-0_1 2 3
# ThreadPoolExecutor-0_2 3 4

我们直接将ThreadingTCPServer继承，追踪代码找到他需要的__init__参数，调用父类构造器并创建线程池，使用线程池的submit/map调用它的核心方法process_request中的process_request_thread
以上也是改写代码的基本流程！

问题：如何使用多进程

想要处理CPU密集型任务，可以使用多进程，看两段多进程的演示代码

from multiprocessing import Process
import time

x = 0

def func():
    global x
    x += 1
    time.sleep(1)
    print('x:',x)   # 1

if __name__ == '__main__':
    p = Process(target=func)
    p.start()
    p.join()  # 等待子进程结束，主进程再执行
    print('x:',x)   # 0  不同进程之间是隔离的，这个x并没有改变
    print('main process end...')

和多线程之间最大的不同是，不同进程之间使用不同的虚拟地址空间（不共享资源）
所以，这里的全局x结果不同

进程之间的通信可以使用管道，演示一下：

from multiprocessing import Queue, Pipe, Process

def func(c):
    data = c.recv()
    print(data)
    c.send(data + 1)

if __name__ == '__main__':
    c1, c2 = Pipe() # 两端！双工
    p1 = Process(target=func, args=(c2,)).start()
    c1.send(99)
    print(c1.recv())    # 100

看一段判断水仙花数的代码：

from threading import Thread
from multiprocessing import Process
from queue import Queue as Thread_Queue 
from multiprocessing import Queue as Process_Queue

def is_armstrong(n):
    a, t = [], n
    while t:
        a.append(t % 10)
        t //= 10
    k = len(a)
    return sum(x ** k for x in a) == n

def find_armstrong(a, b, q=None):
    res = [x for x in range(a, b) if is_armstrong(x)]
    if q:
        q.put(res)
    return res

# 使用多线程实现，需要60s
def find_by_thread(*ranges):
    q = Thread_Queue()
    workers = []
    for r in ranges:
        a, b = r
        t = Thread(target=find_armstrong, args=(a, b, q))
        t.start()
        workers.append(t)

    res = []
    for _ in range(len(ranges)):
        res.extend(q.get())

    return res

# 使用多进程实现
def find_by_process(*ranges):	# 元组参数解包
    q = Process_Queue()
    workers = []
    for r in ranges:
        a, b = r
        t = Process(target=find_armstrong, args=(a, b, q))
        t.start()
        workers.append(t)	# 没卵用，4个进程的一些信息

    res = []
    for _ in range(len(ranges)):
        res.extend(q.get())	# q中存的是列表

    return res

if __name__ == '__main__':
    import time
    t0 = time.time()
	# 进程数量由参数决定 
    res = find_by_process([10000000, 15000000], [15000000, 20000000], 
                         [20000000, 25000000], [25000000, 30000000])	# 16s
    print(res)
    print(time.time() - t0)

注意区别进程中的Queue
可以看一下CPU，一下4个核就满了

思考：进程间队列和线程间队列的区别是什么？

装饰器

装饰器使用及相关技巧

问题：如何使用装饰器

场景：想为多个函数添加统一的功能，又不想写多份一样的代码

用两个递归的例子来说明

# 斐波那契数列
# 1 1 2 3 5 8...
def fib(n):
    if n<=1:
        return 1
    return fib(n-1) + fib(n-2)

print(fib(6))

# 爬楼梯问题
# 每次可以爬1/2/3级台阶，问有多少种爬法
def climb(n):
    '''
    :param n: 还剩多少台阶
    :return: n个台阶的爬法
    '''
    count = 0
    if n==0:
        count = 1  # 爬完了！ 从简单情况出发，若只有1/2/3级，一步跨完，算一种方法，其他方法交给另外两个climb
    elif n>0:
        count = climb(n-1)+climb(n-2)+climb(n-3)
    return count

print(climb(4))

跟踪上面两个递归的过程会发现，有很多重复的计算，我们可以建立cache加速

如何一次实现给两个函数加cache？

# 装饰器：工厂模式
def deco(func):	# 传入被装饰的函数
    cache = {}  # 使用字典作为缓存
    def wrap(*args):    # 接收函数参数
        res = cache.get(args)   # 元组可以作为字典的键
        if not res:
            res = cache[args] = func(*args)
        return res
    return wrap # 返回包装后的函数
    
fib = deco(fib)	# 使用同名接收，可以对用户透明
print(fib(6))

# 装饰也可以直接使用语法糖
@deco
def fib(n):
    if n<=1:
        return 1
    return fib(n-1) + fib(n-2)

@deco
def climb(n):
    '''
    :param n: 还剩多少台阶
    :return: n个台阶的爬法
    '''
    count = 0
    if n==0:
        count = 1  # 爬完了！ 从简单情况出发，若只有1/2/3级，一步跨完，算一种方法，其他方法交给另外两个climb
    elif n>0:
        count = climb(n-1)+climb(n-2)+climb(n-3)
    return count

装饰之后秒出结果，这就是算法的魅力！使用cache也是加速递归最常用的思想

问题：如何保存原函数的信息

函数中保存着一些必要的信息

print(climb.__name__)   # 函数名
print(climb.__doc__)    # 函数文档字符串
print(climb.__module__) # 所属模块
print(climb.__dict__)   # 属性字典
print(climb.__defaults__)   # 默认参数元组
print(climb.__annotations__)    # 参数及返回值注释  {'n': , 'return': }

使用装饰器后，返回的就是wrap函数的信息了，怎么整？

我们可以在装饰器中将wrap的信息替换为func的，wraps装饰器帮我们实现了

from functools import update_wrapper, wraps
# wraps是装饰器，内部调用update_wrapper

def deco(func):
    @wraps(func)
    def wrap(*args):
        '''
        这是wrap的文档
        :param args:
        :return:
        '''
        return func()   # 被装饰函数有返回值就要return
    return wrap

@deco
def func(a):
    '''
    func的文档
    :param a:
    :return:
    '''
    print(a)

print(func.__doc__)

问题：如何定义带参数的装饰器

场景：使用装饰器检测函数参数类型，不同函数参数长度、类型不一，这就需要给装饰器定义参数
这个需求也可以理解为：生产装饰器的装饰器！

实现类型的检查，可以通过绑定参数实现，用inspect，下面是例子：

import inspect  # Get useful information from live Python objects.

def func1(a,b,c):
    print(a,b,c)

func1_sig = inspect.signature(func1)    # 得到函数的签名
bind = func1_sig.bind(int,int,str)  # 一一对应，给函数参数绑定类型值
print(bind.arguments)   # {'a': , 'b': , 'c': }

可以将传递给装饰器的参数类型和函数调用时的参数值分别绑定到函数，校验！

def deco_wrap(*typet, **typed):
    def deco(func):
        func_sig = inspect.signature(func)
        # 绑定正确参数类型
        bind = func_sig.bind_partial(*typet, **typed).arguments  # 不一定全部绑定
        def wrap(*args, **kwargs):  # 绑定参数值
            for name, value in func_sig.bind(*args, **kwargs).arguments.items():	# 这里可以使用bind，因为是绑定值，不传入所需参数直接报错
                right_type = bind[name]
                if right_type:
                    if not isinstance(value, right_type):
                        raise TypeError("not match, %s must be %s type"%(name, right_type))
            return func(*args, **kwargs)
        return wrap
    return deco

@deco_wrap(int, str)
def func2(a,b):
    print(a,b)

func2(1,2)  # TypeError: not match, b must be  type

问题：如何实现属性可修改的函数装饰器

场景

统计被装饰函数的单次运行时间
如果时间大于timeout，就记录到log中
能动态的修改timeout参数

import random
import logging
import time

def deco_wrap(timeout):
    def deco(func):
        def wrap(*args):
            t0 = time.time()
            res = func(*args)
            use = time.time() - t0
            if use>timeout:
                logging.warning("%s %s %s"%(func.__name__, use, timeout))   # 控制台打印
            return res
            
        def set_time(new_timeout):
            nonlocal timeout    # 类似于函数中使用全局变量，global一下
            timeout = new_timeout   # 修改成功

        wrap.set_time = set_time    # 给定调用方法，用deco返回；相当于wrap的子函数
        return wrap
    return deco

@deco_wrap(1.0)
def func(i):
    while random.randint(0,1):
        time.sleep(0.5)
    print('in func[%d]'%i)

if __name__ == '__main__':
    for i in range(15):
        func(i)
        if i==5:
            func.set_time(1.5)	# 调用装饰后的函数修改

重点是学习装饰器内部定义多个函数并返回调用的方法
在程序中如果不是面向对象式编程（class中用self，一样的道理），必须要用global参数，函数才能访问外部全局变量

问题：如何在类中定义装饰器

上一个问题中，我们需要在函数中使用外部的变量，能否通过类的属性实现变量的全局传递呢？

当然可以！道理是相同的，Demo如下：

import time
import logging

DEFAULT_FORMAT = '%(func_name)s -> %(call_time)s\t%(used_time)s\t%(call_n)s'

class CallInfo:
    def __init__(self, log_path, format_=DEFAULT_FORMAT, on_off=True):
        self.log = logging.getLogger(log_path)
        self.log.addHandler(logging.FileHandler(log_path))
        self.log.setLevel(logging.INFO)
        self.format = format_
        self.is_on = on_off
    
    # 装饰器方法
    def info(self, func):
        _call_n = 0
        def wrap(*args, **kwargs):
            func_name = func.__name__
            call_time = time.strftime('%x %X', time.localtime())
            t0 = time.time()
            res = func(*args, **kwargs)
            used_time = time.time() - t0
            nonlocal _call_n
            _call_n += 1
            call_n = _call_n
            if self.is_on:
                self.log.info(self.format % locals())
            return res
        return wrap

    def set_format(self, format_):
        self.format = format_	# 便于修改属性

    def turn_on_off(self, on_off):
        self.is_on = on_off

# 测试代码
import random

ci1 = CallInfo('mylog1.log')	# 带参数的装饰器，但参数被维护在构造方法里
ci2 = CallInfo('mylog2.log')
@ci1.info
def f():
    sleep_time = random.randint(0, 6) * 0.1
    time.sleep(sleep_time)
            
@ci1.info
def g():
    sleep_time = random.randint(0, 8) * 0.1
    time.sleep(sleep_time)

@ci2.info
def h():
    sleep_time = random.randint(0, 7) * 0.1
    time.sleep(sleep_time)

for _ in range(30):
    random.choice([f, g, h])()

ci1.set_format('%(func_name)s -> %(call_time)s\t%(call_n)s')	# 直接使用实例对象调用方法修改，相当于将函数全部托管给类
for _ in range(30):
    random.choice([f, g])()

print(type(g))  #  是的，已经属于类了

把类的实例方法作为装饰器，在wrap函数中就可以持有实例对象，便于修改属性和拓展功能！
装饰一个函数就实例化一个对象吧，避免牵一发而动全身！

小结

至此，总结了大部分的实用编程技巧，还有很多需要在工作中改进学习的地方，逐步积累！

你可能感兴趣的:(Python基础,python,多线程)

量子计算如何颠覆能源优化领域：从理论到实践 Echo_Wish 人工智能前沿技术量子计算能源
量子计算如何颠覆能源优化领域：从理论到实践大家好，我是Echo_Wish，一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天，我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势，也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用，量子计算已经在一些能源相关领域崭露头角，例如电网优化、可再生能源分配和物流节能规划。以下，让我们一步
Kibana 单机与集群部署教程闲人编程大数据集群部署教程大数据集群单机部署 Kibana 日志分析数据可视化
目录Kibana单机与集群部署教程第一部分：Kibana概述第二部分：Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现（Python）3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分：Kibana集群部署教程1.配置集群节点1.1配置Elasticse
CV如何开启多摄像头并且多线程艾米莉亚小汉堡 opencv python 计算机视觉
常规importcv2cv.imshow("窗口名称",照片)这个是开启窗口最为常见的方式开启摄像头读取图片一个简易的开启本机摄像头重要语句cv2.VideoCapturecap1.readimshowreleasedestoryAllWindowsimportcv2cap1=cv2.VideoCapture(0)#开启本机的摄像头#也可以是视频流#cap2=cv2.VideoCapture("r
INCA二次开发GUI实例化智海行舟 python 个人开发
【摘要】本文基于ETASINCA二次开发实践，深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术，实现从软件架构设计到功能模块开发的完整闭环，为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域，ETASINCA作为行业标准标定工具，其自动化测试需求日益增长。传统的手动操作模式存在以下痛点：重复性操作耗时严重（单
如何通过API用Python获取北向资金流向数据？量化问财量化软件 QMT 量化交易 Python 量化炒股 PTrade QMT 量化交易量化软件 deepseek
推荐阅读：《【最全攻略】免费的量化软件有哪些？券商的交易接口怎么获取？》如何通过API用Python获取北向资金流向数据？北向资金指的是通过沪港通和深港通渠道，从香港市场流入A股市场的资金。对于投资者来说，了解北向资金流向对于把握市场趋势和投资决策具有重要意义。本文将介绍如何通过API用Python获取北向资金流向数据。理解北向资金流向数据北向资金流向数据主要包括以下几个方面：资金流入量：指通过沪
go执行java -jar 完成DSA私钥解析并签名 DavidSoCool java jar golang
起因，最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程，在百度提供的代码示例里面没有go代码的支持，示例中仅有php、python2和3、java的代码，网上找了半天发现go中对DSA私钥解析支持不友好，然后决定使用在java中完成签名计算过程，生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明：1）权限开通后，登录百度联盟媒体平台（union.baidu.com）
【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
视频下载插件：yt-dlp 小怪兽长大啦 python
Yt-dlp插件使用下载方法方法一：Python插件下载使用pip工具安装即可:pipinstallyt-dlp.Python已经配置过环境变量，下载yt-dlp时不需要配置。方法二：直接下载EXE可执行文件网上下载yt-dlp应用程序：https://github.com/yt-dlp/yt-dlp/releases配置环境变量。常用使用命令（配置好环境变量后，控制台下输入命令即可）直接下载视频
Python __init__.py 模块详解鱼丸丶粗面 Python __init__.py
文章目录1概述2导入演示2.1执行顺序：先父后子2.2导入所有模块（含子模块）1概述1.工具:Pycharm场景:在创建一个PythonPackage时，会默认在该包下生成一个'__init__.py'文件2.目的:'进行一些初始化操作'(1)当importpackage时，"自动"执行'__init__.py'文件中的内容(2)常用于导入模块2导入演示2.1执行顺序：先父后子目录结构：目录结构简
Python __init__.py 愚昧之山绝望之谷开悟之坡 python init
Python__init__.py作用详解尼古拉苏关注12018.06.1012:57:34字数745阅读45,278转载于：https://www.cnblogs.com/tp1226/p/8453854.html__init__.py该文件的作用就是相当于把自身整个文件夹当作一个包来管理，每当有外部import的时候，就会自动执行里面的函数。1.标识该目录是一个python的模块包（modul
从零打造工业级智能二维码识别系统：基于PyQt5与ZXingCpp的实战指南蜡笔小新星 PyQt5 qt 开发语言 python 图像处理经验分享 pyqt 扫码读码解码
文章目录第一章：系统全景解析1.1实时识别工作流图解1.2界面布局与功能分区说明1.3代码文件结构树形图第二章：环境搭建与依赖管理2.1必需组件清单2.2虚拟环境配置步骤2.3摄像头硬件检测方法第三章：多线程视频采集3.1VideoThread类设计剖析3.2图像采集核心循环3.3线程安全停止机制3.4信号槽通信实例第四章：图像预处理流水线4.1预处理方法开关实现4.2自适应二值化算法4.3图像格
机器学习之线性代数珠峰日记 AI理论与实践机器学习线性代数人工智能
文章目录一、引言：线性代数为何是AI的基石二、向量：AI世界的基本构建块（一）向量的定义（二）向量基础操作（三）重要概念三、矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉（五）自然语言处理一、引言：线性代数为何是AI的基石在人工智能领
有趣的学习Python-第十篇：Python的“魔法宝库”：标准库之旅王盼达有趣的学习Python 学习 python 开发语言
Python不仅是一门强大的编程语言，更像是一座充满宝藏的“魔法宝库”，里面装满了各种各样的“魔法工具”（标准库）。这些“魔法工具”可以帮助你轻松地完成各种任务，从文件操作到网络编程，从数据处理到性能优化。接下来，让我们一起探索Python的“魔法宝库”，看看这些“魔法工具”到底有多神奇！10.1操作系统接口：与“魔法世界”互动os模块就像是一个“魔法接口”，可以帮助你与操作系统进行互动。你可以用
有趣的学习Python-第八篇：Python的“魔法盾牌”：错误与异常处理王盼达有趣的学习Python 学习 python 开发语言
在Python的魔法世界里，即使是经验丰富的魔法师也可能遇到一些“魔法失误”。这些失误分为两种：语法错误和异常。别担心，Python为你准备了一面强大的“魔法盾牌”，帮助你应对这些挑战。8.1语法错误：魔法咒语写错了语法错误就像是你在念魔法咒语时，不小心说错了单词。这是学习Python过程中最常见的问题。比如，你可能忘记在while循环后面加上冒号：whileTrueprint('Hellowor
Python字符串操作 weixin_30871905 python
转自http://blog.chinaunix.net/u/19742/showart_382176.html#Python字符串操作'''1.复制字符串'''#strcpy(sStr1,sStr2)sStr1='strcpy'sStr2=sStr1sStr1='strcpy2'printsStr2'''2.连接字符串'''#strcat(sStr1,sStr2)sStr1='strcat'sSt
零基础必看！CCF-GESP Python一级考点全解析：运算符这样学就对了奕澄羽邦 python 开发语言
第一章编程世界的基础工具：运算符三剑客在Python编程语言中，运算符如同魔法咒语般神奇。对于CCF-GESPPython一级考生而言，正确掌握比较运算符、算术运算符和逻辑运算符这三大基础工具，就相当于打开了数字世界的大门。这三个运算符家族共同构成了程序逻辑的核心骨架，其灵活组合能实现从简单计算到复杂判断的多样功能。1.1运算符分类图谱算术运算符：负责数字间的数学运算（+-*/%）比较运算符：用于
Python 字符串操作 iteye_13776 Python Python C C++C#
Python截取字符串使用变量[头下标:尾下标]，就可以截取相应的字符串，其中下标是从0开始算起，可以是正数或负数，下标可以为空表示取到头或尾。#例1：字符串截取str='12345678'printstr[0:1]>>1#输出str位置0开始到位置1以前的字符printstr[1:6]>>23456#输出str位置1开始到位置6以前的字符num=18str='0000'+str(num)#合并字
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
学习笔记10——并发编程2线程安全问题与同步机制码代码的小仙女高级开发必备技能 java知识学习笔记
线程安全问题与同步机制线程安全的本质问题线程安全问题源于多线程环境下对共享资源（数据或状态）的非原子性、非可见性、非有序性访问，导致程序行为不符合预期。主要表现如下：竞态条件（RaceCondition）：多个线程对同一资源进行非原子操作，导致结果依赖线程执行顺序。示例：两个线程同时执行count++（非原子操作，实际包含读-改-写三步）。内存可见性问题：线程修改共享变量后，其他线程无法立即看到最
Python控制批量插入Catia文件并修改文件定义及PN 一盘红烧肉 python
改了两天，总算初步摸清楚了Catia中的文件结构，实现了使用Python控制批量修改文件名及定义使用Pycatia在Product中插入Part并改名及定义
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
三种优化算法旅者时光算法算法 python 开发语言
本文将总结遗传算法、粒子群算法、模拟退火三种优化算法的核心思路，并使用python完整实现。实际上，越来越多的优秀算法已经被封装为一个易用的接口。很多时候，一行代码就能实现我们的需求。但了解这些算法的基本逻辑，能够使用最基本的代码实现它。无论对于提升我们的编程能力还是解决问题的能力，都会大有裨益。甚至，改变我们思考问题的方式。1、遗传算法遗传算法，顾名思义，就是借鉴了生物通过遗传变异来逐渐适应环境
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出