fzyz_sb

Python标准库学习笔记2：数据结构

1. 概述

collections模块包含多种数据结构的实现,扩展了其他模块中的相应结构.例如,Deque是一个双端队列,允许从任意一端增加或删除元素.defaultdict是一个字典,如果找不到某个键,它会响应一个默认值,而OrderedDict会记住增加元素的序列.namedtuple扩展了一般的tuple,除了为每个成员元素提供一个数值索引外还提供一个属性名.

对于大量数据,array会比list更高效的利用内存.由于array仅限于一种数据类型,与通用的list相比,它可以采用一种更紧凑的内存表示.而且list的很多方法同样适用于array.

list包含一个sort()方法.但是heapq为有序表,函数可以修改列表的内容,并且以很低的开销维护列表原来的顺序.

构建有序列表或数组还可以使用bisect.

使用list的insert()和pop()方法模拟队列,不是线程安全的.要完成线程间的实序通信,可以使用Queue模块.multiprocessing包含一个Queue的版本,它会处理进程间的通信,从而能更容易的将一个多线程程序转换为使用进程而不是线程.

struct对于解码另一个应用的数据(例如Windows下的二进制数据)会很有用,可以将这些数据解码为Python的内置类型,以便处理.

对于高度互连的数据结构,如图和树,可以使用weakref维护引用,同时当不再需要某些对象时仍允许垃圾回收器进行清理.copy中的函数用于复制数据结构及其内容,包括用deepcopy()完成递归复制.

可以使用pprint来创建易读的表示.

2. collections---容器数据类型

作用:容器数据类型

Python版本:2.4及以后版本

collections模块包含内置类型list,dict和tuple以外的其他容器数据类型

1. Counter

Counter作为一个容器,可以跟踪相同的值增加了多少次.

Counter支持3中形式的初始化.调用Counter的构造函数时可以提供一个元素序列或者一个包含键和计数的字典,还可以使用关键字参数将字符串名映射到计数:

>>> import collections
>>> collections.Counter(['a', 'b', 'c', 'a', 'b', 'b'])
Counter({'b': 3, 'a': 2, 'c': 1})
>>> collections.Counter({'a':2, 'b':3, 'c':1})
Counter({'b': 3, 'a': 2, 'c': 1})
>>> collections.Counter(a = 2, b = 3, c = 1)
Counter({'b': 3, 'a': 2, 'c': 1})

由于返回的是一个字典,我们可以通过update来增加数据,通过items来查看数据,用elements来查看所有的数据:

>>> c = collections.Counter()
>>> c
Counter()
>>> c.update('abcdaab')
>>> c
Counter({'a': 3, 'b': 2, 'c': 1, 'd': 1})
>>> c.update({'a':1, 'd':5})
>>> c
Counter({'d': 6, 'a': 4, 'b': 2, 'c': 1})
>>> for key, value in c.items():
	print key, ' => ', value

	
a  =>  4
c  =>  1
b  =>  2
d  =>  6
>>> c.elements()
<itertools.chain object at 0x0000000002C97390>
>>> list(c.elements())
['a', 'a', 'a', 'a', 'c', 'b', 'b', 'd', 'd', 'd', 'd', 'd', 'd']

使用most_common()可以生成一个序列,其中包含n个最常遇见的输入值及其相应计数(类似于字典,通过值进行排序即可)

>>> c = collections.Counter()
>>> c.update({'a':5, 'b':3, 'c':11, 'd':23, 'e':2})
>>> for letter, count in c.most_common(3):
	print '%s: %d' % (letter, count)

	
d: 23
c: 11
a: 5

但字典本身是一个哈希结构,不是一个可用于排序的可迭代其对象.所以无法使用字典实现上述的需求.

而Counter甚至支持算术和集合操作来完成结果的聚集:

>>> import collections
>>> c1 = collections.Counter(['a', 'b', 'c', 'a', 'b', 'b'])
>>> c2 = collections.Counter('alphabet')
>>> c1
Counter({'b': 3, 'a': 2, 'c': 1})
>>> c2
Counter({'a': 2, 'b': 1, 'e': 1, 'h': 1, 'l': 1, 'p': 1, 't': 1})
>>> c1 + c2
Counter({'a': 4, 'b': 4, 'c': 1, 'e': 1, 'h': 1, 'l': 1, 'p': 1, 't': 1})
>>> c1 - c2
Counter({'b': 2, 'c': 1})
>>> c1 & c2
Counter({'a': 2, 'b': 1})

2. defaultdict

标准字典包括一个方法setdefault()来获取一个值,如果这个值不存在则建立一个默认值.defaultdict初始化容器时会让调用者提前指定默认值.

>>> import collections
>>> def default_factory():
	return 'default value'

>>> d = collections.defaultdict(default_factory, foo='bar')
>>> d
defaultdict(<function default_factory at 0x0000000002C929E8>, {'foo': 'bar'})
>>> d['foo']
'bar'
>>> d['bar']
'default value'

3. deque

deque(双端队列)支持从任意一端增加和删除元素.

>>> d = collections.deque('abcdefg')
>>> d
deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
>>> del d
>>> d = collections.deque()
>>> d.extend('abcdefg')
>>> d.append('h')
>>> d
deque(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
>>> d2 = collections.deque()
>>> d2.extendleft(range(6))
>>> d2.appendleft(6)
>>> d2
deque([6, 5, 4, 3, 2, 1, 0])
>>> d2.pop()
0
>>> d2.popleft()
6
>>> d2
deque([5, 4, 3, 2, 1])

由于双端队列是线程安全的,所以甚至可以在不同线程中同时从两端利用队列的内容:

import collections
import threading
import time

candle = collections.deque(range(5))

def burn(direction, nextSource):
    while True:
        try:
            next = nextSource()
        except IndexError:
            break
        else:
            print '%8s: %s' % (direction, next)
            time.sleep(0.1)
    print '%8s donw' % direction
    return

if __name__ == "__main__":
    left = threading.Thread(target=burn, args=('Left', candle.popleft))
    right = threading.Thread(target=burn, args=('Right', candle.pop))

    left.start()
    right.start()

    left.join()
    right.join()

解释器显示如下:

>>> 
    Left: 0   Right: 4

   Right: 3    Left: 1

   Right: 2    Left donw

   Right donw

而deque有一个很有用的功能:可以按任意一个方向旋转,而跳过一些元素.

>>> import collections
>>> d = collections.deque(range(10))
>>> d
deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> d.rotate(2)
>>> d
deque([8, 9, 0, 1, 2, 3, 4, 5, 6, 7])
>>> d = collections.deque(range(10))
>>> d.rotate(-2)
>>> d
deque([2, 3, 4, 5, 6, 7, 8, 9, 0, 1])

4. namedtuple

标准tuple使用数值索引来访问其成员

bob = ('Bob', 30, 'male')
print 'Representation:', bob

jane = ('jane', 29, 'female')
print '\nFields by index:', jane[0]

print '\nFields by index:'
for p in [bob, jane]:
    print '%s is a %d year old %s' % p

解释器显示如下:

>>> 
Representation: ('Bob', 30, 'male')

Fields by index: jane

Fields by index:
Bob is a 30 year old male
jane is a 29 year old female

由于使用tuple时需要记住对应各个值要使用哪个索引,这可能导致错误,特别是当tuple有大量字段,而且元组的构造和使用相距很远时.对于各个成员,namedtuple除了指定数值索引外,还会指定名字(可以理解为具有排序的字典结构).

import collections

Person = collections.namedtuple('Person', 'name age gender')

print 'Type of Person', type(Person)

bob = Person(name='Bob', age=30, gender='male')
print '\nRepresentation:', bob

jane = Person(name='jane', age=29, gender='female')
print '\nField by name:', jane.name

print '\nFields by index:'
for p in [bob, jane]:
    print '%s is a %d year old %s' % p

解释器显示如下:

>>> 
Type of Person <type 'type'>

Representation: Person(name='Bob', age=30, gender='male')

Field by name: jane

Fields by index:
Bob is a 30 year old male
jane is a 29 year old female

如果字段名重复或与Python关键字冲突,就是非法字段名:

import collections

try:
    collections.namedtuple('Person', 'name class age gender')
except ValueError, err:
    print err

try:
    collections.namedtuple('Person', 'name age gender age')
except ValueError, err:
    print err

解释器显示如下:

>>> 
Type names and field names cannot be a keyword: 'class'
Encountered duplicate field name: 'age'

如果创建一个namedtuple时要基于在程序控制之外的值(如表示一个数据库查询返回的记录行,而且数据库模式事先并不知道),要将rename选项设置为True,从而对非法字段重命名:

import collections

with_class = collections.namedtuple('Person', 'name class age gender', rename = True)
print with_class._fields

two_ages = collections.namedtuple('Person', 'name age gender age', rename = True)
print two_ages._fields

解释器显示如下:

>>> 
('name', '_1', 'age', 'gender')
('name', 'age', 'gender', '_3')

5. OrderedDict

OrderedDict是一个字典子类,可以记住其内容增加的顺序.

>>> import collections
>>> d1 = {}
>>> d1['a'] = 'A'
>>> d1['b'] = 'B'
>>> d1['c'] = 'C'
>>> d2 = collections.OrderedDict()
>>> d2['a'] = 'A'
>>> d2['b'] = 'B'
>>> d2['c'] = 'C'
>>> d1
{'a': 'A', 'c': 'C', 'b': 'B'}
>>> d2
OrderedDict([('a', 'A'), ('b', 'B'), ('c', 'C')])

而且判断是否相等时候,元素增加的顺序也是考虑的一个因素.

>>> import collections
>>> d1 = {}
>>> d1['a'] = 'A'
>>> d1['b'] = 'B'
>>> d1['c'] = 'C'
>>> d2 = {}
>>> d2['c'] = 'C'
>>> d2['b'] = 'B'
>>> d2['a'] = 'A'
>>> d1 == d2
True
>>> d1 = collections.OrderedDict()
>>> d1['a'] = 'A'
>>> d1['b'] = 'B'
c
>>> d1['c'] = 'C'
>>> d2 = collections.OrderedDict()
>>> d2['c'] = 'C'
>>> d2['b'] = 'B'
>>> d2['a'] = 'A'
>>> d1 == d2
False

3. array---固定类型数据序列

作用:高效管理固定类型数值数据的序列

Python版本:1.4及以后版本

array模块定义了一个序列数据结构,和list类似但是所有成员都必须是相同的基本类型.

array实例化时可以提供一个参数来描述允许哪种数据类型,还可以有一个初始的数据序列存储在数组中.array支持的操作包括分片,迭代以及向末尾增加元素.

import array

a = array.array('i', range(3))
print 'Initial:', a

a.extend(range(4, 6))
print 'Extended:', a

print 'Slice:', a[2:5]

print 'Iterator:'
print list(enumerate(a))

解释器显示如下:

>>> 
Initial: array('i', [0, 1, 2])
Extended: array('i', [0, 1, 2, 4, 5])
Slice: array('i', [2, 4, 5])
Iterator:
[(0, 0), (1, 1), (2, 2), (3, 4), (4, 5)]

我们可以使用高效读/写文件的专用内置方法将数组的内容写入文件或从文件读入数组:

import array
import binascii
import tempfile

a = array.array('i', range(5))
print 'A1:', a

output = open('test.txt', 'w')
a.tofile(output)
output.flush()
output.close()

with open('test.txt', 'rb') as input:
    raw_data = input.read()
    print 'Raw Contents:', binascii.hexlify(raw_data)

    input.seek(0)
    a2 = array.array('i')
    a2.fromfile(input, len(a))
    print 'A2:', a2

解释器显示如下:

>>> 
A1: array('i', [0, 1, 2, 3, 4])
Raw Contents: 0000000001000000020000000300000004000000
A2: array('i', [0, 1, 2, 3, 4])

如果数组中的数据没有采用固有的字节顺序,或者在发送到一个采用不同字节顺序的系统(或在网络上发送)之前需要交换顺序,可以由Python转换整个数组而无须迭代处理每一个元素:

import array
import binascii

def to_hex(a):
    chars_per_item = a.itemsize
    hex_version = binascii.hexlify(a)
    num_chunks = len(hex_version)
    for i in range(num_chunks):
        start = i * chars_per_item
        end = start + chars_per_item
        yield hex_version[start:end]

a1 = array.array('i', range(5))
a2 = array.array('i', range(5))
a2.byteswap()

fmt = '%10s %10s %10s %10s'
print fmt % ('A1 hex', 'A1', 'A2 hex', 'A2')
print fmt % (('-' * 10, ) * 4)
for values in zip(to_hex(a1), a1, to_hex(a2), a2):
    print fmt % values

解释器显示如下(运行环境是64位系统):

>>> 
    A1 hex         A1     A2 hex         A2
---------- ---------- ---------- ----------
      0000          0       0000          0
      0000          1       0000   16777216
      0100          2       0000   33554432
      0000          3       0001   50331648
      0200          4       0000   67108864

4. heapq---堆排序算法

最大堆确保父节点大于或等于其两个子节点.最小堆要求父节点小于或等于其子节点.Python的heapq模块实现了一个最小堆.

heapq_heapdata.py:

data = [19, 9, 4, 10, 11]

heapq_showtree.py:

import math
from cStringIO import StringIO

def show_tree(tree, total_width=36, fill=' '):
    """Pretty-print a tree."""
    output = StringIO()
    last_row = -1
    for i, n in enumerate(tree):
        if i:
            row = int(math.floor(math.log(i + 1, 2)))
        else:
            row = 0
        if row != last_row:
            output.write('\n')
        columns = 2 ** row
        col_width = int(math.floor((total_width * 1.0) / columns))
        output.write(str(n).center(col_width, fill))
        last_row = row
    print output.getvalue()
    print '-' * total_width
    print
    return

创建堆有两种基本方式:heappush()和heapify():

import heapq
from heapq_showtree import show_tree
from heapq_heapdata import data

heap = []
print 'random:', data
print

for n in data:
    print 'add %3d:' % n
    heapq.heappush(heap, n)
    show_tree(heap)

解释器显示如下:

>>> 
random: [19, 9, 4, 10, 11]

add  19:

                 19                 
------------------------------------

add   9:

                 9                  
        19        
------------------------------------

add   4:

                 4                  
        19                9         
------------------------------------

add  10:

                 4                  
        10                9         
    19   
------------------------------------

add  11:

                 4                  
        10                9         
    19       11   
------------------------------------

而使用heapify更加高效:

import heapq
from heapq_showtree import show_tree
from heapq_heapdata import data

print 'random   :', data
heapq.heapify(data)
print 'heapified:'
show_tree(data)

解释器显示如下:

>>>
random   : [19, 9, 4, 10, 11]
heapified:

                 4                  
        9                 19        
    10       11   
------------------------------------

一旦堆已经正确组织,就可以使用heappop()删除有最小值的元素:

import heapq
from heapq_showtree import show_tree
from heapq_heapdata import data

print 'random   :', data
heapq.heapify(data)
print 'heapified:'
show_tree(data)
print

for i in range(2):
    smallest = heapq.heappop(data)
    print 'pop  %3d:' % smallest
    show_tree(data)

解释器显示如下:

>>> 
random   : [19, 9, 4, 10, 11]
heapified:

                 4                  
        9                 19        
    10       11   
------------------------------------


pop    4:

                 9                  
        10                19        
    11   
------------------------------------

pop    9:

                 10                 
        11                19        
------------------------------------

而我们可以使用heapreplace()来删除现有元素并替换为新值:

import heapq
from heapq_showtree import show_tree
from heapq_heapdata import data

heapq.heapify(data)
print 'start:'
show_tree(data)
print

for i in [0, 13]:
    smallest = heapq.heapreplace(data, i)
    print 'replace %2d with %2d:' % (smallest, i)
    show_tree(data)

解释器显示如下:

>>> 
start:

                 4                  
        9                 19        
    10       11   
------------------------------------


replace  4 with  0:

                 0                  
        9                 19        
    10       11   
------------------------------------

replace  0 with 13:

                 9                  
        10                19        
    13       11   
------------------------------------

heapq还包括两个检查可迭代对象的函数,查找其中包含的最大值或最小值的范围:

import heapq
from heapq_showtree import show_tree
from heapq_heapdata import data

print 'all      :', data
print '3 largest:', heapq.nlargest(3, data)
print 'from sort:', list(reversed(sorted(data)[-3:]))
print '3 smallest:', heapq.nsmallest(3, data)
print 'from sort :', sorted(data)[:3]

解释器显示如下:

>>> 
all      : [19, 9, 4, 10, 11]
3 largest: [19, 11, 10]
from sort: [19, 11, 10]
3 smallest: [4, 9, 10]
from sort : [4, 9, 10]

5. bisect---维护有序列表

bisect模块实现了一个算法用于向列表中插入元素,同时仍然保持列表有序.我们通过insort()向一个列表中插入元素.

import bisect
import random

random.seed(1)

print 'New Pos Contents'
print '--- --- --------'

lst = []
for i in range(1, 15):
    r = random.randint(1, 100)
    #通过方法bisect来确定r的具体插入位置
    position = bisect.bisect(lst, r)
    #将r插入到列表中
    bisect.insort(lst, r)
    print '%3d %3d' % (r, position), lst

解释器显示如下:

>>> 
New Pos Contents
--- --- --------
 14   0 [14]
 85   1 [14, 85]
 77   1 [14, 77, 85]
 26   1 [14, 26, 77, 85]
 50   2 [14, 26, 50, 77, 85]
 45   2 [14, 26, 45, 50, 77, 85]
 66   4 [14, 26, 45, 50, 66, 77, 85]
 79   6 [14, 26, 45, 50, 66, 77, 79, 85]
 10   0 [10, 14, 26, 45, 50, 66, 77, 79, 85]
  3   0 [3, 10, 14, 26, 45, 50, 66, 77, 79, 85]
 84   9 [3, 10, 14, 26, 45, 50, 66, 77, 79, 84, 85]
 44   4 [3, 10, 14, 26, 44, 45, 50, 66, 77, 79, 84, 85]
 77   9 [3, 10, 14, 26, 44, 45, 50, 66, 77, 77, 79, 84, 85]
  1   0 [1, 3, 10, 14, 26, 44, 45, 50, 66, 77, 77, 79, 84, 85]

insort实际上等价于insort_right:在现有值后面插入新值.我们也可以使用insort_left在现有值之前插入新值.

import bisect
import random

random.seed(1)

print 'New Pos Contents'
print '--- --- --------'

lst = []
for i in range(1, 15):
    r = random.randint(1, 100)
    position = bisect.bisect_left(lst, r)
    bisect.insort_left(lst, r)
    print '%3d %3d' % (r, position), lst

6. Queue---线程安全的FIFO实现

作用:提供一个线程安全的FIFO实现

Python版本:至少1.4

Queue模块提供了一个适用于多线程编程的先进先出数据结构,可以用来在生产者和消费者线程之间安全的传递消息或其他数据.它会为调用者处理锁定,使多个线程可以安全的处理同一个Queue实例.Queue的大小(其中包含的元素个数)可能要受限,以限制内存使用或处理.

1. 基本FIFO队列

使用put()将元素增加到序列一端,使用get()从另一端剔除.

import Queue

q = Queue.Queue()

for i in range(5):
    q.put(i)

while not q.empty():
    print q.get(),
print

解释器显示如下:

>>> 
0 1 2 3 4

2. LIFO队列

LifoQueue使用了后进先出顺序:

import Queue

q = Queue.LifoQueue()

for i in range(5):
    q.put(i)

while not q.empty():
    print q.get(),
print

解释器显示如下:

>>> 
4 3 2 1 0

3. 优先队列

优先队列是:元素的处理顺序需要根据这些元素的特性来决定.

import Queue
import threading

class Job(object):
    def __init__(self, priority, description):
        self.priority = priority
        self.description = description
        print 'New job:', description
    def __cmp__(self, other):
        return cmp(self.priority, other.priority)

q = Queue.PriorityQueue()
q.put(Job(3, 'Mid-level job'))
q.put(Job(10, 'Low-level job'))
q.put(Job(1, 'Important job'))

def process_job(q):
    while True:
        next_job = q.get()
        #这里之所以要用'A %s' % B,而不是'A ', B,是因为多线程情况下,第二种方式会输出混乱
        print 'Processing job:%s\n' % next_job.description
        q.task_done()

workers = [threading.Thread(target=process_job, args = (q,)),
           threading.Thread(target=process_job, args = (q,)),]

for w in workers:
    w.setDaemon(True)
    w.start()

q.join()

解释器显示如下:

>>> 
New job: Mid-level job
New job: Low-level job
New job: Important job
Processing job:Important job
Processing job:Mid-level job


Processing job:Low-level job

7. struct---二进制数据结构

作用:在字符串和二进制数据之间转换

Python版本:1.4及以后版本

struct模块包括一些在字节串与内置Python数据类型(如数字和字符串)之间完成转换的函数.

1. 打包和解包

Struct支持使用格式指示符将数据打包为字符串,以及从字符串解包数据,格式指示符由表示数据类型的字符以及可选的数量及字节序指示符构成.

我们使用pack来打包数据,unpack来解包数据:

import struct
import binascii

values = (1, 'ab', 2.7)
s = struct.Struct('I 2s f')
packed_data = s.pack(*values)
print 'Original values:', values
print 'Format string  :', s.format
print 'Uses           :', s.size, 'bytes'
print 'Packed Value   :', binascii.hexlify(packed_data)

packed_data = binascii.unhexlify(binascii.hexlify(packed_data))
unpacked_data = s.unpack(packed_data)
print 'Unpacked Values:', unpacked_data

解释器显示如下:

>>> 
Original values: (1, 'ab', 2.7)
Format string  : I 2s f
Uses           : 12 bytes
Packed Value   : 0100000061620000cdcc2c40
Unpacked Values: (1, 'ab', 2.700000047683716)

2. 字节序

默认情况下,值会使用内置C库的字节序来编码.只需在格式串中提供一个显式的字节序指令,就可以容易的覆盖这个默认选择:

import struct
import binascii

values = (1, 'ab', 2.7)
print 'Original vlaues:', values
endianness = [
    ('@', 'native, native'),
    ('=', 'native, standard'),
    ('<', 'little-endian'),
    ('>', 'big-endian'),
    ('!', 'network'),
    ]

for code, name in endianness:
    s = struct.Struct(code + ' I 2s f')
    packed_data = s.pack(*values)
    print
    print 'Format string    :', s.format, 'for', name
    print 'Uses             :', s.size, 'bytes'
    print 'Packed Value     :', binascii.hexlify(packed_data)
    print 'Unpacked Value   :', s.unpack(packed_data)

解释器显示如下:

>>> 
Original vlaues: (1, 'ab', 2.7)

Format string    : @ I 2s f for native, native
Uses             : 12 bytes
Packed Value     : 0100000061620000cdcc2c40
Unpacked Value   : (1, 'ab', 2.700000047683716)

Format string    : = I 2s f for native, standard
Uses             : 10 bytes
Packed Value     : 010000006162cdcc2c40
Unpacked Value   : (1, 'ab', 2.700000047683716)

Format string    : < I 2s f for little-endian
Uses             : 10 bytes
Packed Value     : 010000006162cdcc2c40
Unpacked Value   : (1, 'ab', 2.700000047683716)

Format string    : > I 2s f for big-endian
Uses             : 10 bytes
Packed Value     : 000000016162402ccccd
Unpacked Value   : (1, 'ab', 2.700000047683716)

Format string    : ! I 2s f for network
Uses             : 10 bytes
Packed Value     : 000000016162402ccccd
Unpacked Value   : (1, 'ab', 2.700000047683716)

3. 缓冲区

通常在重视性能情况下或者向扩展模块传入或传出数据时才会处理二进制打包数据.通过避免为每个打包结构分配一个新缓冲区所带来的开销,可以优化这些情况.pack_into()和unpack_from()方法支持直接写入预分配的缓冲区.

import struct
import binascii

s = struct.Struct('I 2s f')
values = (1, 'ab', 2.7)
print 'Original:', values

print
print 'ctypes string buffer'

import ctypes
b = ctypes.create_string_buffer(s.size)
print 'Before   :', binascii.hexlify(b.raw)
s.pack_into(b, 0, *values)
print 'After    :', binascii.hexlify(b.raw)
print 'Unpacked:', s.unpack_from(b, 0)
print
print 'array'

import array
a = array.array('c', '\0' * s.size)
print 'Before   :', binascii.hexlify(a)
s.pack_into(a, 0, *values)
print 'After    :', binascii.hexlify(a)
print 'Unpacked :', s.unpack_from(a, 0)

解释器显示如下:

>>> 
Original: (1, 'ab', 2.7)

ctypes string buffer
Before   : 000000000000000000000000
After    : 0100000061620000cdcc2c40
Unpacked: (1, 'ab', 2.700000047683716)

array
Before   : 000000000000000000000000
After    : 0100000061620000cdcc2c40
Unpacked : (1, 'ab', 2.700000047683716)

8. weakref---对象的非永久引用

作用:引用一个'昂贵'的对象,不过如果不再有其他非弱引用,则允许由垃圾回收器回收其内存.

Python版本:2.1及以后版本

weakref模块支持对象的弱引用.正常的引用会增加对象的引用计数,避免它被垃圾回收,但并不总是希望如此,比如有时可能会出现一个循环引用,或者有时可能要构建一个对象缓存,需要内存时则要删除这个缓存.弱引用是避免对象被自动清除的一个对象句柄.

1. 引用

对象的弱引用通过ref类管理.要获取原对象,可以调用引用对象.

import weakref

class ExpensiveObject(object):
    def __del__(self):
        print '(Deleting %s)' % self

obj = ExpensiveObject()
r = weakref.ref(obj)

print 'obj:', obj
print 'ref:', r
print 'r():', r()

print 'deleting obj'
del obj
#缓冲区并未并清除,如果为一般对象引用,则会引发异常
print 'r():', r()

解释器显示如下:

>>> 
obj: <__main__.ExpensiveObject object at 0x0000000002CE07B8>
ref: <weakref at 0000000002CDD688; to 'ExpensiveObject' at 0000000002CE07B8>
r(): <__main__.ExpensiveObject object at 0x0000000002CE07B8>
deleting obj
(Deleting <__main__.ExpensiveObject object at 0x0000000002CE07B8>)
r(): None

2. 引用回调

ref构造函数接受一个可选的回调函数,删除所引用的对象时会调用这个函数:

import weakref

class ExpensiveObject(object):
    def __del__(self):
        print '(Deleting %s)' % self

def callback(reference):
    """Invoked when referenced object is deleted"""
    print 'callback(', reference, ')'
    
obj = ExpensiveObject()
r = weakref.ref(obj, callback)

print 'obj:', obj
print 'ref:', r
print 'r():', r()

print 'deleting obj'
del obj
print 'r():', r()

解释器显示如下:

>>> 
obj: <__main__.ExpensiveObject object at 0x0000000002C50828>
ref: <weakref at 0000000002C4D6D8; to 'ExpensiveObject' at 0000000002C50828>
r(): <__main__.ExpensiveObject object at 0x0000000002C50828>
deleting obj
callback( <weakref at 0000000002C4D6D8; dead> )
(Deleting <__main__.ExpensiveObject object at 0x0000000002C50828>)
r(): None

3. 代理

使用代理比使用弱引用更为方便,但是代理也仅仅是一个引用,而非真正的对象:

import weakref

class ExpensiveObject(object):
    def __init__(self, name):
        self.name = name
    def __del__(self):
        print '(Deleting %s)' % self
    
obj = ExpensiveObject('My Object')
r = weakref.ref(obj)
p = weakref.proxy(obj)

print 'via obj:', obj.name
print 'via ref:', r().name
print 'via proxy:', p.name
del obj
print 'via proxy:', p.name

解释器显示如下:

>>> 
via obj: My Object
via ref: My Object
via proxy: My Object
(Deleting <__main__.ExpensiveObject object at 0x0000000002BC07B8>)
via proxy:

Traceback (most recent call last):
  File "C:\Python27\test.py", line 17, in <module>
    print 'via proxy:', p.name
ReferenceError: weakly-referenced object no longer exists

4. 循环引用

弱引用有一种用法,即在不阻止垃圾回收时允许循环引用.

weakref_graph.py:

import gc
from pprint import pprint
import weakref

class Graph(object):
    def __init__(self, name):
        self.name = name
        self.other = None
    def set_next(self, other):
        print '%s.set_next(%r)' % (self.name, other)
        self.other = other
    def all_nodes(self):
        "Generate the nodes in the graph sequence."
        yield self
        n = self.other
        while n and n.name != self.name:
            yield n
            n = n.other
        if n is self:
            yield n
        return
    def __str__(self):
        return '->'.join(n.name for n in self.all_nodes())
    def __repr__(self):
        return '<%s at 0x%x name=%s' % (self.__class__.__name__, id(self), self.name)
    def __del__(self):
        print '(Deleting %s)' % self.name
        self.set_next(None)
def collect_and_show_garbage():
    "Show what garbage is present."
    print 'Collecting...'
    n = gc.collect()
    print 'Unreachable objects:', n
    print 'Garbage:',
    pprint(gc.garbage)
def demo(graph_factory):
    print 'Set up graph:'
    one = graph_factory('one')
    two = graph_factory('two')
    three = graph_factory('three')
    one.set_next(two)
    two.set_next(three)
    three.set_next(one)

    print
    print 'Graph:'
    print str(one)
    collect_and_show_garbage()

    print
    three = None
    two = None
    print 'After 2 references removed:'
    print str(one)
    collect_and_show_garbage()

    print
    print 'Removing last reference:'
    one = None
    collect_and_show_garbage()

weakref_cycle.py:

import gc
from pprint import pprint
import weakref

from weakref_graph import Graph, demo, collect_and_show_garbage

gc.set_debug(gc.DEBUG_LEAK)

print 'Setting up the cycle'
print
demo(Graph)
print
print 'Breaking the cycle and cleaning up garbage'
print
gc.garbage[0].set_next(None)
while gc.garbage:
    del gc.garbage[0]
print
collect_and_show_garbage()

解释器显示如下:

>>> 
Setting up the cycle

Set up graph:
one.set_next(<Graph at 0x2ad0be0 name=two)
two.set_next(<Graph at 0x2adb5c0 name=three)
three.set_next(<Graph at 0x2ad0a58 name=one)

Graph:
one->two->three->one
Collecting...
Unreachable objects: 0
Garbage:[]

After 2 references removed:
one->two->three->one
Collecting...
Unreachable objects: 0
Garbage:[]

Removing last reference:
Collecting...
gc: uncollectable <Graph 0000000002AD0A58>
gc: uncollectable <Graph 0000000002AD0BE0>
gc: uncollectable <Graph 0000000002ADB5C0>
gc: uncollectable <dict 0000000002A36378>
gc: uncollectable <dict 00000000029F8488>
gc: uncollectable <dict 00000000029F88C8>
Unreachable objects: 6
Garbage:[<Graph at 0x2ad0a58 name=one,
 <Graph at 0x2ad0be0 name=two,
 <Graph at 0x2adb5c0 name=three,
 {'name': 'one', 'other': <Graph at 0x2ad0be0 name=two},
 {'name': 'two', 'other': <Graph at 0x2adb5c0 name=three},
 {'name': 'three', 'other': <Graph at 0x2ad0a58 name=one}]

Breaking the cycle and cleaning up garbage

one.set_next(None)
(Deleting two)
two.set_next(None)
(Deleting three)
three.set_next(None)
(Deleting one)
one.set_next(None)

Collecting...
Unreachable objects: 0
Garbage:[]

我们可以使用代理来进行回收:

import gc
from pprint import pprint
import weakref

from weakref_graph import Graph, demo

class WeakGraph(Graph):
    def set_next(self, other):
        if other is not None:
            if self in other.all_nodes():
                other = weakref.proxy(other)
        super(WeakGraph, self).set_next(other)
        return
demo(WeakGraph)

解释器显示如下:

>>> 
Set up graph:
one.set_next(<WeakGraph at 0x2b8d668 name=two)
two.set_next(<WeakGraph at 0x2b8d6d8 name=three)
three.set_next(<weakproxy at 0000000002B7DB38 to WeakGraph at 0000000002B80BA8>)

Graph:
one->two->three
Collecting...
Unreachable objects: 0
Garbage:[]

After 2 references removed:
one->two->three
Collecting...
Unreachable objects: 0
Garbage:[]

Removing last reference:
(Deleting one)
one.set_next(None)
(Deleting two)
two.set_next(None)
(Deleting three)
three.set_next(None)
Collecting...
Unreachable objects: 0
Garbage:[]

5. 缓存对象

WeakValueDictionary使用其中保存的值的弱引用,当其他代码不再实际使用这些值时允许将其垃圾回收.通过使用垃圾回收器的显式调用,由此说明了使用常规字典和WeakValueDictionary完成内存处理的差别.

import gc
from pprint import pprint
import weakref

gc.set_debug(gc.DEBUG_LEAK)

class ExpensiveObject(object):
    def __init__(self, name):
        self.name = name
    def __repr__(self):
        return 'ExpensiveObject(%s)' % self.name
    def __del__(self):
        print '     (Deleting %s)' % self

def demo(cache_factory):
    all_refs = {}
    print 'CACHE TYPE:', cache_factory
    cache = cache_factory()
    for name in ['one', 'two', 'three']:
        o = ExpensiveObject(name)
        cache[name] = o
        all_refs[name] = o
        del o
    print '     all_refs =',
    pprint(all_refs)
    print '\n   Before, cache contains:', cache.keys()
    for name, value in cache.items():
        print '     %s = %s' % (name, value)
        del value

    print '\n   Cleanup:'
    del all_refs
    gc.collect()

    print '\n   After, cache contains:', cache.keys()
    for name, value in cache.items():
        print '     %s = %s' % (name, value)
    print '     demo returning'
    return
demo(dict)
print

demo(weakref.WeakValueDictionary)

如果循环变量指示缓存的值,这些循环变量必须显式清除,从而使对象的引用计数减少,否则,垃圾回收器不会删除这些对象,它们仍会保留在缓存中.类似的,all_refs变量用来维护引用,避免它们过早的被垃圾回收.

>>> 
CACHE TYPE: <type 'dict'>
     all_refs ={'one': ExpensiveObject(one),
 'three': ExpensiveObject(three),
 'two': ExpensiveObject(two)}
 
   Before, cache contains: ['three', 'two', 'one']
     three = ExpensiveObject(three)
     two = ExpensiveObject(two)
     one = ExpensiveObject(one)

   Cleanup:

   After, cache contains: ['three', 'two', 'one']
     three = ExpensiveObject(three)
     two = ExpensiveObject(two)
     one = ExpensiveObject(one)
     demo returning
     (Deleting ExpensiveObject(three))
     (Deleting ExpensiveObject(two))
     (Deleting ExpensiveObject(one))

CACHE TYPE: weakref.WeakValueDictionary
     all_refs ={'one': ExpensiveObject(one),
 'three': ExpensiveObject(three),
 'two': ExpensiveObject(two)}
 
   Before, cache contains: ['three', 'two', 'one']
     three = ExpensiveObject(three)
     two = ExpensiveObject(two)
     one = ExpensiveObject(one)

   Cleanup:
     (Deleting ExpensiveObject(three))
     (Deleting ExpensiveObject(two))
     (Deleting ExpensiveObject(one))

   After, cache contains: []
     demo returning

9. copy---复制对象

作用:提供一些函数,可以使用浅副本或深副本语义复制对象

Python版本:1.4及以后版本

copy模块包括两个函数copy()和deepcopy(),用于复制现有的对象.

1. 浅副本

copy()创建一个副本,指向原对象内容的引用:

import copy

class MyClass:
    def __init__(self, name):
        self.name = name
    def __cmp__(self, other):
        return cmp(self.name, other.name)

a = MyClass('a')
my_list = [a]
dup = copy.copy(my_list)

print [id(x) for x in [my_list, dup]]
print [id(y) for x in [my_list, dup] for y in x]

解释器显示如下:

>>> 
[44632008L, 44573384L]
[44573512L, 44573512L]

2. 深副本

深副本是创建一个全新的副本,包括其内容.

import copy

class MyClass:
    def __init__(self, name):
        self.name = name
    def __cmp__(self, other):
        return cmp(self.name, other.name)

a = MyClass('a')
my_list = [a]
dup = copy.deepcopy(my_list)

print [id(x) for x in [my_list, dup]]
print [id(y) for x in [my_list, dup] for y in x]

解释器显示如下:

>>> 
[45615048L, 36209224L]
[45556552L, 45556424L]

3. 定制复制行为

我们可以改写__copy__()和__deepcopy__()来实现定制复制的行为:

import copy

class MyClass:
    def __init__(self, name):
        self.name = name
    def __cmp__(self, other):
        return cmp(self.name, other.name)
    def __copy__(self):
        print '__copy__()'
        return MyClass(self.name)
    def __deepcopy__(self, memo):
        print '__deepcopy__(%s)' % str(memo)
        return MyClass(copy.deepcopy(self.name, memo))

a = MyClass('a')

sc = copy.copy(a)
dc = copy.deepcopy(a)

解释器显示如下:

>>> 
__copy__()
__deepcopy__({})

4. 深副本中的递归

为了避免复制递归数据结构可能带来的问题,deepcopy()使用了一个字典跟踪已复制的对象.将这个字典传入__deepcopy__()方法,从而在该方法中也可以进行检查:

备注:这段代码不太理解

import copy
import pprint

class Graph:
    def __init__(self, name, connections):
        self.name = name
        self.connections = connections

    def add_connection(self, other):
        self.connections.append(other)

    def __repr__(self):
        return 'Graph(name=%s, id=%s)' % (self.name, id(self))

    def __deepcopy__(self, memo):
        print '\nCalling __deepcopy__ for %r' % self
        if self in memo:
            existing = memo.get(self)
            print '     Already copied to %r' % existing
            return existing
        print '     Memo dictionary:'
        pprint.pprint(memo, indent=4, width=40)
        dup = Graph(copy.deepcopy(self.name, memo), [])
        print '     Copying to new object %s' % dup
        memo[self] = dup
        for c in self.connections:
            dup.add_connection(copy.deepcopy(c, memo))
        return dup

root = Graph('root', [])
a = Graph('a', [root])
b = Graph('b', [a, root])
root.add_connection(a)
root.add_connection(b)

dup = copy.deepcopy(root)

解释器显示如下:

>>> 

Calling __deepcopy__ for Graph(name=root, id=45364872)
     Memo dictionary:
{   }
     Copying to new object Graph(name=root, id=45359816)

Calling __deepcopy__ for Graph(name=a, id=45363848)
     Memo dictionary:
{   Graph(name=root, id=45364872): Graph(name=root, id=45359816),
    34200192L: 'root',
    46032552L: ['root']}
     Copying to new object Graph(name=a, id=45361160)

Calling __deepcopy__ for Graph(name=root, id=45364872)
     Already copied to Graph(name=root, id=45359816)

Calling __deepcopy__ for Graph(name=b, id=45365512)
     Memo dictionary:
{   Graph(name=a, id=45363848): Graph(name=a, id=45361160),
    Graph(name=root, id=45364872): Graph(name=root, id=45359816),
    33255512L: 'a',
    34200192L: 'root',
    45363848L: Graph(name=a, id=45361160),
    45364872L: Graph(name=root, id=45359816),
    46032552L: [   'root',
                   'a',
                   Graph(name=root, id=45364872),
                   Graph(name=a, id=45363848)]}
     Copying to new object Graph(name=b, id=45331720)

10. pprint---美观打印数据结构

作用:美观打印数据结构

Python版本: 1.4及以后版本

测试数据pprint_data.py:

data = [(1, {'a' : 'A', 'b' : 'B', 'c' : 'C', 'd' : 'D'}),
        (2, {'e' : 'E', 'f' : 'F', 'g' : 'G', 'h' : 'H',
             'i' : 'I', 'j' : 'J', 'k' : 'K', 'l' : 'L'}),]

1. 打印

from pprint import pprint

from pprint_data import data

print 'PRINT:'
print data
print
print 'PPRINT:'
pprint(data)

解释器显示如下:

>>> 
PRINT:
[(1, {'a': 'A', 'c': 'C', 'b': 'B', 'd': 'D'}), (2, {'e': 'E', 'g': 'G', 'f': 'F', 'i': 'I', 'h': 'H', 'k': 'K', 'j': 'J', 'l': 'L'})]

PPRINT:
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]

2. 格式化

要格式化一个数据结构而不把它直接写至一个流,可以使用pformat()来构造一个字符串表示.

from pprint import pformat
from pprint_data import data
import logging

logging.basicConfig(level=logging.DEBUG, format='%(levelname)-8s %(message)s',)

logging.debug('Logging pformatted data')
formatted = pformat(data)
for line in formatted.splitlines():
    logging.debug(line.rstrip())

解释器显示如下:

>>> 
DEBUG    Logging pformatted data
DEBUG    [(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
DEBUG     (2,
DEBUG      {'e': 'E',
DEBUG       'f': 'F',
DEBUG       'g': 'G',
DEBUG       'h': 'H',
DEBUG       'i': 'I',
DEBUG       'j': 'J',
DEBUG       'k': 'K',
DEBUG       'l': 'L'})]

3. 任意类

通过定制__repr__()来定制特定的输出:

from pprint import pprint

class node(object):
    def __init__(self, name, contents = []):
        self.name = name
        self.contents = contents[:]
    def __repr__(self):
        return ('node(' + repr(self.name) + ', ' +
                repr(self.contents) + ')')

trees = [node('node-1'),
         node('node-2', [node('node-2-1')]),
         node('node-3', [node('node-3-1')]),]

pprint(trees)

解释器显示如下:

>>> 
[node('node-1', []),
 node('node-2', [node('node-2-1', [])]),
 node('node-3', [node('node-3-1', [])])]

4. 递归

递归数据结构由指向原数据源的引用来表示:

>>> ll = [1, 2]
>>> ll.append(ll)
>>> ll
[1, 2, [...]]
>>> pprint(ll)
[1, 2, <Recursion on list with id=47206664>]

5. 限制嵌套输出

我们可以指定depth来制定输出的层次:

>>> ll = [1, 2, [3, 4, [5, 6]]]
>>> pprint(ll, depth=2)
[1, 2, [3, 4, [...]]]

6. 控制输出宽度

使用width来控制输出宽度

from pprint import pprint
from pprint_data import data

for width in [80, 5]:
    print 'WIDTH =', width
    pprint(data, width=width)
    print

解释器显示如下:

>>> 
WIDTH = 80
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]

WIDTH = 5
[(1,
  {'a': 'A',
   'b': 'B',
   'c': 'C',
   'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]

你可能感兴趣的:(Python标准库学习笔记2：数据结构)

【DevOps工具篇】Keycloak安装配置及脚本化小涵 DevOps企业级项目实战 devops 运维 keycloak
目录脚本化要求步骤步骤1：安装并启动Keycloak服务器[](#step-1-installing-and-starting-the-keycloak-server)分发文件进行安装Docker映像进行安装在OpenShift内的Docker映像中安装步骤2：连接管理CLI[](#step-2-connecting-the-admin-cli)步骤3：配置[](#step-3-configuri
一种基于swagger 2.0 yaml文件的接口异常用例生成算法，单因子变量法 xiyubaby.17 java 测试用例
详细解决方案一、设计思路基于Swagger2.0的YAML定义，为每个参数生成两类测试用例：正常用例：所有参数均符合约束。异常用例：仅一个参数违反约束，其他参数正常，且每个参数需覆盖所有可能的异常场景。二、实现步骤解析Swagger文件使用SnakeYAML解析YAML，提取参数定义（类型、约束、是否必填等）。生成正常值根据参数类型和约束生成合法值。生成异常值针对每个参数的所有约束，生成违反每个约
Python for循环详解红虾程序员 Python 开发语言 ide python pycharm
目录一、基本语法二、用法示例1、遍历字符串2、遍历列表3、遍历元组4、遍历字典5、使用range()函数6、使用enumerate()函数7、嵌套循环8、break和continue语句9、else子句三、优点四、缺点在Python中，for循环是一种用于迭代可迭代对象（如列表、元组、字典、集合、字符串或任何实现了迭代协议的对象）的语句，它允许按顺序访问可迭代对象中的每个元素，并对每个元素执行一组
Python：区块链 Blockchain 入门的技术指南拾荒的小海螺 Python python 区块链开发语言
1、简述区块链（Blockchain）是一种去中心化、不可篡改的分布式账本技术，最初因比特币而广为人知。如今，区块链已发展成为一种可以应用于金融、供应链管理、智能合约等多个领域的技术。本文将简要介绍区块链的基本概念和原理，并通过Python实现一个简化的区块链原型，帮助您快速上手区块链的实践。2、基本原理区块链是一种链式结构，由多个“区块”串联而成。每个区块中包含若干交易信息，并通过加密哈希指向前
深入理解Ajax原理 lfsf802 前端技术 ajax xmlhttprequest javascript 服务器 asynchronous
1.概念ajax的全称是AsynchronousJavaScriptandXML，其中，Asynchronous是异步的意思，它有别于传统web开发中采用的同步的方式。2.理解同步异步异步传输是面向字符的传输，它的单位是字符；而同步传输是面向比特的传输，它的单位是桢，它传输的时候要求接受方和发送方的时钟是保持一致的。举个例子来说同步和异步，同步就好像我们买楼一次性支付，而异步就是买楼分期付款。所以
@GitHub 送了我这个礼物 - Github 星星奖???? krishnaik06 git AIGC github 人工智能开发语言
这位博主收到了GitHub颁发的“GitHubStarAwards”奖品，并进行了开箱视频。他表示，这些奖品是由于他在2021年对GitHub开源项目的持续贡献而获得的，包括上传项目、解决问题等。开箱视频展示了奖品内容，包括：一张感谢信，感谢博主在社区中的贡献。一只毛绒玩具熊。一顶GitHub帽子。一件GitHubT恤。一件GitHub连帽衫。一个麦克风和一个防喷罩。一个GitHub马克杯。一堆G
【玩转google云】在 Google Cloud 和 AWS 之间创建高可用性 VPN 连接（二） Coder加油! 手把手教学玩转google云 aws 云计算 devops 客户网关虚拟网关
目录1、安装AWSCLI2、配置AWSCLI3、AWS命令创建两个客户网关4、创建虚拟网关并将其挂接到您的VPC网络5、创建采用动态路由的VPN连接上一篇我们讲到了怎么在在GoogleCloud上创建高可用性VPN网关和路由器，这一篇我们将介绍怎么在AWS上面创建网关和VPN连接。AWS命令行界面(AWSCLI)是一种开源工具，允许您使用命令行操作AWS服务。您可以使用AWSCLI自动化任务、管理
“平均工作电流 10mA / 24HRAVG” 的含义 (由DS-R1生成) 兴趣使然_ 嵌入式硬件相关 ai
“平均工作电流10mA/24HRAVG”的含义可解析如下：分解解释平均工作电流10mA指设备在正常工作状态下，平均消耗的电流为10毫安（mA）。这里的“平均”可能包含不同工作模式（如运行、待机、休眠）或周期性任务下的综合电流值。/24HRAVG“24HR”表示24小时（Hour），“AVG”表示平均（Average）。组合含义：按24小时为周期计算的平均电流，即设备在一天内的整体平均功耗为10mA
【＜二＞丹方改良：Spring 时代的 JavaWeb】之 Spring MVC 的核心组件：DispatcherServlet 的工作原理 Foyo Designer spring mvc java servlet HandlerMapping ViewResolver
点击此处查看合集https://blog.csdn.net/foyodesigner/category_12907601.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=12907601&sharerefer=PC&sharesource=FoyoDesigner&sharefrom=from_link一、DispatcherServ
【脑洞小剧场】零帧起手创业小公司之第一次技术分享会 Foyo Designer 技术职场小剧职场和发展程序人生学习方法改行学it 程序员创富
点击查看小剧场合集https://blog.csdn.net/foyodesigner/category_12896948.html阳光明媚的早晨，段萌儿怀揣着对新工作的无限憧憬，踏入了这家充满未知的小公司。然而，她万万没想到，第一天上班就迎来了一场“惊悚”之旅。阳光透过会议室的窗户，洒在摆满椅子的地板上，技术分享会的氛围既紧张又期待。今天，将是公司第一次正式的技术交流盛会，各路技术大牛摩拳擦掌，
python实现一个通讯录，拥有添加联系人，删除联系人，修改联系人，查询联系人，查找通讯录，退出功能新手懒羊哥 python 开发语言
print('-'*25)#输出25个横杠print('-'*25)print("欢迎使用通讯录")print("1.添加联系人")print("2.查看通讯录")print("3.删除联系人")print("4.修改联系人")print("5.查找联系人")print("6.退出")print('-'*25)list1=[0]*10all_user=[]whileTrue:choose=inpu
STM32单片机中APB1和APB2总线选择新手懒羊哥单片机 stm32 嵌入式硬件
在STM32单片机中，APB1和APB2是两种不同的外设总线，它们的主要区别在于连接的外设类型和时钟频率。以下是使用APB1和APB2的时机：APB1（低速总线）：APB1的最高频率一般为36MHz或42MHz。适用于连接低速外设，如I2C、SPI、USART、USB、DAC、I/O端口、定时器等。如果外设的时序要求不是很严格，或者数据传输速率较低，适合使用APB1。APB2（高速总线）：APB2
视频转音频, 音频转文字言之。 python 音视频
Ubuntu24环境准备#系统级依赖sudoaptupdate&&sudoaptinstall-yffmpegpython3-venvgitbuild-essentialpython3-dev#Python虚拟环境python3-mvenv~/ai_summarysource~/ai_summary/bin/activate核心工具链工具用途安装命令Whisper语音识别pipinstallope
SvelteKit 最新中文文档教程（7）—— 构建和部署
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
QT中日志的使用案例 || 自动创建、管理、保存QT日志数据长安第一美人 qt 开发语言 c++嵌入式硬件
目录1.quiwidget.cpp2.widget.cpp3.widget.h4.在需要记录日志的地方直接将信息插入即可1.释放`m_fileLog`和`m_textStream`1.1为什么要关闭和删除`m_fileLog`和`m_textStream`？1.2如果不这样做会有什么坏处？3.总结4.参考文章需求分析：想实现在qt代码中对软件运行过程中容易出现的问题进行记录，将电量异常分析日志与平
php 高性能，高并发，有哪些框架，扩展，推荐一下，或者技术的实现有哪些行思理运维 LNMP Linux php 开发语言
以下是针对PHP高性能、高并发场景的框架、扩展及技术实现推荐，结合最新技术趋势和行业实践进行总结：一、高性能框架推荐1.C扩展类框架YAF(YetAnotherFramework)特点：由C语言编写，直接嵌入PHP内核，仅提供核心MVC功能，执行效率极高（RPS可达3000+），适合API网关、秒杀系统等场景213。适用场景：对性能要求极高但功能需求简单的项目，如百度、微博部分业务曾采用其修改版。
项目经理的验收突围战：从风险预判到价值交付的破局之道
在软件项目交付失败的统计中，近40%的问题集中爆发在验收环节。当某智慧城市项目在验收阶段遭遇23个功能点争议时，项目经理发现合同中的验收标准竟写着"系统运行稳定"这样的模糊表述——这个真实案例折射出验收管理的复杂性。项目经理需要构建从需求源头到价值交付的全周期验收防御体系。一、验收危机的三大引爆点与拆解策略需求迷雾：概念共识的断层某医疗AI项目开发时，客户口中的"智能分诊"被工程师理解为规则引擎，
UniApp 从Vue2升级为Vue3需要注意哪些方面行思理 App开发 uni-app vue.js javascript Vue3 Vue2
Vue官方已经发布了Vue3，Vue2不再维护，也在建议大家都迁移到Vue3，所以Vue2终会被淘汰。那么UniApp从Vue2升级为Vue3需要注意哪些方面：1、main.js下面请看创建应用实例Vue2与Vue3的不同：Vue2的写法：//之前-Vue2importVuefrom'vue'importAppfrom'./App'Vue.config.productionTip=false//v
dfs（二十二）78. 子集曾几何时` #DFS 深度优先算法数据结构
78.子集给你一个整数数组nums，数组中的元素互不相同。返回该数组所有可能的（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例1：输入：nums=[1,2,3]输出：[[],[1],[2],[1,2],[3],[1,3],[2,3],[1,2,3]]示例2：输入：nums=[0]输出：[[],[0]]提示：1>res;vectorpath;vector>subsets(vector
【数据结构】 -- 链表的入栈弹栈王峰～ C语言数据结构
#include#include//链表中的节点结构typedefstructlineStack{intdata;structlineStack*next;}lineStack;//入栈操作;//stack为当前的链栈，a表示入栈元素lineStack*push(lineStack*stack,inta){//创建存储新元素的节点lineStack*line=(lineStack*)malloc(
【sglang】sglang出现如下报错sglang/srt/server.py“, line 631, in _wait_and_warmup assert res.status_code 深度求索者 python
sglang部署服务过程中如果出现如下报错：Initializationfailed.warmuperror:Traceback(mostrecentcalllast):[2025-03-1110:17:39]Initializationfailed.warmuperror:Traceback(mostrecentcalllast):File"/miniconda/envs/SGLang/lib/
springboot+kafka+邮件发送（最佳实践） weixin_30347335 大数据 java 数据库
导读集成spring-kafka，生产者生产邮件message，消费者负责发送引入线程池，多线程发送消息多邮件服务器配置定时任务生产消息；计划邮件发送实现过程导入依赖1.85.1.382.1.51.3.22.8.23.4org.springframework.bootspring-boot-starterorg.springframework.bootspring-boot-starter-tes
分布式系统中的负载均衡樽酒ﻬق 架构设计负载均衡网络运维
目录分布式系统中的负载均衡引言1.什么是负载均衡？1.1负载均衡的目标2.负载均衡的类型2.1网络负载均衡（NetworkLoadBalancing）2.2应用负载均衡（ApplicationLoadBalancing）2.3全局负载均衡（GlobalLoadBalancing）2.4计算负载均衡（ComputeLoadBalancing）3.负载均衡算法3.1轮询（RoundRobin）3.2加
如何做好性能测试测试
如何做好性能测试主要依靠测试策略规划、性能测试工具选择、数据分析优化**。其中测试策略规划尤为关键，通过制定详细的测试目标和场景，明确各阶段测试重点，有助于降低项目风险和优化系统性能。实践中，企业普遍发现，完善的测试策略可以使系统响应时间降低20%～30%，大大提升用户体验和业务稳定性。一、性能测试的基本概念与重要性性能测试是指通过模拟用户操作及系统负载，对软件系统的响应时间、吞吐量、资源利用率等
152.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之Banner模块实现 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之Banner模块实现效果演示1.Banner模块结构1.1基础布局@BuilderbannerModule(){Column(){Text($r('app.string.cube_animation
149.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之状态管理与数据结构 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之状态管理与数据结构效果演示1.状态管理系统1.1状态装饰器//全局状态@StorageLink('avoidAreaBottomToModule')avoidAreaBottomToModule:n
HarmonyOS应用开发者高级认证-编程考试 harmonyos
简介需要掌握ArkTS基础语法，使用ArkTS实现基础编程，包含数组、字符串排序、字符串匹配等。重点考察开发者编程实操能力。推荐用户群体：项目经理、工程架构师。考试说明1、考试需实名认证，请在考前于个人主页→个人信息→基本信息→进行实名认证，否则考试通过无法获取专业证书；2、每个账号每月有3次考试机会，次月重置考试次数。做题过程中请认真对待，避免考试次数浪费。3、理论考试时长为1小时，编程考试时长
数据结构与算法——栈和队列深度学习&目标检测实战项目算法数据结构 java 开发语言
目录第三章：栈和队列第一节：栈（Stack）1.1：栈的基本运算：1.2：栈的存储结构和基本运算第二节：队列2.1：定义及基本运算2.2：队列的存储结构和基本运算本章小结：第三章：栈和队列第一节：栈（Stack）是限制在表一端进行插入和删除操作的线性表。允许进行插入、删除操作的这一端称为栈顶（Top），另一个固定端称为栈底。例如栈中有三个元素，近栈的顺序是a1、a2、a3，当需要出栈时顺序为a3,
springboot邮件发送与接收读取（真实使用） dgqvhtlwq472235338 java 测试 ui
发送邮件org.springframework.bootspring-boot-starter-freemarkerorg.springframework.bootspring-boot-starter-mailorg.springframework.bootspring-boot-starter-webspring:mail:port:25username:****password:****pr
PHP转GO Day2 数据类型与控制结构实践（开发计算器）老李要转行 php golang
Day2数据类型与控制结构实践（开发计算器）计算器开发问题排查指南一、基础版计算器代码（含常见Bug）packagemainimport("fmt""os""strconv")funcmain(){iflen(os.Args)!=4{fmt.Println("用法：calc数字1运算符(+-*/)数字2")return}a,_:=strconv.Atoi(os.Args[1])op:=os.Arg
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><