銨靜菂等芐紶

Python 标准库：codecs字符串编码和解码

转载自品略图书馆 http://www.pinlue.com/article/2020/03/3100/5210101088002.html

1. codecs字符串编码和解码

codecs模块提供了流接口和文件接口来完成文本数据不同表示之间的转换。通常用于处理Unicode文本，不过也提供了其他编码来满足其他用途。

1.1 Unicode入门

CPython 3.x区分了文本(text)和字节(byte)串。bytes实例使用一个8位字节值序列。与之不同，str串在内部作为一个Unicode码点(code point)序列来管理。码点值使用2字节或4字节表示，这取决于编译Python时指定的选项。

输出str值时，会使用某种标准机制编码，以后可以将这个字节序列重构为同样的文本串。编码值的字节不一定与码点值完全相同，编码只是定义了两个值集之间转换的一种方式。读取Unicode数据时还需要知道编码，这样才能把接收到的字节转换为unicode类使用的内部表示。

西方语言最常用的编码是UTF-8和UTF-16，这两种编码分别使用单字节和两字节值序列表示各个码点。对于其他语言，由于大多数字符都由超过两字节的码点表示，所以使用其他编码来存储可能更为高效。

要了解编码，最好的方法就是采用不同方法对相同的串进行编码，并查看所生成的不同的字节序列。下面的例子使用以下函数格式化字节串，使之更易读。

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

if __name__ == '__main__':

print(to_hex(b'abcdef', 1))

print(to_hex(b'abcdef', 2))

这个函数使用binascii得到输入字节串的十六进制表示，在返回这个值之前每隔nbytes字节就插入一个空格。

第一个编码示例首先使用unicode类的原始表示来打印文本'francais'，后面是Unicode数据库中各个字符的名。接下来两行将这个字符串分别编码为UTF-8和UTF-16，并显示编码得到的十六进制值。

import unicodedata

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

text = 'français'

print('Raw : {!r}'.format(text))

for c in text:

print(' {!r}: {}'.format(c, unicodedata.name(c, c)))

print('UTF-8 : {!r}'.format(to_hex(text.encode('utf-8'), 1)))

print('UTF-16: {!r}'.format(to_hex(text.encode('utf-16'), 2)))

对一个str编码的结果是一个bytes对象。

给定一个编码字节序列(作为一个bytes实例)，decode()方法将其转换为码点，并作为一个str实例返回这个序列。

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

text = 'français'

encoded = text.encode('utf-8')

decoded = encoded.decode('utf-8')

print('Original :', repr(text))

print('Encoded :', to_hex(encoded, 1), type(encoded))

print('Decoded :', repr(decoded), type(decoded))

选择使用哪一种编码不会改变输出类型。

1.2 处理文件

处理I/O操作时，编码和解码字符串尤其重要。不论是写至一个文件、套接字还是其他流，数据都必须使用适当的编码。一般来讲，所有文本数据在读取时都需要由其字节表示解码，写数据时则需要从内部值编码为一种特定的表示。程序可以显式的编码和解码数据，不过取决于所用的编码，要想确定是否已经读取足够的字节来充分解码数据，这可能并不容易。codecs提供了一些类来管理数据编码和解码，所以应用不再需要做这个工作。

codecs提供的最简单的接口可以替代内置open()函数。这个新版本的函数与内置函数的做法很相似，不过增加了两个参数来指定编码和所需的错误处理技术。

import binascii

import codecs

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

encodings = ['utf-8','utf-16','utf-32']

for encoding in encodings:

filename = encoding + '.txt'

print('Writing to', filename)

with codecs.open(filename, mode='w', encoding=encoding) as f:

f.write('français')

# Determine the byte grouping to use for to_hex()

nbytes = {

'utf-8': 1,

'utf-16': 2,

'utf-32': 4,

}.get(encoding, 1)

# Show the raw bytes in the file

print('File contents:')

with open(filename, mode='rb') as f:

print(to_hex(f.read(), nbytes))

这个例子首先处理一个包含ç的unicode串，使用指定的编码将这个文本保存到一个文件。

用open()读数据很简单，但有一点要注意：必须提前知道编码才能正确的建立解码器。尽管有些数据格式(如XML)会在文件中指定编码，但是通常都要由应用来管理。codecs只是取一个编码参数，并假设这个编码是正确的。

import binascii

import codecs

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

encodings = ['utf-8','utf-16','utf-32']

for encoding in encodings:

filename = encoding + '.txt'

print('Reading from', filename)

with codecs.open(filename, mode='r', encoding=encoding) as f:

print(repr(f.read()))

这个例子读取上一个程序创建的文件，并把得到的unicode对象的表示打印到控制台。

1.3 字节序

在不同的计算机系统之间传输数据时(可能直接复制一个文件，或者使用网络通信来完成传输)，多字节编码(如UTF-16和UTF-32)会带来一个问题。不同系统中使用的高字节和低字节的顺序不同。数据的这个特性被称为字节序(endianness)，这取决于硬件体系结构等因素，还取决于操作系统和应用开发人员做出的选择。通常没有办法提前知道给定的一组数据要使用哪一个字节序，所以多字节编码还包含一个字节序标志(Byte-Order Marker,BOM)，这个标志出现在编码输出的前几个字节。例如，UTF-16定义0xFFFE和0xFEFF不是合法字符，可以用于指示字节序。codecs定义了UTF-16和UTF-32所用的字节序标志的相应常量。

import codecs

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

BOM_TYPES = [

'BOM', 'BOM_BE', 'BOM_LE',

'BOM_UTF8',

'BOM_UTF16', 'BOM_UTF16_BE', 'BOM_UTF16_LE',

'BOM_UTF32', 'BOM_UTF32_BE', 'BOM_UTF32_LE',

]

for name in BOM_TYPES:

print('{:12} : {}'.format(

name, to_hex(getattr(codecs, name), 2)))

取决于当前系统的原生字节序，BOM、BOM_UTF16和BOM_UTF32会自动设置为适当的大端(big-endian)或小端(little-endian)值。

可以由codecs中的解码器自动检测和处理字节序，也可以在编码时显式的指定字节序。

import codecs

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

# Pick the nonnative version of UTF-16 encoding

if codecs.BOM_UTF16 == codecs.BOM_UTF16_BE:

bom = codecs.BOM_UTF16_LE

encoding = 'utf_16_le'

else:

bom = codecs.BOM_UTF16_BE

encoding = 'utf_16_be'

print('Native order :', to_hex(codecs.BOM_UTF16, 2))

print('Selected order:', to_hex(bom, 2))

# Encode the text.

encoded_text = 'français'.encode(encoding)

print('{:14}: {}'.format(encoding, to_hex(encoded_text, 2)))

with open('nonnative-encoded.txt', mode='wb') as f:

# Write the selected byte-order marker. It is not included

# in the encoded text because the byte order was given

# explicitly when selecting the encoding.

f.write(bom)

# Write the byte string for the encoded text.

f.write(encoded_text)

首先得出原生字节序，然后显式的使用替代形式，以便下一个例子可以在展示读取时自动检测字节序。

程序打开文件时没有指定字节序，所以解码器会使用文件前两个字节中的BOM值来确定字节序。

import codecs

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

# Look at the raw data

with open('nonnative-encoded.txt', mode='rb') as f:

raw_bytes = f.read()

print('Raw :', to_hex(raw_bytes, 2))

# Re-open the file and let codecs detect the BOM

with codecs.open('nonnative-encoded.txt',

mode='r',

encoding='utf-16',

) as f:

decoded_text = f.read()

print('Decoded:', repr(decoded_text))

由于文件的前两个字节用于字节序检测，所以它们并不包含在read()返回的数据中。

1.4 错误处理

前几节指出，读写Unicode文件时需要知道所使用的编码。正确的设置编码很重要，这有两个原因：首先，如果读文件时未能正确的配置编码，就无法正确的解释数据，数据有可能被破坏或无法解码，就会产生一个错误，可能丢失数据。

类似于str的encode()方法和bytes的decode()方法，codecs也使用了同样的5个错误处理选项。

错误模式描述

strict如果无法转换数据，则会引发异常。

replace将特殊的标记字符替换为无法编码的数据。

ignore跳过数据。

xmlcharrefreplaceXML字符（仅编码）

backslashreplace转义序列（仅编码）

1.4.1 编码错误

最常见的错误是在向一个ASCII输出流(如一个常规文件或sys.stdout)写Unicode数据时接收到一个UnicodeEncodeError。

import codecs

error_handlings = ['strict','replace','ignore','xmlcharrefreplace','backslashreplace']

text = 'français'

for error_handling in error_handlings:

try:

# Save the data, encoded as ASCII, using the error

# handling mode specified on the command line.

with codecs.open('encode_error.txt', 'w',

encoding='ascii',

errors=error_handling) as f:

f.write(text)

except UnicodeEncodeError as err:

print('ERROR:', err)

else:

# If there was no error writing to the file,

# show what it contains.

with open('encode_error.txt', 'rb') as f:

print('File contents: {!r}'.format(f.read()))

第一种选项，要确保应用显式的为所有I/O操作设置正确的编码，strict模式是最安全的选择，但是产生一个异常时，这种模式可能导致程序崩溃。

第二种选项，replace确保不会产生错误，其代价是一些无法转换为所需编码的数据可能会丢失。pi(π)的Unicode字符仍然无法用ASCII编码，但是采用这种错误处理模式时，并不是产生一个异常，而是会在输出中将这个字符替换为?。

第三种选项，无法编码的数据都会被丢弃。

第四种选项，会把字符替换为标准中定义的一个与该编码不同的候选表示。xmlcharrefreplace使用一个XML字符引用作为替代。

第五种选项，和第四种一样会把字符替换为标准中定义的一个与该编码不同的候选表示。它生成的输出格式类似于打印unicode对象的repr()时返回的值。Unicode字符会被替换为\u以及码点的十六进制值。

1.4.2 编码错误

数据编码时也有可能遇到错误，特别是如果使用了错误的编码。

import codecs

import binascii

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

error_handlings = ['strict','ignore','replace']

text = 'français'

for error_handling in error_handlings:

print('Original :', repr(text))

# Save the data with one encoding

with codecs.open('decode_error.txt', 'w',

encoding='utf-16') as f:

f.write(text)

# Dump the bytes from the file

with open('decode_error.txt', 'rb') as f:

print('File contents:', to_hex(f.read(), 1))

# Try to read the data with the wrong encoding

with codecs.open('decode_error.txt', 'r',

encoding='utf-8',

errors=error_handling) as f:

try:

data = f.read()

except UnicodeDecodeError as err:

print('ERROR:', err)

else:

print('Read :', repr(data))

与编码一样，如果不能正确的节码字节流，则strict错误处理模式会产生一个异常。在这里，产生UnicodeDecodeError的原因是尝试使用UTF-8解码器将UTF-16BOM部分转换为一个字符。

切换到ignore会让解码器跳过不合法的字节。不过，结果仍然不是原来指望的结果，因为其中包括嵌入的null字节。

采用replace模式时，非法的字节会被替换为\uFFFD，这是官方的Unicode替换字符，看起来像是一个有黑色背景的菱形，其中包含一个白色的问号。

1.5 编码转换

尽管大多数应用都在内部处理str数据，将数据解码或编码作为I/O操作的一部分，但有些情况下，可能需要改变文件的编码而不继续坚持这种中间数据格式，这可能很有用。EncodedFile()取一个使用某种编码打开的文件句柄，用一个类包装这个文件句柄，有I/O操作时它会把数据转换为另一种编码。

import binascii

import codecs

import io

def to_hex(t, nbytes):

"""Format text t as a sequence of nbyte long values

separated by spaces.

"""

chars_per_item = nbytes * 2

hex_version = binascii.hexlify(t)

return b' '.join(

hex_version[start:start + chars_per_item]

for start in range(0, len(hex_version), chars_per_item)

)

# Raw version of the original data.

data = 'français'

# Manually encode it as UTF-8.

utf8 = data.encode('utf-8')

print('Start as UTF-8 :', to_hex(utf8, 1))

# Set up an output buffer, then wrap it as an EncodedFile.

output = io.BytesIO()

encoded_file = codecs.EncodedFile(output, data_encoding='utf-8',

file_encoding='utf-16')

encoded_file.write(utf8)

# Fetch the buffer contents as a UTF-16 encoded byte string

utf16 = output.getvalue()

print('Encoded to UTF-16:', to_hex(utf16, 2))

# Set up another buffer with the UTF-16 data for reading,

# and wrap it with another EncodedFile.

buffer = io.BytesIO(utf16)

encoded_file = codecs.EncodedFile(buffer, data_encoding='utf-8',

file_encoding='utf-16')

# Read the UTF-8 encoded version of the data.

recoded = encoded_file.read()

print('Back to UTF-8 :', to_hex(recoded, 1))

这个例子显示了如何读写EncodedFile()返回的不同句柄。不论这个句柄用于读还是写，file_encoding总是指示总是指示打开文件句柄所用的编码(作为第一个参数传入)，data_encoding值则指示通过read()和write()调用传递数据时所用的编码。

1.6 非Unicode编码

尽管之前大多数例子都使用Unicode编码，但实际上codecs还可以用于很多其他数据转换。例如，Python包含了处理base-64、bzip2、ROT-13、ZIP和其他数据格式的codecs。

import codecs

import io

buffer = io.StringIO()

stream = codecs.getwriter('rot_13')(buffer)

text = 'abcdefghijklmnopqrstuvwxyz'

stream.write(text)

stream.flush()

print('Original:', text)

print('ROT-13 :', buffer.getvalue())

如果转换可以被表述为有单个输入参数的函数，并且返回一个字节或Unicode串，那么这样的转换都可以注册为一个codec。对于'rot_13'codec，输入应当是一个Unicode串；输出也是一个Unicode串。

使用codecs包装一个数据流，可以提供比直接使用zlib更简单的接口。

import codecs

import io

buffer = io.BytesIO()

stream = codecs.getwriter('zlib')(buffer)

text = b'abcdefghijklmnopqrstuvwxyz\n' * 50

stream.write(text)

stream.flush()

print('Original length :', len(text))

compressed_data = buffer.getvalue()

print('ZIP compressed :', len(compressed_data))

buffer = io.BytesIO(compressed_data)

stream = codecs.getreader('zlib')(buffer)

first_line = stream.readline()

print('Read first line :', repr(first_line))

uncompressed_data = first_line + stream.read()

print('Uncompressed :', len(uncompressed_data))

print('Same :', text == uncompressed_data)

并不是所有压缩或编码系统都支持使用readline()或read()通过流接口读取数据的一部分，因为这需要找到压缩段的末尾来完成解压缩。如果一个程序无法在内存中保存整个解压缩的数据集，那么可以使用压缩库的增量访问特性，而不是codecs。

1.7 增量编码

目前提供的一些编码(特别是bz2和zlib)在处理数据流时可能会显着改变数据流的长度。对于大的数据集，这些编码采用增量方式可以更好的处理，即一次只处理一个小数据块。IncrementalEncoder/IncreamentalDecoder API就是为此而设计。

import codecs

import sys

text = b'abcdefghijklmnopqrstuvwxyz\n'

repetitions = 50

print('Text length :', len(text))

print('Repetitions :', repetitions)

print('Expected len:', len(text) * repetitions)

# Encode the text several times to build up a

# large amount of data

encoder = codecs.getincrementalencoder('bz2')()

encoded = []

print()

print('Encoding:', end=' ')

last = repetitions - 1

for i in range(repetitions):

en_c = encoder.encode(text, final=(i == last))

if en_c:

print('\nEncoded : {} bytes'.format(len(en_c)))

encoded.append(en_c)

else:

sys.stdout.write('.')

all_encoded = b''.join(encoded)

print()

print('Total encoded length:', len(all_encoded))

print()

# Decode the byte string one byte at a time

decoder = codecs.getincrementaldecoder('bz2')()

decoded = []

print('Decoding:', end=' ')

for i, b in enumerate(all_encoded):

final = (i + 1) == len(text)

c = decoder.decode(bytes([b]), final)

if c:

print('\nDecoded : {} characters'.format(len(c)))

print('Decoding:', end=' ')

decoded.append(c)

else:

sys.stdout.write('.')

print()

restored = b''.join(decoded)

print()

print('Total uncompressed length:', len(restored))

每次将数据传递到编码器或解码器时，其内部状态都会更新。状态一致时(按照codec的定义)，会返回数据并重置状态。在此之前，encode()或decode()调用并不返回任何数据。传入最后一位数据时，参数final应当设置为True，这样codec就能知道需要刷新输出所有余下的缓冲数据。

1.8 定义定制编码

由于Python已经提供了大量标准codecs，所以应用一般不太可能需要定义定制的编码器或解码器。不过，如果确实有必要，codecs中的很多基类可以帮助你更容易的定义定制编码。

第一步是了解编码描述的转换性质。这一节中的例子将使用一个“invertcaps”编码，它把大写字母转换为小写，把小写字母转换为大写。下面是一个编码函数的简单定义，它会对输入字符串完成这个转换。

import string

def invertcaps(text):

"""Return new string with the case of all letters switched.

"""

return ''.join(

c.upper() if c in string.ascii_lowercase

else c.lower() if c in string.ascii_uppercase

else c

for c in text

)

if __name__ == '__main__':

print(invertcaps('ABCdef'))

print(invertcaps('abcDEF'))

在这里，编码器和解码器都是同一个函数(与ROT-13类似)。

尽管很容易理解，但这个实现效率不高，特别是对于非常大的文本串。幸运的是，codecs包含一些辅助函数，可以创建基于字符映射(character map)的codecs，如invertcaps。字符映射编码由两个字典构成。编码映射(encoding map)将输入串的字符值转换为输出中的字节值，解码映射(decoding map)则相反。首先创建解码映射，然后使用make_encoding_map()把它转换为一个编码映射。C函数charmap_encode()和charmap_decode()可以使用这些映射高效的转换输入数据。

import codecs

import string

# Map every character to itself

decoding_map = codecs.make_identity_dict(range(256))

# Make a list of pairs of ordinal values for the lower

# and uppercase letters

pairs = list(zip(

[ord(c) for c in string.ascii_lowercase],

[ord(c) for c in string.ascii_uppercase],

))

# Modify the mapping to convert upper to lower and

# lower to upper.

decoding_map.update({

upper: lower

for (lower, upper)

in pairs

})

decoding_map.update({

lower: upper

for (lower, upper)

in pairs

})

# Create a separate encoding map.

encoding_map = codecs.make_encoding_map(decoding_map)

if __name__ == '__main__':

print(codecs.charmap_encode('abcDEF', 'strict',

encoding_map))

print(codecs.charmap_decode(b'abcDEF', 'strict',

decoding_map))

print(encoding_map == decoding_map)

尽管invertcaps的编码和解码映射是一样的，但并不总是如此。有时会把对各输入字符编码为相同的输出字节，make_encoding_map()会检测这些情况，并把编码值替换为None，以标志编码为未定义。

字符映射编码器和解码器支持前面介绍的所有标准错误处理方法，所以不需要做任何额外的工作来支持这部分API。

import codecs

import string

# Map every character to itself

decoding_map = codecs.make_identity_dict(range(256))

# Make a list of pairs of ordinal values for the lower

# and uppercase letters

pairs = list(zip(

[ord(c) for c in string.ascii_lowercase],

[ord(c) for c in string.ascii_uppercase],

))

# Modify the mapping to convert upper to lower and

# lower to upper.

decoding_map.update({

upper: lower

for (lower, upper)

in pairs

})

decoding_map.update({

lower: upper

for (lower, upper)

in pairs

})

# Create a separate encoding map.

encoding_map = codecs.make_encoding_map(decoding_map)

text = 'pi: \u03c0'

for error in ['ignore', 'replace', 'strict']:

try:

encoded = codecs.charmap_encode(

text, error, encoding_map)

except UnicodeEncodeError as err:

encoded = str(err)

print('{:7}: {}'.format(error, encoded))

由于π的Unicode码点不再编码映射中，所以采用strict错误处理模式时会产生一个异常。

定义了编码和解码映射之后，还需要建立一些额外的类，另外要注册编码。register()向注册表增加一个搜索函数，使得当用户希望使用这种编码时，codecs能够找到它。这个搜索函数必须有一个字符串参数，其中包含编码名，如果它知道这个编码则返回一个CodecInfo对象，否则返回None。

import codecs

def search1(encoding):

print('search1: Searching for:', encoding)

return None

def search2(encoding):

print('search2: Searching for:', encoding)

return None

codecs.register(search1)

codecs.register(search2)

utf8 = codecs.lookup('utf-8')

print('UTF-8:', utf8)

try:

unknown = codecs.lookup('no-such-encoding')

except LookupError as err:

print('ERROR:', err)

可以注册多个搜索函数，每个搜索函数将依次调用，直到一个搜索函数返回一个CodecInfo，或者所有搜索函数都已经调用。codecs注册的内部搜索函数知道如何加装标准codecs，如encodings的UTF-8，所以这些编码名不会传递到定制搜索函数。

搜索函数返回的CodecInfo实例告诉codecs如何使用所支持的各种不同机制来完成编码和解码，包括：无状态编码、增量式编码和流编码。codecs包括一些基类来帮助建立字符映射编码。下面这个例子集成了所有内容，它会注册一个搜索函数，并返回为invertcaps codec配置的一个CodecInfo实例。

import codecs

import string

# Map every character to itself

decoding_map = codecs.make_identity_dict(range(256))

# Make a list of pairs of ordinal values for the lower

# and uppercase letters

pairs = list(zip(

[ord(c) for c in string.ascii_lowercase],

[ord(c) for c in string.ascii_uppercase],

))

# Modify the mapping to convert upper to lower and

# lower to upper.

decoding_map.update({

upper: lower

for (lower, upper)

in pairs

})

decoding_map.update({

lower: upper

for (lower, upper)

in pairs

})

# Create a separate encoding map.

encoding_map = codecs.make_encoding_map(decoding_map)

class InvertCapsCodec(codecs.Codec):

"Stateless encoder/decoder"

def encode(self, input, errors='strict'):

return codecs.charmap_encode(input, errors, encoding_map)

def decode(self, input, errors='strict'):

return codecs.charmap_decode(input, errors, decoding_map)

class InvertCapsIncrementalEncoder(codecs.IncrementalEncoder):

def encode(self, input, final=False):

data, nbytes = codecs.charmap_encode(input,

self.errors,

encoding_map)

return data

class InvertCapsIncrementalDecoder(codecs.IncrementalDecoder):

def decode(self, input, final=False):

data, nbytes = codecs.charmap_decode(input,

self.errors,

decoding_map)

return data

class InvertCapsStreamReader(InvertCapsCodec,

codecs.StreamReader):

pass

class InvertCapsStreamWriter(InvertCapsCodec,

codecs.StreamWriter):

pass

def find_invertcaps(encoding):

"""Return the codec for 'invertcaps'.

"""

if encoding == 'invertcaps':

return codecs.CodecInfo(

name='invertcaps',

encode=InvertCapsCodec().encode,

decode=InvertCapsCodec().decode,

incrementalencoder=InvertCapsIncrementalEncoder,

incrementaldecoder=InvertCapsIncrementalDecoder,

streamreader=InvertCapsStreamReader,

streamwriter=InvertCapsStreamWriter,

)

return None

codecs.register(find_invertcaps)

if __name__ == '__main__':

# Stateless encoder/decoder

encoder = codecs.getencoder('invertcaps')

text = 'abcDEF'

encoded_text, consumed = encoder(text)

print('Encoded "{}" to "{}", consuming {} characters'.format(

text, encoded_text, consumed))

# Stream writer

import io

buffer = io.BytesIO()

writer = codecs.getwriter('invertcaps')(buffer)

print('StreamWriter for io buffer: ')

print(' writing "abcDEF"')

writer.write('abcDEF')

print(' buffer contents: ', buffer.getvalue())

# Incremental decoder

decoder_factory = codecs.getincrementaldecoder('invertcaps')

decoder = decoder_factory()

decoded_text_parts = []

for c in encoded_text:

decoded_text_parts.append(

decoder.decode(bytes([c]), final=False)

)

decoded_text_parts.append(decoder.decode(b'', final=True))

decoded_text = ''.join(decoded_text_parts)

print('IncrementalDecoder converted {!r} to {!r}'.format(

encoded_text, decoded_text))

无状态编码器/解码器的基类是Codec，要用新实现来覆盖encode()和decode()(在这里分别调用了charmap_encode()和charmap_decode())。这些方法必须分别返回一个元组，其中包含转换的数据和已消费的输入字节或字符数。charmap_encode()和charmap_decode()已经返回了这个消息，所以很方便。

IncrementalEncoder和incrementalDecoder可以作为增量式编码接口的基类。增量来的encode()和decode()方法被定义为只返回真正的转换数据。缓冲的有关消息都作为内部状态来维护。invertcaps编码不需要缓冲数据(它使用一种一对一映射)。如果编码根据所处理的数据会生成不同数量的输出，如压缩算法，那么对于这些编码，BufferedIncrementalEncoder和BufferedIncrementalDecoder将是更合适的基类，因为它们可以管理输入中未处理的部分。

StreamReader和StreamWriter也需要encode()和decode()方法，而且因为它们往往返回与Codec中相应方法同样的值，所以实现时可以使用多重继承。

你可能感兴趣的:(Python)

【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
python垃圾分类游戏_垃圾分类就要来了？教你使用Python轻松完成垃圾分类 weixin_39627390 python垃圾分类游戏
从7月1日起，上海市正式实施《上海市生活垃圾管理条例》。条例规定，个人混合投放垃圾今后可最高罚200元，单位混装混运，最高可罚至5万元，而且违规还将会列入征信，堪称“史上最严垃圾分类措施”。相信最近一段时间大家已经被上海的小伙伴们因为垃圾分类的困扰而刷屏了，就在大家还在一片“与我无瓜”中暗自庆幸时，现实给了我们一击：该来的总要来，谁都逃不过去。其实，在我国垃圾分类的举措要从2000年开始，但效果并
灰狼优化算法（Grey Wolf Optimization, GWO）及其 Python 代码追蜻蜓追累了算法 python github pycharm jupyter matlab numpy
灰狼优化算法（GreyWolfOptimization,GWO）是一种基于灰狼社会行为觅食过程而设计的优化算法。其基本原理是模拟灰狼群体中个体的协作和竞争行为，以迭代更新的方式寻找最优解。灰狼优化算法涉及三种灰狼的角色：alpha（α）、beta（β）和delta（δ），它们分别代表群体中的优势个体。算法包括初始化灰狼位置、计算适应度值、更新灰狼位置等步骤。以下是一个简单的Python示例代码，实
编译QT5.15.2 qtwebengine模块以支持mp4 m0_74822999 qt 开发语言
由于版权限制，Qt官方无法在其二进制包中提供某些解码器，这导致QtWebEngine无法支持一些常见的视频格式（如MP4）。为了解决这一问题，我们可以通过重新编译QtWebEngine来集成所需的解码器一、编译准备1.获取源码qtwebengine-everywhere-src-5.15.2.zip2.编译环境Python2.7.5:Python2.7.5Perl:StrawberryPerlfo
Python多进程Logging ftpeak Python python linux 开发语言 logging
多个进程的logging向同一个.log文件写入是一套Python程序被多次启动时（多进程启动）无法回避的问题。一个进程的程序正在向.log文件写入的同时，另一个进行启动的程序也需要向同一个.log文件写入，会产生异常吗？答案是：会的！直接写入存在的问题如果多个进程直接使用Python的logging模块向同一个文件写入日志，可能会出现日志内容混乱、数据丢失等问题。这是因为多个进程同时访问和修改文
Tenacity（Python的坚韧重试库） ftpeak Python python 开发语言网络爬虫
概述Tenacity是一个基于Apache2.0协议的通用重试库，用Python编写，旨在简化向任何代码添加重试逻辑的过程。它起源于已停止维护的retrying库的分叉版本。Tenacity不兼容retrying的API，但新增了大量功能并修复了长期存在的错误。文档：Tenacity—Tenacitydocumentation主页：https://github.com/jd/tenacity核心功
Pyhton安装PyQT6 三口一个桃 python pyqt
Windows系统使用CMD命令安装，对于系统中有多个版本python的，在安装pyqt6/pyqt5时需要针对每个python版本单独安装。安装准备过程：①Win+R打开CMD命令行窗口②输入命令：python--version查看当前python版本是否是自己需要安装pyqt6/5的的版本，若是则执行第③步，若不是则执行下述操作：打开电脑环境变量设置(自行百度)--点击系统变量中的Path项-
WHAM 人体3d重建部署笔记 AI算法网奇深度学习宝典 3d 笔记
目录依赖项：mmpose的依赖项：demo脚本WHAM:ReconstructingWorld-groundedHumanswithAccurate3DMotion2024依赖项：pipinstallmmposemmpose的依赖项：mmcv>=2.0.0,=3.0.0,=0.4.0,<1.0.0demo脚本Youcantrywithoneexamplarvideo:pythondemo.py--
探索未来技术前沿：FastAPI火箭-boilerplate，打造高性能API的超级引擎！黎杉娜Torrent
探索未来技术前沿：FastAPI火箭-boilerplate，打造高性能API的超级引擎！fastapi-rocket-boilerplateFastAPIRocketBoilerplatetobuildanAPIbasedinPythonwithitsmostmoderntechnologies!项目地址:https://gitcode.com/gh_mirrors/fa/fastapi-roc
Python Flask教程 cunchi4221 python java web ajax vue ViewUI
WelcometoPythonFlasktutorial.Inpreviouslessonwehavelearntaboutpythonlambda.PythonflaskisanAPIthathelpsustobuildwebbasedapplicationinpython.Let’sgetstartedwithpythonflasktutorialforbeginnersnow.欢迎使用Pyt
python --桌面开发pyqt安装（mac 环境） Xiao_Qiang_ python
纪录下，在安装pyqt的时候花了些时间，现在纪录下参考http://www.noktec.be/python/how-to-install-pyqt4-on-osx步骤DownloadtheSIPpackage(snapshotforOSx)DownloadthePyQtpackage(snapshotforOSx)DownloadQtInstallQtInstallSIPInstallPyQta
python flask 使用教程快速搭建一个 Web 应用莫忘初心丶 python flask 前端
目录一、Flask简介二、Flask安装三、创建一个简单的Flask应用四、Flask路由与视图五、接收和处理用户输入六、模板引擎Jinja2七、Flask与数据库八、总结一、Flask简介Flask是一个轻量级的PythonWeb框架，旨在帮助开发者快速搭建Web应用。相比于Django等重量级框架，Flask更加简洁和灵活，非常适合用于小型Web项目的开发，甚至可以用于构建RESTfulAPI
深入理解Python闭包与递归：原理、应用与实践 Multiple-ji python 开发语言
目录闭包什么是闭包：闭包的基本结构：实现闭包的条件：1.嵌套函数2.内函数引用外部函数的变量3.外部函数返回内部函数4.外部函数已经执行完毕递归函数什么是递归函数：递归函数条件1.必须有个明确的结束条件———递归出口2.每进行更深一步的递归，问题规模相比上一次递归都要有所减少3.相邻两次重复之间有紧密联系分析一下这段代码1.函数定义：2.基准条件（BaseCase）3.递归条件（Recursive
【python】11. 输入输出 lmk565 python 开发语言
11.输入输出Python两种输出值的方式:表达式语句和print()函数。第三种方式是使用文件对象的write()方法，标准输出文件可以用sys.stdout引用。如果你希望输出的形式更加多样，可以使用str.format()函数来格式化输出值。如果你希望将输出的值转成字符串，可以使用repr()或str()函数来实现。str()：函数返回一个用户易读的表达形式。repr()：产生一个解释器易读
使用Python和Django构建支持多语言的博客网站程序员～小强 python django sqlite
随着互联网的发展,博客已经成为人们获取信息和分享想法的重要平台。但是不同国家和地区的用户语言各异,这给博客的国际化带来了挑战。本文将介绍如何使用Python和Django这两个强大的Web开发框架,来构建一个支持多语言的博客网站。Django框架概述Django是一个开源的Web应用框架,由Python写成。它鼓励快速开发和干净的设计。通过提供大量常用组件,Django可以更快地构建高质量的Web
python pip及常用国内镜像源 sunny05296 python python pip 开发语言
pip常用国内镜像源pip默认从国外的python下载会很慢，建议使用一些国内的镜像源，常用的国内镜像源如下：#清华镜像源https://pypi.tuna.tsinghua.edu.cn/simple#中科大镜像源https://pypi.mirrors.ustc.edu.cn/simple#阿里云镜像源https://mirrors.aliyun.com/pypi/simplepip安装组件时
零基础上手Python数据分析 (7)：Python 面向对象编程初步 kakaZhui python 数据分析 excel
写在前面回顾一下，我们已经学习了Python的基本语法、数据类型、常用数据结构和文件操作、异常处理等。到目前为止，我们主要采用的是面向过程(ProceduralProgramming)的编程方式，即按照步骤一步一步地编写代码，解决问题。这种方式对于简单的任务已经足够，但当程序变得越来越复杂，代码量越来越大时，面向过程编程可能会显得力不从心，代码难以组织、复用和维护。代码复杂性带来的挑战：面向过程v
Nginx + CertBot 配置HTTPS泛域名证书(Rocky Linux 9.4)
#安装nginx此步省略，以nginx安装在'/usr/local/nginx-1.23.3'目录为例#1.安装certbot#更新包列表sudodnfupdate#安装EPEL仓库：EPEL仓库提供了许多有用的软件包，包括certbotsudodnfinstall-yepel-release#安装Certbot和Nginx插件。dnfinstall-ycertbotpython3-certbot
OCR提取+识别方案 ocr
1.内容提取通过YOLO提取需要识别的区域1.1安装ultralytics创建虚拟环境(可选)#创建虚拟环境python-mvenv.venv#激活虚拟环境###激活虚拟环境将更改shell的提示以显示您正在使用的虚拟环境，并修改环境，以便运行时python可以获得特定版本和安装的Python。例如：source.venv/bin/activate#显示虚拟环境中安装的所有软件包：python-m
OpenAI Agents SDK 中文文档中文教程（7） wtsolutions openai agents sdk python openai sdk 中文文档
英文文档原文详见OpenAIAgentsSDKhttps://openai.github.io/openai-agents-python/本文是OpenAI-agents-sdk-python使用翻译软件翻译后的中文文档/教程。分多个帖子发布，帖子的目录如下：(1)OpenAI代理SDK，介绍及快速入门(2)OpenAIagentssdk,agents，运行agents，结果，流，工具，交接(3)
oracle 时间格式化 to——datetime,精通 Oracle+Python，第 2 部分：处理时间和日期照月鱼yoyi oracle 时间格式化 to——datetime
作者：PrzemyslawPiotrowskiOracle和Python的日期处理介绍2007年9月发布从Python2.4版开始，cx_Oracle自身可以处理DATE和TIMESTAMP数据类型，将这些列的值映射到Python的datetime模块的datetime对象中。因为datetime对象支持原位的运算操作，这可以带来某些优势。内置的时区支持和若干专用模块使Python成为一台实时机器
Python --**kwargs 潇湘馆记 python
在Python中，**kwargs是一个特殊语法，用于在函数定义中接收任意数量的关键字参数（即键值对参数），并将这些参数以字典形式存储。它是Python中处理动态参数的强大工具，适用于需要灵活传递参数的场景。1.基本语法定义方式：在函数参数列表中使用**kwargs（名称可以自定义，但通常遵循kwargs约定）。参数类型：kwargs是一个字典，键是参数名，值是对应的参数值。示例defprint_
Python 数据分析实战：跨境电商行业发展解析萧十一郎@ python python 数据分析开发语言
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1跨境电商消费者地域分布分析2.4.2跨境电商商品销售与价格关系分析2.4.3跨境电商行业未来发展预测三、主要的代码难点解析3.1数据收集3.2数据清洗-销售数据处理3.3数据分析-跨境电商消费者地域分布分析3.4数据分析-跨境电商商品销售与价格关系分析3.5数据可视化四、可能改进的代码4.1数据收集
用Python爬虫获取AliExpress商品信息：item_search API接口实战指南 JelenaAPI小小爬虫 Python API python 爬虫开发语言
引言在全球化电商的浪潮中，数据的力量不容小觑。对于电商分析师、市场研究者以及在线商家而言，能够快速获取商品信息是至关重要的。AliExpress作为全球知名的跨境电商平台，提供了丰富的商品数据。本文将介绍如何使用Python爬虫结合item_searchAPI接口，按关键字搜索并获取AliExpress上的商品信息。一、为什么选择Python爬虫Python因其简洁的语法和强大的库支持，成为编写爬
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
Qt上位机编程命名规范-执行版有追求的菜鸟 qt 开发语言
主要规范原则参考Qt上位机编程命名规范。1.文件/文件夹大小写分析考虑跨平台性，全小写是一种约定俗成的风格，在许多大型开源项目中（如Linux内核、Python标准库）被广泛使用。1.1.配合文件扩展名通常文件名小写配合小写扩展名（如.h,.cpp,.json），使整体风格统一：main.cppconfig.jsonutils.h1.2.文件夹和pri文件命名通常小写、下划线分开：control_
通过Bokeh实现大规模数据可视化的最佳实践【从静态图表到实时更新】步入烟尘算法指南信息可视化 Bokeh python
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
轻松帮你搞清楚Python爬虫数据可视化的流程 liuhaoran___ python
Python爬虫数据可视化的流程主要是通过网络爬取所需的数据，并利用相关的库将数据分析结果以图形化的方式展示出来，帮助用户更直观地理解数据背后的信息。Python爬虫+数据可视化步骤1.获取目标网站的数据使用`requests`或者`selenium`库从网页上抓取信息。对于动态加载内容的页面可以考虑结合JavaScript渲染引擎。2.解析HTML内容提取有用信息常见工具如BeautifulSo
python使用Bokeh库实现实时数据的可视化 Oona_01 python 信息可视化数据分析
Python语言以其丰富的数据科学生态系统而闻名,其中Bokeh库作为一种功能强大的可视化工具,为实时数据的可视化提供了优秀的支持,本文将介绍如何使用Bokeh库实现实时数据的可视化,并提供相关代码实例,需要的朋友可以参考下使用Python的Bokeh库进行实时数据可视化的实现Bokeh简介实时数据可视化的需求使用Bokeh实现实时数据可视化的步骤代码示例Bokeh的进阶应用总结使用Python的
Python解决“特定数组的逆序拼接”问题啥都鼓捣的小yao 经典算法练习 python 算法开发语言
Python解决“特定数组的逆序拼接”问题问题描述测试样例解决思路代码问题描述小U得到了一个数字n，他的任务是构造一个特定数组。这个数组的构造规则是：对于每个i从1到n，将数字n到i逆序拼接，直到i等于n为止。最终，输出这个拼接后的数组。例如，当n等于3时，拼接后的数组是[3,2,1,3,2,3]。测试样例样例1：输入：n=3输出：[3,2,1,3,2,3]样例2：输入：n=4输出：[4,3,2,
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，