fzyz_sb

Python标准库学习笔记7：数据持久存储与交换

0. 概述

要持久存储数据以供长期使用，这包括两个方面：在对象的内存中表示和存储格式之间来回转换数据，以及处理转换后数据的存储区。

1. pickle----对象串行化

作用：对象串行化

pickle模块实现了一个算法可以将一个任意的Python对象转换为一系列字节。这个过程也称为串行化对象。表示对象的字节流可以传输或存储，然后重新构造来创建相同性质的新对象。

cPickle用C实现的同样算法，比pickle快数倍。

1. 导入

由于cPickle快于pickle，所以通常存在cPickle，就导入它并改其别名为“pickle”，否则导入pickle.

try:
	import cPickle as pickle
except:
	import pickle

2. 编码和解码字符串数据

使用dumps()将一个数据结构编码为一个字符串，然后把这个字符串打印到控制台。它使用了一个完全由内置类型构成的数据结构。任何类的实例都可以pickle：

try:
	import cPickle as pickle
except:
	import pickle
import pprint

data = [{'a' : 'A', 'b' : 2, 'c' : 3.0}]
print 'DATA:'
pprint.pprint(data)
data_string = pickle.dumps(data)
print 'PICKLE: %r' % data_string

默认情况下，pickle只包含ASCII字符。解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
DATA:
[{'a': 'A', 'b': 2, 'c': 3.0}]
PICKLE: "(lp1\n(dp2\nS'a'\nS'A'\nsS'c'\nF3\nsS'b'\nI2\nsa."

数据串行化后，可以写到一个文件，套接字或者管道等等。之后可以读取这个文件，将数据解除pickle，用同样的值构造一个新的对象：

try:
	import cPickle as pickle
except:
	import pickle
import pprint

data1 = [{'a' : 'A', 'b' : 2, 'c' : 3.0}]
print 'BEFORE:'
pprint.pprint(data1)

data_string = pickle.dumps(data1)
print 'PICKLE: %r' % data_string

data2 = pickle.loads(data_string)
print 'AFTER:'
pprint.pprint(data2)

print 'SAME?:', (data1 is data2)
print 'EQUAL?:', (data1 == data2)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
BEFORE:
[{'a': 'A', 'b': 2, 'c': 3.0}]
PICKLE: "(lp1\n(dp2\nS'a'\nS'A'\nsS'c'\nF3\nsS'b'\nI2\nsa."
AFTER:
[{'a': 'A', 'b': 2, 'c': 3.0}]
SAME?: False
EQUAL?: True

新构造的对象等于原来的对象，但并不是同一个对象。

3. 处理流

使用pickle可以向一个流写多个对象，然后从流读取这些对象，而无须事先知道要写多少个对象或者这些对象有多大。

try:
	import cPickle as pickle
except:
	import pickle
import pprint
from StringIO import StringIO

class SimpleObject(object):
	def __init__(self, name):
		self.name = name
		self.name_backwards = name[::-1]
		return
data = []
data.append(SimpleObject('pickle'))
data.append(SimpleObject('cPickle'))
data.append(SimpleObject('last'))

#Simulate a file with StringIO
out_s = StringIO()

#Write to the stream
for o in data:
	print 'WRITING: %s (%s)' % (o.name, o.name_backwards)
	pickle.dump(o, out_s)
	out_s.flush()

#Set up a read-able stream
in_s = StringIO(out_s.getvalue())

#Read the data
while True:
	try:
		o = pickle.load(in_s)
	except EOFError:
		break
	else:
		print 'READ		:%s (%s)' % (o.name, o.name_backwards)

这个例子使用了两个StringIO缓冲区来模拟流。第一个缓冲区接收pickle的对象，将其值传入到第二个缓冲区，load()将读取这个缓冲区。解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
WRITING: pickle (elkcip)
WRITING: cPickle (elkciPc)
WRITING: last (tsal)
READ		:pickle (elkcip)
READ		:cPickle (elkciPc)
READ		:last (tsal)

除了存储数据，pickle对于进程间通信也很方便。例如，os.fork()和os.pipe()可以用来建立工作进程，从一个管道读取作业指令，并把结果写至另一个管道。管理工作线程池以及发送作业和接收响应的核心代码可以重用，因为作业和响应对象不必基于一个特定的类。使用管道或套接字时，在转储各个对象之后不要忘记刷新输出，将数据通过连接推至另一端。

4. 重构对象的问题

处理定制类时，pickle类必须出现在读取pickle的进程所在的命名空间。所以解除pickle的数据时候，需要导入关联此pickle的一切对象。以下实例将数据写入到一个文件中：

try:
	import cPickle as pickle
except:
	import pickle
import sys

class SimpleObject(object):
	def __init__(self, name):
		self.name = name
		l = list(name)
		l.reverse()
		self.name_backwards = ''.join(l)
		return

if __name__ == '__main__':
	data = []
	data.append(SimpleObject('pickle'))
	data.append(SimpleObject('cPickle'))
	data.append(SimpleObject('last'))

	filename = sys.argv[1]
	with open(filename, 'wb') as out_s:
		for o in data:
			print 'WRITING: %s (%s)' % (o.name, o.name_backwards)
			pickle.dump(o, out_s)

运行此脚本，我们将数据写入到一个文件中：

leichaojian@leichaojian-ThinkPad-T430:~$ python pickle_to_file_1.py test.dat
WRITING: pickle (elkcip)
WRITING: cPickle (elkciPc)
WRITING: last (tsal)
leichaojian@leichaojian-ThinkPad-T430:~$ ll test.dat
-rw-rw-r-- 1 leichaojian leichaojian 451  3月  9 10:06 test.dat

当我们读取数据的时候，需要加载SimpleObject类的对象，否则会解析出错：

try:
	import cPickle as pickle
except:
	import pickle
import pprint
from StringIO import StringIO
import sys
from pickle_to_file_1 import SimpleObject

filename = sys.argv[1]

with open(filename, 'rb') as in_s:
	while True:
		try:
			o = pickle.load(in_s)
		except EOFError:
			break
		else:
			print 'READ: %s (%s)' % (o.name, o.name_backwards)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py test.dat
READ: pickle (elkcip)
READ: cPickle (elkciPc)
READ: last (tsal)

5. 不可pickle的对象

并不是所有对象都是可pickle的。套接字，文件句柄，数据库连接以及其他运行时状态依赖于操作系统或其他进程的对象可能无法用一种有意义的方式保存。如果对象包含不可pickle的属性，可以定义__getstate__()和__setstate__()来返回可pickle实例状态的一个子集。

6. 循环引用

pickle协议会自动处理对象之间的循环引用，所以复杂数据结构不需要任何特殊的处理。考虑如下循环引用：

import pickle

class Node(object):
	"""A simple digraph"""
	def __init__(self, name):
		self.name = name
		self.connections = []
	def add_edge(self, node):
		"""Create an edge between this node and the other"""
		self.connections.append(node)
	def __iter__(self):
		return iter(self.connections)

def preorder_traversal(root, seen=None, parent=None):
	"""Generator function to yield the edges in a graph."""
	if seen is None:
		seen = set()
	yield (parent, root)
	if root in seen:
		return
	seen.add(root)
	for node in root:
		for parent, subnode in preorder_traversal(node, seen, root):
			yield (parent, subnode)
def show_edges(root):
	for parent, child in preorder_traversal(root):
		if not parent:
			continue
		print '%5s -> %2s (%s)' % (parent.name, child.name, id(child))

# set up the nodes
root = Node('root')
a = Node('a')
b = Node('b')
c = Node('c')

#Add edges between them
root.add_edge(a)
root.add_edge(b)
a.add_edge(b)
b.add_edge(a)
b.add_edge(c)
a.add_edge(a)

print 'ORIGINAL GRAPH:'
show_edges(root)

#pickle and unpickle the graph to create
#a new set of nodes
dumped = pickle.dumps(root)
reloaded = pickle.loads(dumped)

print '\nRELOADED GRAPH:'
show_edges(reloaded)

重新加载的节点并不是同一个对象，不过节点之间的关系得到了维护，而且如果对象有多个引用，那么只会重新加载它的一个副本。解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
ORIGINAL GRAPH:
 root ->  a (140676705940048)
    a ->  b (140676705940112)
    b ->  a (140676705940048)
    b ->  c (140676705940176)
    a ->  a (140676705940048)
 root ->  b (140676705940112)

RELOADED GRAPH:
 root ->  a (140676705940304)
    a ->  b (140676705940368)
    b ->  a (140676705940304)
    b ->  c (140676705940496)
    a ->  a (140676705940304)
 root ->  b (140676705940368)

2. shelve---对象持久存储

作用：shelve模块使用一种类字典的API，可以持久存储可pickle的任意Python对象。

不需要关系数据库时，shelve模块可以用作Python对象的一个简单的持久存储选择。类似于字典，shelf要按键来访问。值将被pickle并写至anydbm创建和管理的数据库。

1. 创建一个新shelf

使用shelve最简单的方法就是通过DbfilenameShelf类。它使用anydbm存储数据。这个类可以直接使用，也可以通过调用shelve.open()来使用：

import shelve
from contextlib import closing
with closing(shelve.open('test_shelf.db')) as s:
	s['key1'] = {'int': 10, 'float': 9.5, 'string': 'Sample data'}

with closing(shelve.open('test_shelf.db')) as s:
	existing = s['key1']
print existing

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
{'int': 10, 'float': 9.5, 'string': 'Sample data'}

2. 写回

默认情况下，shelf不会跟踪对可变对象的修改。这说明，如果存储在shelf中的一个元素内容有变化，shelf必须通过再次存储整个元素来显式更新。

对于shelf中存储的可变对象，为了自动捕获其修改，打开shelf时可以启用写回(writeback)。写回标志使得shelf使用内存中缓存记住从数据库取得所有对象。shelf关闭时每个缓存对象也写回到数据库。

import shelve
import pprint
from contextlib import closing
with closing(shelve.open('test_shelf.db', writeback=True)) as s:
	print 'Initial data:'
	pprint.pprint(s['key1'])

	s['key1']['new_value'] = 'this was not here before'
	print '\nModified:'
	pprint.pprint(s['key1'])

with closing(shelve.open('test_shelf.db', writeback=True)) as s:
	print '\nPreserved:'
	pprint.pprint(s['key1'])

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Initial data:
{'float': 9.5, 'int': 10, 'string': 'Sample data'}

Modified:
{'float': 9.5,
 'int': 10,
 'new_value': 'this was not here before',
 'string': 'Sample data'}

Preserved:
{'float': 9.5,
 'int': 10,
 'new_value': 'this was not here before',
 'string': 'Sample data'}

尽管这会减少程序员犯错的机会，并且能使对象持久存储更透明，但是并非所有情况都有必要使用写回模式。打开shelf时缓存会消耗额外的内存，它关闭时会暂停将各个缓存对象写回到数据库，这会使应用的速度减慢。所有缓存的对象都要写回数据库，因为无法区分它们是否修改。如果应用读取的数据多于写的数据，写回会影响性能而且没有太大意义。

3. anydbm---DBM数据库

作用：anydbm为以字符串为键的DBM数据库提供了一个通用的类字典接口

anydbm是面向DBM数据库的一个前端，DBM数据库使用简单的字符串值作为键来访问包含字符串的记录。anydbm使用whichdb标识数据库，然后用适当的模块打开这些数据库。它还用作为shelve的一个后端，shelve使用pickle将对象存储在一个DBM数据库中。

1. 数据库类型

Python提供了很多模块来访问DBM数据库。具体选择哪个实现取决于当前系统上可用的库以及编译Python时使用的选项。

dbhash：

dbhash模块是anydbm的主要后端。它使用bsddb库来管理数据库文本.

gdbm:

gdbm是GNU项目dbm库的一个更新版本。对open()支持的标识有些修改：

除了标准'r','w','c'和'n'标志，gdbm.open()还支持以下标志：

‘f’以快速模式打开数据库。在快速模式下，对数据库的写并不同步

‘s’以同步模式打开数据库。对数据库做出修改时，这些改变要写至文件，而不是延迟到数据库关闭或显式同步时才写至文件。

‘u’不加锁的打开数据库。

dbm：

dbm模块为dbm格式的某个C实现提供了一个接口。

dumbdbm：

dumbdbm模块是没有其他实现可用时DBM API的一个可移植的后背实现。使用dumbdbm不要求依赖任何外部库，不过它比大多数其他实现速度都慢。

2. 创建一个新数据库

会按顺序查找以下各个模块来选择新数据库的存储格式：dbhash, gdbm, db, dumbdbm.

open()函数可以接收一些标志来控制如何管理数据库文件。必要时，要创建一个新的数据库，可以使用'c'。使用'n'则总会创建一个新数据库而覆盖现有的文件：

import anydbm

db = anydbm.open('/tmp/example.db', 'n')
db['key'] = 'value'
db['today'] = 'Sunday'
db['author'] = 'Doug'
db.close()

运行完以后，我们可以通过以下指令来查看数据库的类型：

>>> import whichdb
>>> print whichdb.whichdb('/tmp/example.db')
dbhash

3. 打开一个现有数据库

要打开一个现有数据库，可以使用标志‘r’(只读)或‘w’（读写）。会把现有的数据库自动提供给whichdb来识别，所以只要一个文件可以识别，就会使用一个适当的模块来打开这个文件。

import anydbm

db = anydbm.open('/tmp/example.db', 'r')

try:
	print 'keys():', db.keys()
	for k, v in db.iteritems():
		print 'iterating:', k, v
finally:
	db.close()

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
keys(): ['author', 'key', 'today']
iterating: author Doug
iterating: key value
iterating: today Sunday

4. 错误情况

数据库的键必须是字符串，而且值必须是字符串或None:

import anydbm

db = anydbm.open('/tmp/example.db', 'w')

try:
	db[1] = 'one'
except TypeError, err:
	print '%s: %s' % (err.__class__.__name__, err)
finally:
	db.close()
	
db = anydbm.open('/tmp/example.db', 'w')
try:
	db['one'] = 1
except TypeError, err:
	print '%s: %s' % (err.__class__.__name__, err)
finally:
	db.close()

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
TypeError: Integer keys only allowed for Recno and Queue DB's
TypeError: Data values must be of type string or None.

4. sqlite3---嵌入式关系数据库

作用：实现一个嵌入式关系数据库，并提供SQL支持

1. 创建数据库

SQLite数据库作为一个文件存储在文件系统中。这个库管理对文件的访问，包括加锁来防止书写器使用它时造成破坏。数据库在第一次访问文件时创建，不过应用要负责管理数据库中的数据库表定义，即模式。

我们需要创建如下的数据库表：

而具体的SQL语句存储在脚本todo_schema.sql中：

-- Schema for to-do application examples.

-- Projects are high-level activities made up of tasks
create table project (
		name		text primary key,
		description	text,
		deadline	date
		);
create table task (
		id			integer primary key autoincrement not null,
		priority	integer default 1,
		details		text,
		status		text,
		deadline	date,
		completed_on	date,
		project		text not null references project(name)
		);

我们可以通过sqlite3.connect来创建数据库，通过executescript来执行脚本：

import os
import sqlite3

db_filename = 'todo.db'
schema_filename = 'todo_schema.sql'

db_is_new = not os.path.exists(db_filename)

with sqlite3.connect(db_filename) as conn:
	if db_is_new:
		print 'Creating schema'
		with open(schema_filename, 'rt') as f:
			schema = f.read()
		conn.executescript(schema)

		print 'Inserting initial data'

		conn.executescript("""
		insert into project (name, description, deadline) values ('pymotw', 'Python MOdule of the Week', '2010-11-01');
		insert into task (details, status, deadline, project) values ('write about select', 'done', '2010-10-03', 'pymotw');
		insert into task (details, status, deadline, project) values ('write about random', 'waiting', '2010-10-03', 'pymotw');
		insert into task (details, status, deadline, project) values ('write about sqlite3', 'active', '2010-10-03', 'pymotw');
				""")
	else:
		print 'Database exists, assume schema does, too.'

解释器运行如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Creating schema
Inserting initial data
leichaojian@leichaojian-ThinkPad-T430:~$ sqlite3 todo.db 'select * from task'
1|1|write about select|done|2010-10-03||pymotw
2|1|write about random|waiting|2010-10-03||pymotw
3|1|write about sqlite3|active|2010-10-03||pymotw

2. 获取数据

要从一个Python程序中获取task表中保存的值，可以从数据库连接创建一个cursor。游标（cursor）会生成一个一致的数据视图。

一般我们要用fetchall()获取所有的数据，而fetchone()一次获取一个结果，用fetchmany()获取固定大小的批量结果。

import sqlite3

db_filename = 'todo.db'

with sqlite3.connect(db_filename) as conn:
	cursor = conn.cursor()

	cursor.execute("""
			select id, priority, details, status, deadline from task where project='pymotw'
			""")

	for row in cursor.fetchall():
		task_id, priority, details, status, deadline = row
		print '%2d {%d} %-20s [%-8s] (%s)' % (task_id, priority, details, status, deadline)
	
	cursor.execute("""
			select name, description, deadline from project where name='pymotw'
			""")
	name, description, deadline = cursor.fetchone()
	print 'Project details for %s (%s) due %s' % (description, name, deadline)

	cursor.execute("""
			select id, priority, details, status, deadline from task where project='pymotw' order by deadline
			""")
	print '\nNext 2 tasks:'
	for row in cursor.fetchmany(2):
		task_id, priority, details, status, deadline = row
		print '%2d {%d} %-25s [%-8s] (%s)' % (task_id, priority, details, status, deadline)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
 1 {1} write about select   [done    ] (2010-10-03)
 2 {1} write about random   [waiting ] (2010-10-03)
 3 {1} write about sqlite3  [active  ] (2010-10-03)
Project details for Python MOdule of the Week (pymotw) due 2010-11-01

Next 2 tasks:
 1 {1} write about select        [done    ] (2010-10-03)
 2 {1} write about random        [waiting ] (2010-10-03)

3. 查询元数据

DB-API2.0规范指出：调用execute()之后，cursor应当设置其description属性，来保存将由fetch方法返回的数据的有关信息。API规范指出这个描述值是一个元组序列，各元组包含列名，类型，显示大小，内部大小，精度，范围和一个指示是否接受null值的标志：

import sqlite3

db_filename = 'todo.db'

with sqlite3.connect(db_filename) as conn:
	cursor = conn.cursor()

	cursor.execute("""select * from task where project='pymotw'""")

	print 'Task table has these columns:'
	for colinfo in cursor.description:
		print colinfo

4. 行对象

默认情况下，获取方法从数据库作为“行”返回的值是元组。但是如果我们想使用字典方式读取数据，例如row['id']的方式读取id的值，即返回的是一个类似字典和列表的数据结构，而非单纯的列表，那么我们就需要增加其row_factory属性：

import sqlite3

db_filename = 'todo.db'

with sqlite3.connect(db_filename) as conn:
	conn.row_factory = sqlite3.Row
	cursor = conn.cursor()

	cursor.execute("""
			select id, priority, details, status, deadline from task where project='pymotw'
			""")

	for row in cursor.fetchall():
		print row['id'], row, type(row)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
1 (1, 1, u'write about select', u'done', u'2010-10-03') <type 'sqlite3.Row'>
2 (2, 1, u'write about random', u'waiting', u'2010-10-03') <type 'sqlite3.Row'>
3 (3, 1, u'write about sqlite3', u'active', u'2010-10-03') <type 'sqlite3.Row'>

5. 查询中使用变量

要在查询中使用动态值，正确的方法是利用随SQL指令一起传入execute()的宿主变量。SQL语句执行时，语句中的占位符值会替换为宿主变量的值。通过使用宿主变量，而不是解析之前的SQL语句中插入任意的值，这样可以避免注入攻击，因为不可信的值没有机会影响SQL语句的解析。SQLite支持两种形式占位符的查询，分别是位置参数和命名参数（命名参数更灵活）：

位置参数

问号(?)指示一个位置参数，将作为元组的一个成员传至execute()

import sqlite3
import sys

db_filename = 'todo.db'
project_name = sys.argv[1]

with sqlite3.connect(db_filename) as conn:
	cursor = conn.cursor()
	query = """select id, priority, details, status, deadline from task where project = ?"""

	cursor.execute(query, (project_name,))

	for row in cursor.fetchall():
		print row, type(row)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py pymotw
(1, 1, u'write about select', u'done', u'2010-10-03') <type 'tuple'>
(2, 1, u'write about random', u'waiting', u'2010-10-03') <type 'tuple'>
(3, 1, u'write about sqlite3', u'active', u'2010-10-03') <type 'tuple'>

命名参数

对于包含大量参数的更为复杂的查询，或者如果查询中某些参数会重复多次，则可以使用命名参数。命名参数前面有一个冒号作为前缀（例如，:param_name）

import sqlite3
import sys

db_filename = 'todo.db'
project_name = sys.argv[1]

with sqlite3.connect(db_filename) as conn:
	cursor = conn.cursor()
	query = """select id, priority, details, status, deadline from task where project = :project_name order by deadline, priority"""

	cursor.execute(query, {'project_name': project_name})

	for row in cursor.fetchall():
		print row, type(row)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py pymotw
(1, 1, u'write about select', u'done', u'2010-10-03') <type 'tuple'>
(2, 1, u'write about random', u'waiting', u'2010-10-03') <type 'tuple'>
(3, 1, u'write about sqlite3', u'active', u'2010-10-03') <type 'tuple'>

6. 批量加载

要对一个很大的数据集应用相同的SQL指令，可以使用executemany().这对于加载数据很有用，底层库会对其进行优化而非循环处理。

要加载的数据在tasks.csv文件中：

leichaojian@leichaojian-ThinkPad-T430:~$ cat tasks.csv
deadline, project, priority, details
2010-10-02,pymotw,2,"finish reviewing markup"
2010-10-03,pymotw,2,"revise chapter intros"
2010-10-03,pymotw,1,"subtitle"

而示例代码如下：

import csv
import sqlite3
import sys

db_filename = 'todo.db'
data_filename = sys.argv[1]

SQL = """insert into task (details, priority, status, deadline, project) values (:details, :priority, 'active', :deadline, :project)"""

with open(data_filename, 'rt') as csv_file:
	csv_reader = csv.DictReader(csv_file)

	with sqlite3.connect(db_filename) as conn:
		cursor = conn.cursor()
		print csv_reader
		cursor.executemany(SQL, csv_reader)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py tasks.csv<csv.DictReader instance at 0x7f94525ff8c0>
leichaojian@leichaojian-ThinkPad-T430:~$ sqlite3 'todo.db' 'select * from task'
1|1|write about select|done|2010-10-03||pymotw
2|1|write about random|waiting|2010-10-03||pymotw
3|1|write about sqlite3|active|2010-10-03||pymotw
4|2|finish reviewing markup|active|2010-10-02||pymotw
5|2|revise chapter intros|active|2010-10-03||pymotw
6|1|subtitle|active|2010-10-03||pymotw

7. 定义新列类型

尽管SQLite在内部只支持几种数据类型，不过sqlite3包括了一些便利工具，可以定义定制类型，允许Python应用在列中存储任意类型的数据。除了那些得到默认支持的类型外，还可以在数据库连接中使用detect_types标志启用其他类型的转换。如果定义表时使用所要求的类型来声明，可以使用PARSE_DECLTYPES.

import sqlite3
import sys

db_filename = 'todo.db'

sql = "select id, details, deadline from task"

def show_deadline(conn):
	conn.row_factory = sqlite3.Row
	cursor = conn.cursor()
	cursor.execute(sql)
	row = cursor.fetchone()
	for col in ['id', 'details', 'deadline']:
		print '%-8s %-30r %s' % (col, row[col], type(row[col]))
	return
print 'Without type detection:'
with sqlite3.connect(db_filename) as conn:
	show_deadline(conn)
	
print 'With type detection:'
with sqlite3.connect(db_filename, detect_types=sqlite3.PARSE_DECLTYPES) as conn:
	show_deadline(conn)

sqlite3为日期和时间戳提供了转换器，它使用datetime模块的date和datetime表示Python中的值：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Without type detection:
id       1                              <type 'int'>
details  u'write about select'          <type 'unicode'>
deadline u'2010-10-03'                  <type 'unicode'>
With type detection:
id       1                              <type 'int'>
details  u'write about select'          <type 'unicode'>
deadline datetime.date(2010, 10, 3)     <type 'datetime.date'>

定义一个新类型需要注册两个函数。适配器取Python对象作为输入，返回一个可以存储在数据库中的字节串。转换器从数据库接收串，返回一个Python对象。要使用register_adapter()定义适配器函数，使用register_converter()定义转换器函数。

import sqlite3
try:
	import cPickle as pickle
except:
	import pickle

db_filename = 'todo.db'

def adapter_func(obj):
	"""Convert from in-memory to storage representation."""
	print 'adapter_func(%s)\n' % obj
	return pickle.dumps(obj)

def converter_func(data):
	"""Convert from storage to in-memory representation."""
	print 'converter_func(%r)\n' % data
	return pickle.loads(data)

class MyObj(object):
	def __init__(self, arg):
		self.arg = arg
	def __str__(self):
		return 'MyObj(%r)' % self.arg

# Register the functions for manipulating the type
sqlite3.register_adapter(MyObj, adapter_func)
sqlite3.register_converter('MyObj', converter_func)

#Create some objects to save. Use a list of tuples so the sequence can be passed directly to executemany()
to_save = [(MyObj('this is a value to save'),),
		(MyObj(42),),
		]
with sqlite3.connect(db_filename,
		detect_types=sqlite3.PARSE_DECLTYPES) as conn:
	# Create a table with column of type "MyObj"
	SQL = """create table if not exists obj (
		id integer primary key autoincrement not null,
		data MyObj
	)"""
	conn.execute(SQL)
	cursor = conn.cursor()
	cursor.executemany("insert into obj (data) values (?)", to_save)

	cursor.execute("select id, data from obj")
	for obj_id, obj in cursor.fetchall():
		print 'Retrieved', obj_id, obj, type(obj)
		print

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
adapter_func(MyObj('this is a value to save'))

adapter_func(MyObj(42))

converter_func("ccopy_reg\n_reconstructor\np1\n(c__main__\nMyObj\np2\nc__builtin__\nobject\np3\nNtRp4\n(dp5\nS'arg'\np6\nS'this is a value to save'\np7\nsb.")

converter_func("ccopy_reg\n_reconstructor\np1\n(c__main__\nMyObj\np2\nc__builtin__\nobject\np3\nNtRp4\n(dp5\nS'arg'\np6\nI42\nsb.")

Retrieved 1 MyObj('this is a value to save') <class '__main__.MyObj'>

Retrieved 2 MyObj(42) <class '__main__.MyObj'>

8. 确定列类型

可以在查询自身的select子句包含类型指示符，采用以下形式： as "name[type]"

import sqlite3
try:
	import cPickle as pickle
except:
	import pickle
db_filename = 'todo.db'

def adapter_func(obj):
	"""Convert from in-memory to storage representation."""
	print 'adapter_func(%s)\n' % obj
	return pickle.dumps(obj)

def converter_func(data):
	"""Convert from storage to in-memory representation."""
	print 'converter_func(%r)\n' % data
	return pickle.loads(data)

class MyObj(object):
	def __init__(self, arg):
		self.arg = arg
	def __str__(self):
		return 'MyObj(%r)' % self.arg

# Register the functions for manipulating the type
sqlite3.register_adapter(MyObj, adapter_func)
sqlite3.register_converter("MyObj", converter_func)

# Create some object to save. Use a list of tuples so we can pass this sequence directly to executemany().
to_save = [(MyObj('this is a value to save'),),
		(MyObj(42),),
		]

with sqlite3.connect(db_filename,
		detect_types=sqlite3.PARSE_COLNAMES) as conn:
	# Create a table with column of type "text"
	SQL = """create table if not exists obj2 (
		id integer primary key autoincrement not null,
		data text
	)"""
	conn.execute(SQL)
	cursor = conn.cursor()

	#Insert the objects into the database
	cursor.executemany("insert into obj2 (data) values (?)", to_save)
	cursor.execute('select id, data as "pickle [MyObj]" from obj2')
	for obj_id, obj in cursor.fetchall():
		print 'Retrieved', obj_id, obj, type(obj)
		print

这里：pickle [MyObj]指定了其类型。解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
adapter_func(MyObj('this is a value to save'))

adapter_func(MyObj(42))

converter_func("ccopy_reg\n_reconstructor\np1\n(c__main__\nMyObj\np2\nc__builtin__\nobject\np3\nNtRp4\n(dp5\nS'arg'\np6\nS'this is a value to save'\np7\nsb.")

converter_func("ccopy_reg\n_reconstructor\np1\n(c__main__\nMyObj\np2\nc__builtin__\nobject\np3\nNtRp4\n(dp5\nS'arg'\np6\nI42\nsb.")

Retrieved 1 MyObj('this is a value to save') <class '__main__.MyObj'>

Retrieved 2 MyObj(42) <class '__main__.MyObj'>

9. 事务

关系数据库的关键特性之一是使用事务维护一致的内部状态。启用事务时，在提交结果并刷新输出到真正的数据库之前，可以通过一个连接完成多个变更，而不会影响任何其他用户。

保留变更

不论通过插入还是更新语句改变数据库，都需要显式的调用commit()保存这些变更。这个要求为应用提供了一个机会，可以将多个相关的变更一同完成，使它们以一种“原子”方式保存而不是增量保存，这样可以避免同时连接到数据库的不同客户只看到部分更新情况。

import sqlite3

db_filename = 'todo.db'

def show_projects(conn):
	cursor = conn.cursor()
	cursor.execute('select name, description from project')
	for name, desc in cursor.fetchall():
		print ' ', name
	return
with sqlite3.connect(db_filename) as conn1:
	print 'Before changes:'
	show_projects(conn1)

	#Insert in one cursor
	cursor1 = conn1.cursor()
	SQL = """insert into project (name, description, deadline) values ('virtualenvwrapper', 'Virtualenv Extensions', '2011-01-01')"""
	cursor1.execute(SQL)

	print '\nAfter changes in conn1:'
	show_projects(conn1)

	#Select from another connection, without committing first
	print '\nBefore commit:'
	with sqlite3.connect(db_filename) as conn2:
		show_projects(conn2)
		#Commit then select from another connection
		conn1.commit()
		print '\nAfter commit:'
		with sqlite3.connect(db_filename) as conn3:
			show_projects(conn3)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Before changes:
  pymotw

After changes in conn1:
  pymotw
  virtualenvwrapper

Before commit:
  pymotw

After commit:
  pymotw
  virtualenvwrapper

丢弃变更

还可以使用rollback()完全丢弃未提交的变更。commit()和rollback()方法通常在同一个try:except块的不同部分调用，有错误时就会触发回滚。

import sqlite3

db_filename = 'todo.db'

def show_projects(conn):
	cursor = conn.cursor()
	cursor.execute('select name, description from project')
	for name, desc in cursor.fetchall():
		print ' ', name
	return
with sqlite3.connect(db_filename) as conn:
	print 'Before changes:'
	show_projects(conn)
	try:
		#Insert
		cursor = conn.cursor()
		cursor.execute("""delete from project where name='virtualenvwrapper'""")
		#Show the settings
		print '\nAfter delete:'
		show_projects(conn)
		
		raise RuntimeError('simulated error')
	except Exception, err:
		# Discard the change
		print 'ERROR:', err
		conn.rollback()
	else:
		# Save the changes
		conn.commit()
	#Show the results
	print '\nAfter rollback:'
	show_projects(conn)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Before changes:
  pymotw
  virtualenvwrapper

After delete:
  pymotw
ERROR: simulated error

After rollback:
  pymotw
  virtualenvwrapper

10. 隔离级别

sqlite3支持3种加锁模式，也称为隔离级别。打开一个连接时可以传入一个字符串作为isolation_level参数来设置隔离级别，所以不同的连接可以使用不同的隔离级别值。

下面这个程序展示了使用同一个数据库的不同连接时，不同的隔离级别对于线程中事件的顺序会有什么影响。这里创建了4个线程。两个线程会更新现有的行，将变更写入数据库。另外两个线程尝试从task表读取所有的行。

import logging
import sqlite3
import sys
import threading
import time

logging.basicConfig(
		level=logging.DEBUG,
		format='%(asctime)s (%(threadName)-10s) %(message)s',
		)

db_filename = 'todo.db'
isolation_level = sys.argv[1]

def writer():
	my_name = threading.currentThread().name
	with sqlite3.connect(db_filename,
			isolation_level=isolation_level) as conn:
		cursor = conn.cursor()
		cursor.execute('update task set priority = priority + 1')
		logging.debug('waiting to synchronize')
		ready.wait()	#synchronize threads
		logging.debug('PAUSING')
		time.sleep(1)
		conn.commit()
		logging.debug('CHANGES COMMITTED')
	return

def reader():
	my_name = threading.currentThread().name
	with sqlite3.connect(db_filename,
			isolation_level=isolation_level) as conn:
		cursor = conn.cursor()
		logging.debug('waiting to synchronize')
		ready.wait()	#synchronize threads
		logging.debug('wait over')
		cursor.execute('select * from task')
		logging.debug('SELECT EXECUTED')
		results = cursor.fetchall()
		logging.debug('results fetched')
	return

if __name__ == '__main__':
	ready = threading.Event()
	
	threads = [
		threading.Thread(name='Reader 1', target = reader),
		threading.Thread(name='Reader 2', target = reader),
		threading.Thread(name='Writer 1', target = writer),
		threading.Thread(name='Writer 2', target = writer),
	]

	[t.start() for t in threads]

	time.sleep(1)
	logging.debug('setting ready')
	ready.set()

	[t.join() for t in threads]

这个线程使用threading模块的一个Event完成同步。writer()函数连接数据库，并完成数据库修改，不过在事件触发前并不提交。reader()函数连接数据库，然后等待查询数据库，直到出现同步事件。

延迟

默认的隔离级别是DEFERRED。使用延迟模式会锁定数据库，但只是在修改真正开始时锁定一次。

leichaojian@leichaojian-ThinkPad-T430:~$ python sqlite3_isolation_levels.py DEFERRED
2015-03-10 09:17:37,043 (Reader 1  ) waiting to synchronize
2015-03-10 09:17:37,044 (Reader 2  ) waiting to synchronize
2015-03-10 09:17:37,045 (Writer 2  ) waiting to synchronize
2015-03-10 09:17:38,034 (MainThread) setting ready
2015-03-10 09:17:38,034 (Writer 2  ) PAUSING
2015-03-10 09:17:38,035 (Reader 2  ) wait over
2015-03-10 09:17:38,035 (Reader 1  ) wait over
2015-03-10 09:17:38,036 (Reader 1  ) SELECT EXECUTED
2015-03-10 09:17:38,036 (Reader 2  ) SELECT EXECUTED
2015-03-10 09:17:38,037 (Reader 1  ) results fetched
2015-03-10 09:17:38,037 (Reader 2  ) results fetched
2015-03-10 09:17:39,140 (Writer 2  ) CHANGES COMMITTED
2015-03-10 09:17:39,179 (Writer 1  ) waiting to synchronize
2015-03-10 09:17:39,180 (Writer 1  ) PAUSING
2015-03-10 09:17:40,283 (Writer 1  ) CHANGES COMMITTED

立即

采用立即模式时，修改一开始时就会锁定数据库，从而在事务提交之前避免其他游标修改数据库。如果数据库有复杂的写操作，但是阅读器比书写器更多，这种模式就非常适合，因为事务进行中不会阻塞阅读器。

leichaojian@leichaojian-ThinkPad-T430:~$ python sqlite3_isolation_levels.py IMMEDIATE
2015-03-10 09:42:24,475 (Reader 2  ) waiting to synchronize
2015-03-10 09:42:24,476 (Reader 1  ) waiting to synchronize
2015-03-10 09:42:24,477 (Writer 1  ) waiting to synchronize
2015-03-10 09:42:25,478 (MainThread) setting ready
2015-03-10 09:42:25,479 (Writer 1  ) PAUSING
2015-03-10 09:42:25,479 (Reader 1  ) wait over
2015-03-10 09:42:25,479 (Reader 2  ) wait over
2015-03-10 09:42:25,481 (Reader 2  ) SELECT EXECUTED
2015-03-10 09:42:25,481 (Reader 1  ) SELECT EXECUTED
2015-03-10 09:42:25,482 (Reader 2  ) results fetched
2015-03-10 09:42:25,482 (Reader 1  ) results fetched
2015-03-10 09:42:26,570 (Writer 1  ) CHANGES COMMITTED
2015-03-10 09:42:26,612 (Writer 2  ) waiting to synchronize
2015-03-10 09:42:26,613 (Writer 2  ) PAUSING
2015-03-10 09:42:27,713 (Writer 2  ) CHANGES COMMITTED

互斥

互斥模式会对所有阅读器和书写器锁定数据库。如果数据库性能很重要，这种情况下就要限制使用这种模式，因为每个互斥的连接都会阻塞所有其他用户。

leichaojian@leichaojian-ThinkPad-T430:~$ python sqlite3_isolation_levels.py EXCLUSIVE
2015-03-10 09:48:37,776 (Reader 2  ) waiting to synchronize
2015-03-10 09:48:37,777 (Reader 1  ) waiting to synchronize
2015-03-10 09:48:37,779 (Writer 1  ) waiting to synchronize
2015-03-10 09:48:38,778 (MainThread) setting ready
2015-03-10 09:48:38,779 (Reader 2  ) wait over
2015-03-10 09:48:38,779 (Reader 1  ) wait over
2015-03-10 09:48:38,779 (Writer 1  ) PAUSING
2015-03-10 09:48:39,880 (Writer 1  ) CHANGES COMMITTED
2015-03-10 09:48:40,010 (Writer 2  ) waiting to synchronize
2015-03-10 09:48:40,010 (Writer 2  ) PAUSING
2015-03-10 09:48:41,098 (Writer 2  ) CHANGES COMMITTED
2015-03-10 09:48:41,112 (Reader 1  ) SELECT EXECUTED
2015-03-10 09:48:41,112 (Reader 1  ) results fetched
2015-03-10 09:48:41,141 (Reader 2  ) SELECT EXECUTED
2015-03-10 09:48:41,142 (Reader 2  ) results fetched

由于第一个书写器已经开始修改，所以阅读器和第二个书写器会阻塞，直到第一个书写器提交。sleep()调用在书写器线程中引入一个人为的延迟，以强调其他连接已阻塞这个事实。

自动提交

连接的isolation_level参数还可以设置为None，以启用自动提交模式。启用自动提交时，每个execute()调用会在语句完成时立即提交。自动提交模式很适合简短的事务，如向一个表插入少量数据。数据库锁定时间尽可能短，所以线程间竞争的可能性更小。

以下实例和上述的代码基本相同，只是删除了commit()的显式调用，并设置隔离级别为None。

import logging
import sqlite3
import sys
import threading
import time

logging.basicConfig(
		level=logging.DEBUG,
		format='%(asctime)s (%(threadName)-10s) %(message)s',
		)

db_filename = 'todo.db'
isolation_level = None

def writer():
	my_name = threading.currentThread().name
	with sqlite3.connect(db_filename,
			isolation_level=isolation_level) as conn:
		cursor = conn.cursor()
		cursor.execute('update task set priority = priority + 1')
		logging.debug('waiting to synchronize')
		ready.wait()	#synchronize threads
		logging.debug('PAUSING')
		time.sleep(1)
		logging.debug('CHANGES COMMITTED')
	return

def reader():
	my_name = threading.currentThread().name
	with sqlite3.connect(db_filename,
			isolation_level=isolation_level) as conn:
		cursor = conn.cursor()
		logging.debug('waiting to synchronize')
		ready.wait()	#synchronize threads
		logging.debug('wait over')
		cursor.execute('select * from task')
		logging.debug('SELECT EXECUTED')
		results = cursor.fetchall()
		logging.debug('results fetched')
	return

if __name__ == '__main__':
	ready = threading.Event()
	
	threads = [
		threading.Thread(name='Reader 1', target = reader),
		threading.Thread(name='Reader 2', target = reader),
		threading.Thread(name='Writer 1', target = writer),
		threading.Thread(name='Writer 2', target = writer),
	]

	[t.start() for t in threads]

	time.sleep(1)
	logging.debug('setting ready')
	ready.set()

	[t.join() for t in threads]

解释器显式如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python sqlite3_autocommit.py 
2015-03-10 09:55:07,945 (Reader 1  ) waiting to synchronize
2015-03-10 09:55:07,945 (Reader 2  ) waiting to synchronize
2015-03-10 09:55:08,036 (Writer 1  ) waiting to synchronize
2015-03-10 09:55:08,145 (Writer 2  ) waiting to synchronize
2015-03-10 09:55:08,947 (MainThread) setting ready
2015-03-10 09:55:08,948 (Writer 2  ) PAUSING
2015-03-10 09:55:08,948 (Writer 1  ) PAUSING
2015-03-10 09:55:08,948 (Reader 1  ) wait over
2015-03-10 09:55:08,949 (Reader 2  ) wait over
2015-03-10 09:55:08,951 (Reader 1  ) SELECT EXECUTED
2015-03-10 09:55:08,951 (Reader 2  ) SELECT EXECUTED
2015-03-10 09:55:08,951 (Reader 1  ) results fetched
2015-03-10 09:55:08,952 (Reader 2  ) results fetched
2015-03-10 09:55:09,950 (Writer 2  ) CHANGES COMMITTED
2015-03-10 09:55:09,951 (Writer 1  ) CHANGES COMMITTED

备注：对这一小节不是很理解，后期需要阅读APUE，UNP这类的书籍。

11. 内存中数据库

SQLite支持在RAM中管理整个数据库，而不是依赖开一个磁盘文件。如果测试运行之间不需要保留数据库，或者要尝试一个模式或其他数据库特性，此时内存中数据库对于自动测试会很有用。要打开一个内存中数据库，创建Connection时可以使用串':memory：'而不是一个文件名。每个‘：memory:’连接会创建一个单独的数据库实例，所以一个连接中游标所做的修改不会影响其他连接。

12. 导出数据库内容

内存中数据库的内容可以使用Connection的iterdump()方法保存。iterdump()方法返回迭代器生成一系列字符串，这些字符串将共同构造相应的SQL指令来重新创建数据库的状态。

import sqlite3

schema_filename = 'todo_schema.sql'

with sqlite3.connect(':memory:') as conn:
	conn.row_factory = sqlite3.Row

	print 'Create schema'
	with open(schema_filename, 'rt') as f:
		schema = f.read()
	conn.executescript(schema)

	print 'Inserting initial data'
	SQL = """insert into project (name, description, deadline) values ('pymotw', 'Python Module of the Week', '2010-11-01')"""
	conn.execute(SQL)
	data = [
		('write about select', 'done', '2010-10-03', 'pymotw'),
		('write about random', 'waiting', '2010-10-10', 'pymotw'),
		('write about sqlite3', 'active', '2010-10-17', 'pymotw'),
	]
	SQL = """insert into task (details, status, deadline, project) values (?,?,?,?)"""
	conn.executemany(SQL, data)
	print 'Dumping:'
	for text in conn.iterdump():
		print text

iterdump()也适用于保存到文件的数据库，不过对于未保存的数据库最为有用。

leichaojian@leichaojian-ThinkPad-T430:~$ python sqlite3_iterdump.py 
Create schema
Inserting initial data
Dumping:
BEGIN TRANSACTION;
CREATE TABLE project (
		name		text primary key,
		description	text,
		deadline	date
		);
INSERT INTO "project" VALUES('pymotw','Python Module of the Week','2010-11-01');
DELETE FROM "sqlite_sequence";
INSERT INTO "sqlite_sequence" VALUES('task',3);
CREATE TABLE task (
		id			integer primary key autoincrement not null,
		priority	integer default 1,
		details		text,
		status		text,
		deadline	date,
		completed_on	date,
		project		text not null references project(name)
		);
INSERT INTO "task" VALUES(1,1,'write about select','done','2010-10-03',NULL,'pymotw');
INSERT INTO "task" VALUES(2,1,'write about random','waiting','2010-10-10',NULL,'pymotw');
INSERT INTO "task" VALUES(3,1,'write about sqlite3','active','2010-10-17',NULL,'pymotw');
COMMIT;

13. SQL中使用Python函数

SQL语法支持在查询中调用函数，可以在列表中调用，也可以在select语句的where子句中调用。

import sqlite3

db_filename = 'todo.db'

def encrypt(s):
	print 'Encrypting %r' % s
	return s.encode('rot-13')

def decrypt(s):
	print 'Decrypting %r' % s
	return s.encode('rot-13')

with sqlite3.connect(db_filename) as conn:
	conn.create_function('encrypt', 1, encrypt)
	conn.create_function('decrypt', 1, decrypt)
	cursor = conn.cursor()

	print 'Original vlaues:'
	query = 'select id, details from task'
	cursor.execute(query)
	for row in cursor.fetchall():
		print row
	
	print '\nEncrypting...'
	query = 'update task set details = encrypt(details)'
	cursor.execute(query)
	print '\nRaw encrypted values:'
	query = 'select id, details from task'
	cursor.execute(query)
	for row in cursor.fetchall():
		print row
	print '\nDecrypting in query...'
	query = 'select id, decrypt(details) from task'
	cursor.execute(query)
	for row in cursor.fetchall():
		print row

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Original vlaues:
(1, u'write about select')
(2, u'write about random')
(3, u'write about sqlite3')
(4, u'finish reviewing markup')
(5, u'revise chapter intros')
(6, u'subtitle')

Encrypting...
Encrypting u'write about select'
Encrypting u'write about random'
Encrypting u'write about sqlite3'
Encrypting u'finish reviewing markup'
Encrypting u'revise chapter intros'
Encrypting u'subtitle'

Raw encrypted values:
(1, u'jevgr nobhg fryrpg')
(2, u'jevgr nobhg enaqbz')
(3, u'jevgr nobhg fdyvgr3')
(4, u'svavfu erivrjvat znexhc')
(5, u'erivfr puncgre vagebf')
(6, u'fhogvgyr')

Decrypting in query...
Decrypting u'jevgr nobhg fryrpg'
Decrypting u'jevgr nobhg enaqbz'
Decrypting u'jevgr nobhg fdyvgr3'
Decrypting u'svavfu erivrjvat znexhc'
Decrypting u'erivfr puncgre vagebf'
Decrypting u'fhogvgyr'
(1, u'write about select')
(2, u'write about random')
(3, u'write about sqlite3')
(4, u'finish reviewing markup')
(5, u'revise chapter intros')
(6, u'subtitle')

14. 定制聚集

聚集函数会收集多个单独的数据，并以某种方式汇总。avg(),min(),max()和count()都是内置聚集函数的例子。

import sqlite3
import collections

db_filename = 'todo.db'

class Mode(object):
	def __init__(self):
		self.counter = collections.Counter()
	def step(self, value):
		print 'step(%r)' % value
		self.counter[value] += 1
	def finalize(self):
		result, count = self.counter.most_common(1)[0]
		print 'finalize() -> %r (%d times)' % (result, count)
		return result

with sqlite3.connect(db_filename) as conn:
	conn.create_aggregate('mode', 1, Mode)

	cursor = conn.cursor()
	cursor.execute("""select mode(deadline) from task where project='pymotw'""")
	row = cursor.fetchone()
	print 'mode(deadline) is:', row[0]

聚集器类用Connection的create_aggregate()方法注册。参数包括函数名，step()方法所取的参数个数，以及要使用的类。

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
step(u'2010-10-03')
step(u'2010-10-03')
step(u'2010-10-03')
step(u'2010-10-02')
step(u'2010-10-03')
step(u'2010-10-03')
finalize() -> u'2010-10-03' (5 times)
mode(deadline) is: 2010-10-03
leichaojian@leichaojian-ThinkPad-T430:~$ sqlite3 'todo.db' 'select * from task'
1|11|jevgr nobhg fryrpg|done|2010-10-03||pymotw
2|11|jevgr nobhg enaqbz|waiting|2010-10-03||pymotw
3|11|jevgr nobhg fdyvgr3|active|2010-10-03||pymotw
4|12|svavfu erivrjvat znexhc|active|2010-10-02||pymotw
5|12|erivfr puncgre vagebf|active|2010-10-03||pymotw
6|11|fhogvgyr|active|2010-10-03||pymotw

15. 定制排序

比对是一个比较函数，在SQL查询的order by部分使用。

import sqlite3
try:
	import cPickle as pickle
except:
	import pickle

db_filename = 'todo.db'

def adapter_func(obj):
	return pickle.dumps(obj)
def converter_func(data):
	return pickle.loads(data)

class MyObj(object):
	def __init__(self, arg):
		self.arg = arg
	def __str__(self):
		return 'MyObj(%r)' % self.arg
	def __cmp__(self, other):
		return cmp(self.arg, other.arg)

sqlite3.register_adapter(MyObj, adapter_func)
sqlite3.register_converter("MyObj", converter_func)


def collation_func(a, b):
	a_obj = converter_func(a)
	b_obj = converter_func(b)
	print 'collation_func(%s, %s)' % (a_obj, b_obj)
	return cmp(a_obj, b_obj)

with sqlite3.connect(db_filename,
		detect_types=sqlite3.PARSE_DECLTYPES,
		) as conn:
	#Define the collation
	conn.create_collation('unpickle', collation_func)

	#clear the table and insert new values
	conn.execute('delete from obj')
	conn.executemany('insert into obj (data) values (?)',
			[(MyObj(x),) for x in xrange(5, 0, -1)],
			)
	print 'Querying:'
	cursor = conn.cursor()
	cursor.execute("""select id, data from obj order by data collate unpickle""")
	for obj_id, obj in cursor.fetchall():
		print obj_id, obj

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Querying:
collation_func(MyObj(2), MyObj(1))
collation_func(MyObj(4), MyObj(3))
collation_func(MyObj(3), MyObj(1))
collation_func(MyObj(3), MyObj(2))
collation_func(MyObj(5), MyObj(1))
collation_func(MyObj(5), MyObj(2))
collation_func(MyObj(5), MyObj(3))
collation_func(MyObj(5), MyObj(4))
7 MyObj(1)
6 MyObj(2)
5 MyObj(3)
4 MyObj(4)
3 MyObj(5)

16. 线程和连接共享

Connection对象不能在线程间共享。每个线程必须创建自己的数据库连接。

import sqlite3
import sys
import threading
import time

db_filename = 'todo.db'
isolation_level = None

def reader(conn):
	my_name = threading.currentThread().name
	print 'Starting thread'
	try:
		cursor = conn.cursor()
		cursor.execute('select * from task')
		results = cursor.fetchall()
		print 'results fetched'
	except Exception, err:
		print 'ERROR:', err
	return

if __name__ == '__main__':
	with sqlite3.connect(db_filename,
			isolation_level=isolation_level,
			) as conn:
		t = threading.Thread(name='Reader 1',
				target=reader,
				args=(conn,),
				)
		t.start()
		t.join()

如果试图在线程之间共享一个连接，这会导致一个异常：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Starting thread
ERROR: SQLite objects created in a thread can only be used in that same thread.The object was created in thread id 140642553907008 and this is thread id 140642521552640

17. 限制对数据的访问

SQLite提供了一种机制来限制列访问。每个连接可以安装一个授权函数，运行时可以根据所需的原则来批准或拒绝访问列。这个授权函数会在解析SQL语句时调用，将传入5个参数。第一个参数是一个动作码，指示所完全的操作的类型（读，写，删除等等）。其余的参数则取决于动作码。

import sqlite3

db_filename = 'todo.db'
def authorizer_func(action, table, column, sql_location, ignore):
	print '\nauthorizer_func(%s, %s, %s, %s, %s)' % \
		(action, table, column, sql_location, ignore)
	response = sqlite3.SOLITE_OK 

	if action == sqlite3.SQLITE_SELECT:
		print 'requesting permission to run a select statement'
		response = sqlite3.SQLITE_OK
	elif action == sqlite3.SQLITE_READ:
		print 'requesting access to column %s.%s from %s' % \
			(table, column, sql_location)
		if column == 'details':
			print 'ignoring details column'
			response = sqlite3.SQLITE_IGNORE
		elif column == 'priority':
			print 'preventing access to priority column'
			response = sqlite3.SQLITE_DENY
	return response

with sqlite3.connect(db_filename) as conn:
	conn.row_factory = sqlite3.Row
	conn.set_authorizer(authorizer_func)

	print 'Using SQLITE_IGNORE to mask a column vlaue:'
	cursor = conn.cursor()
	cursor.execute("""
			select id, details from task where project='pymotw'
			""")
	for row in cursor.fetchall():
		print row['id'], row['details']
	print '\nUsing SQLITE_DENY to deny access to a column:'
	cursor.execute("""
			select id, priority from task where project='pymotw'
			""")
	for row in cursor.fetchall():
		print row['id'], row['details']

但是，运行除错！

6. xml.etree.ElementTree---XML操纵API

作用：生成和解析XML文档

1. 解析XML文档

已解析的XML文档在内存中由ElementTree和Element对象表示，这些对象基于XML文档中节点嵌套的方式以数结构相互连接。

用parse()解析一个完整的文档时，会返回一个ElementTree实例。

测试的数据如下（podcasts.opml）：

<?xml version="1.0" encoding="UTF-8"?>
<opml version="1.0">
<head>
	<title>My Podcasts</title>
	<p>this is a paragraph 1</p>
	<p>this is a paragraph 2</p>
</head>

<body>
	<outline text="Fiction">
		<p1>this is a outline 1</p1>
	</outline>
	<outline text="Python">
		<outline text="text1" xmlUrl="http://www.google.com" />
		<outline text="text2" xmlUrl="http://www.baidu.com" />
	</outline>
</body>
</opml>

要解析这个文档，需要向parse()传递一个打开的文件句柄：

from xml.etree import ElementTree

with open('podcasts.opml', 'rt') as f:
	tree = ElementTree.parse(f)

print tree

2. 遍历解析树

要按顺序访问所有子节点，可以使用iter()创建一个生成器，迭代器处理这个ElementTree实例。

from xml.etree import ElementTree
import pprint

with open('podcasts.opml', 'rt') as f:
	tree = ElementTree.parse(f)

for node in tree.iter():
	print node.tag

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
opml
head
title
p
p
body
outline
p1
outline
outline
outline

如果只要打印具体的属性名，可以使用attrib属性：

from xml.etree import ElementTree
import pprint

with open('podcasts.opml', 'rt') as f:
	tree = ElementTree.parse(f)

for node in tree.iter('outline'):
	name = node.attrib.get('text')
	url = node.attrib.get('xmlUrl')
	if name and url:
		print '%s' % name
		print '%s' % url
	else:
		print name

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Fiction
Python
text1
http://www.google.com
text2
http://www.baidu.com

3. 查找文档中的节点

如果我们知道url的具体路径在哪个outline下，我们就不必遍历所有的outline。通过具体的路径和findall函数即可办到：

from xml.etree import ElementTree
import pprint

with open('podcasts.opml', 'rt') as f:
	tree = ElementTree.parse(f)

for node in tree.findall('.//outline/outline'):
	url = node.attrib.get('xmlUrl')
	print url

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
http://www.google.com
http://www.baidu.com

4. 解析节点属性

findall()和iter()返回的元素是Element对象。

示例数据data.xml：

<?xml version="1.0" encoding="UTF-8"?>
<top>
	<child>Regular text.</child>
	<child_with_tail>Regular text.</child_with_tail>"Tail" text.
	<with_attributes name="value" foo="bar" />
	<entity_expansion attribute="This &#38; That">
		That &#38; This
	</entity_expansion>
</top>

而测试代码如下：

from xml.etree import ElementTree

with open('data.xml', 'rt') as f:
	tree = ElementTree.parse(f)

node = tree.find('./with_attributes')
print node.tag
for name, value in sorted(node.attrib.items()):
	print '		%-4s = "%s"' % (name, value)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
with_attributes
		foo  = "bar"
		name = "value"

还可以得到节点的文本内容，以及结束标记后面的tail文本。

from xml.etree import ElementTree

with open('data.xml', 'rt') as f:
	tree = ElementTree.parse(f)

for path in ['./child', './child_with_tail']:
	node = tree.find(path)
	print node.tag
	print '		child node text:', node.text
	print '		and tail text:', node.tail

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
child
		child node text: Regular text.
		and tail text: 
	
child_with_tail
		child node text: Regular text.
		and tail text: "Tail" text.

返回值之前，文档中嵌入的XML实体引用会转换为适当的字符。

from xml.etree import ElementTree

with open('data.xml', 'rt') as f:
	tree = ElementTree.parse(f)

node = tree.find('entity_expansion')
print node.tag
print '		in attribute:', node.attrib['attribute']
print '		in text:', node.text.strip()

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
entity_expansion
		in attribute: This & That
		in text: That & This

5. 解析时监视事件

另一个处理XML文档的API是基于事件的。解析器为开始标记生成start事件，为结束标记生成end事件。解析阶段中可以通过迭代处理事件流从文档抽取数据。如果以后没有必要处理整个文档，或者没有必要将整个解析文档都保存在内存中，基于事件的API就会很方便。

备注：XML这部分不想看，后期如果有欲望，就补上。

7. CSV---逗号分隔值文件

作用：读写逗号分隔值文件

可以用csv模块处理从电子表格和数据库导出的数据，并写入采用字段和记录格式的文本文件，这种格式通常称为逗号分隔值格式，因为常用逗号来分隔记录中的字段。

1. 读文件

数据文件testdata.csv：

hello world
i love this world
and i love python too

测试代码：

import csv
import sys

with open(sys.argv[1], 'rt') as f:
	reader = csv.reader(f)
	for row in reader:
		print row

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py testdata.csv
['hello world']
['i love this world']
['and i love python too']

2. 写文件

可以使用writer()创建一个对象来写数据，然后使用writerow()迭代处理文本行进行打印。

import csv
import sys

with open(sys.argv[1], 'wt') as f:
	writer = csv.writer(f)
	writer.writerow(('Title 1', 'Title 2', 'Title 3'))
	for i in range(3):
		writer.writerow((i + 1, chr(ord('a') + i),
					'08/%02d/07' % (i + 1),
					))

print open(sys.argv[1], 'rt').read()

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py testout.csv
Title 1,Title 2,Title 3
1,a,08/01/07
2,b,08/02/07
3,c,08/03/07

引号

对于书写器，默认的引号行为有所不同。要加上引号，则需要添加quoting属性：

QUOTE_ALL：不论类型是什么，对所有字段都加引号。

QUOTE_MINIMAL:对包含特殊字符的字段加引号，这是默认选项。

QUOTE_NONNUMERIC: 对所有非整数或浮点数的字段加引号。

QUOTE_NONE:输出中所有内容都不加引号。

writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py testout.csv
"Title 1","Title 2","Title 3"
1,"a","08/01/07"
2,"b","08/02/07"
3,"c","08/03/07"

3. 方言

我们可以使用dislects()获取已注册方言列表

>>> import csv
>>> csv.list_dialects()
['excel-tab', 'excel']

创建方言

使用竖线("|")来作为分隔符。

"Title 1"|"Title 2"|"Title 3"
1|"first line\nsecond line"|08/18/07

我们将注册一个新方言，将竖线("|")作为分隔符：

import csv

csv.register_dialect('pipes', delimiter='/')

with open('testdata.pipes', 'r') as f:
	reader = csv.reader(f, dialect='pipes')
	for row in reader:
		print row

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py 
['Title 1|"Title 2"|"Title 3"']
['1|"first line\\nsecond line"|08', '18', '07']

方言参数

方言指定了解析或写一个数据文件时使用的所有记号。

属性	默认值	含义
delimiter	,	字段分隔符（一个字符）
doublequote	True	这个标志控制quotechar实例是否成对
escapechar	None	这个字符用来指示一个转义序列
lineterminator	\r\n	书写器使用这个字符串结束一行
quotechar	"	这个字符串用来包围包含特殊值的字段（一个字符）
quoting	QUOTE_MINIMAL	控制前面介绍的引号行为
skipinitialspace	False	忽略字段定界符后面的空白符

测试实例如下：

import csv
import sys

csv.register_dialect('escaped',
		escapechar='\\',
		doublequote=False,
		quoting=csv.QUOTE_NONE,
		)
csv.register_dialect('singlequote',
		quotechar="'",
		quoting=csv.QUOTE_ALL,
		)
quoting_modes = dict((getattr(csv, n), n)
		for n in dir(csv)
		if n.startswith('QUOTE_'))

for name in sorted(csv.list_dialects()):
	print 'Dialect: "%s"\n' % name
	dialect = csv.get_dialect(name)

	print 'delimiter = %-6r skipinitialspace = %r' % (dialect.delimiter, dialect.skipinitialspace)
	print 'doublequote = %-6r quoting = %s' % (dialect.doublequote, quoting_modes[dialect.quoting])
	print 'quotechar = %-6r lineterminator = %r' % (dialect.quotechar, dialect.lineterminator)
	print 'escapechar = %-6r' % dialect.escapechar
	print

	writer = csv.writer(sys.stdout, dialect=dialect)
	writer.writerow(
			('coll', 1, '10/01/2010',
			 'special chars: "\' %s to parse' % dialect.delimiter)
			)
	print

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py
Dialect: "escaped"

delimiter = ','    skipinitialspace = 0
doublequote = 0      quoting = QUOTE_NONE
quotechar = '"'    lineterminator = '\r\n'
escapechar = '\\'  

coll,1,10/01/2010,special chars: \"' \, to parse

Dialect: "excel"

delimiter = ','    skipinitialspace = 0
doublequote = 1      quoting = QUOTE_MINIMAL
quotechar = '"'    lineterminator = '\r\n'
escapechar = None  

coll,1,10/01/2010,"special chars: ""' , to parse"

Dialect: "excel-tab"

delimiter = '\t'   skipinitialspace = 0
doublequote = 1      quoting = QUOTE_MINIMAL
quotechar = '"'    lineterminator = '\r\n'
escapechar = None  

coll	1	10/01/2010	"special chars: ""' 	 to parse"

Dialect: "singlequote"

delimiter = ','    skipinitialspace = 0
doublequote = 1      quoting = QUOTE_ALL
quotechar = "'"    lineterminator = '\r\n'
escapechar = None  

'coll','1','10/01/2010','special chars: "'' , to parse'

4. 使用字段名

DictReader和DictWriter类将行转换为字典而不是列表。

import csv
import sys

with open(sys.argv[1], 'rt') as f:
	reader = csv.DictReader(f)
	for row in reader:
		print row

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py testdata.csv
{'hello world': 'i love this world'}
{'hello world': 'and i love python too'}
leichaojian@leichaojian-ThinkPad-T430:~$ cat testdata.csv
hello world
i love this world
and i love python too

必须为DictWriter提供一个字段名列表，使它知道如何在输出中确定列的顺序：

import csv
import sys

with open(sys.argv[1], 'wt') as f:
	fieldnames = ('Title 1', 'Title 2', 'Title 3')
	headers = dict((n, n) for n in fieldnames)

	writer = csv.DictWriter(f, fieldnames=fieldnames)
	writer.writerow(headers)

	for i in range(3):
		writer.writerow({'Title 1': i + 1,
				'Title 2': chr(ord('a') + i),
				'Title 3': '08/%02d/07' % (i + 1),
				})
print open(sys.argv[1], 'rt').read()

解释器显示如下：

leichaojian@leichaojian-ThinkPad-T430:~$ python test.py testout.csv
Title 1,Title 2,Title 3
1,a,08/01/07
2,b,08/02/07
3,c,08/03/07

你可能感兴趣的:(Python标准库学习笔记7：数据持久存储与交换)

Objective-C语言的网络编程俞嫦曦包罗万象 golang 开发语言后端
Objective-C语言中的网络编程引言Objective-C是一种面向对象的编程语言，广泛应用于iOS和macOS应用程序的开发。随着移动互联网的快速发展，网络编程成为了现代应用程序开发中不可或缺的一部分。无论是从服务器获取数据、上传文件，还是实现实时通信，网络编程都扮演着至关重要的角色。本文将深入探讨Objective-C语言中的网络编程，涵盖从基础的网络请求到高级的异步处理、安全通信等内容
Lisp语言的云存储俞嫦曦包罗万象 golang 开发语言后端
Lisp语言的云存储：构建智能化数据管理新时代引言随着信息技术的飞速发展，数据的生产和存储呈现出爆炸式增长。云存储作为一种新兴的数据管理方式，逐渐成为各行业必不可少的基础设施。尤其是在大数据、人工智能等领域，对数据的快速访问和高效存储要求尤为迫切。与此同时，Lisp语言作为一种历史悠久且具有强大表达能力的编程语言，通过其特有的特性，可以在云存储的架构设计与实现方面发挥独特的优势。本文将深入探讨Li
重生之——我用WeakMap和Symbol缔造专属于我的金丝雀~~~【使用WeakMap和Symbol实现属性私有】被夏油狠狠爱的悟 JS 前端 javascript 开发语言 WeakMap class 类 Symbol
#今日份大脑爆炸##看完下面内容包你更进一步理解WeakMap!#不想属性被外人看见？不想是个人都能看见你的属性？那就看看WeakMap，帮你轻松实现你的目标！1.WeakMap：第一版：//WeakMap管理私有属性：consthost=newWeakMap()//这里创建了一个WeakMap实例host,用于存储每个User实例的host属性classUser{constructor(url)
C++学习笔记:函数重载及函数模板 etp_ c++学习笔记
函数重载默认参数能让你使用不同数目的参数调用同一个函数，而函数多态（函数重载）能让你使用多个同名函数。----一般完成类似的工作，但一定使用不同的参数列表（函数特征标）。下面定义一组原型如下的print()函数voidprint(constchar*str,intwidth);voidprint(doubled,intwidth);voidprint(longl,intwidth);编译器根据参数
Git 分支使用规范全解（附项目示例）滴答滴答滴嗒滴开发 Ai 入门指南 git elasticsearch 大数据个人开发
Git分支使用规范全解（附项目示例）本文结合实际项目开发，详细讲解如何在多人协作中使用Git分支，包括main、develop、feature/*、bugfix/*、release/*、hotfix/*等分支类型。场景背景：开发一个“智能垃圾分类系统”目标是开发一套运行于边缘设备上的垃圾识别系统，使用AI算法模型识别投放物，并分类投放，同时配有后台管理页面。分支说明与实际应用示例main分支（生产
汽车PKE无钥匙进入系统一键启动系统定义与原理 zsmydz888 汽车无钥匙进入系统汽车无钥匙启动汽车
汽车智能钥匙（PKE无钥匙进入系统）一键启动介绍系统定义与原理汽车无钥匙进入系统，简称PKE（PassiveKeylessEntry），该系统采用了RFID无线射频技术和车辆身份编码识别系统，率先应用小型化、小功率射频天线的开发方案，并成功融合了遥控系统和无钥匙系统。它使用无线电波，使车主无需按下任何按钮即可解锁或锁定车辆。一键启动智能钥匙系统主要由无匙进入和一键启动两部分构成，无匙进入技术通过在
用Python抓取网页标题：使用`requests`库的实用指南清水白石008 python Python题库 python 开发语言
用Python抓取网页标题：使用requests库的实用指南在数据获取的时代，网页抓取（WebScraping）成为了一项重要的技能。无论是获取新闻标题、产品价格，还是数据分析，网页抓取都能提供丰富的信息。本文将详细介绍如何使用Python的requests库编写一个简单的爬虫，抓取某个网站的标题。我们将通过实例和代码片段，使整个过程清晰易懂，帮助你快速上手网页抓取。一、了解网页抓取网页抓取是指通
GPT-4o mini小型模型具备卓越的文本智能和多模态推理能力 FlowUs息流使用宝典 GPT-4o mini
GPT-4omini是首个应用OpenAI指令层次结构方法的模型，这有助于增强模型抵抗越狱、提示注入和系统提示提取的能力。这使得模型的响应更加可靠，并有助于在大规模应用中更安全地使用。GPT-4omini在学术基准测试中，无论是在文本智能还是多模态推理方面，都超越了GPT-3.5Turbo和其他小型模型，并支持与GPT-4o相同的语言范围。它在函数调用方面也表现出色，这使开发者能够构建应用程序来从
SparkSQL编程-RDD、DataFrame、DataSet 早拾碗吧 Spark spark hadoop 大数据 sparksql
三者之间的关系在SparkSQL中Spark为我们提供了两个新的抽象，分别是DataFrame和DataSet。他们和RDD有什么区别呢？首先从版本的产生上来看：RDD(Spark1.0)—>Dataframe(Spark1.3)—>Dataset(Spark1.6)如果同样的数据都给到这三个数据结构，他们分别计算之后，都会给出相同的结果。不同是的他们的执行效率和执行方式。在后期的Spark版本中
Dify知识库构建流程及示例 cqbelt ai 笔记 AI应用
总体流程1.数据预处理清洗：去除噪声、特殊字符、标准化格式。分词/标记化：拆分文本为单词或子词单元（如使用Tokenizer）。元数据关联：附加来源、时间戳等信息，支持多维度检索。2.文本分块固定长度分块：按字符或Token数切分，简单高效。语义分块：基于句子边界或主题分割（如NLP模型识别段落主旨）。重叠策略：相邻块间部分重叠，避免上下文断裂。3.向量化（Embedding）嵌入模型：调用预训练
qt读取数据库数据并验证_qt 数据库操作总结 NewbeeSmart qt读取数据库数据并验证
qt数据库操作总结整理一下QT操作数据库的一些要点，以备以后的查询学习(主要是操作mysql)。首先，要查询相关的驱动是否已经装好了，可以用以下的程序进行验证：#include#include#include#includeintmain(intargc,char*argv[]){QCoreApplicationa(argc,argv);qDebug()
如何基于Gone编写一个Goner对接Apollo配置中心（上）—— 实现统一管理配置和监控配置变化 dapeng-大鹏 Gone框架介绍 golang gone 配置中心微服务 Apollo
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/docs/build_goner.md本文介绍的例子，代码在：https://github.com/gone-io/goner/blob/main/apollo文章目录引言Gone框架与Goner组件简介Apollo配置中心简介编写
Uni-app 笔记二 (项目笔记) 天籁晴空 #vue3 #TS #小程序--uni-app uni-app 笔记
/***@authorwn*@date2023/07/2610:14:15*@description:uniapp笔记*//*1安全区域屏幕去掉状态栏+刘海剩余展示内容的区域--可通过uni.getSystemInfoSync()获取屏幕上边界到安全区顶部的距离。safeAreaInsets={top:59,left:0,right:0,bottom:34}"navigationStyle":"c
用 C++ 打造综合管理系统：功能实现与代码解析他是只猫 C++教程 c++算法学习开发语言
文章目录系统功能概述设计与实现可逆素数模块计算数字总和模块各位数字之和排序模块字符串中的最大整数模块字符串解压模块输出指定图形模块计算学生信息操作之最高分模块字符串反转模块菜单界面与主函数总结完整代码在C++编程学习过程中，将所学知识应用到实际项目里是提升编程能力的有效途径。今天，我们就来构建一个综合管理系统，这个系统集成了多个实用功能模块，能帮助我们解决不同类别的问题。通过这个项目，我们不仅能巩
qt子线程读取读取数据库 skywalker818__ 数据库 qt
这里写自定义目录标题主要目的是为了记录自己踩过的坑。在子线程中读取数库内容时，按照在子线程中的run函数中创造数据的链接并查询，在第一次使用子线程的时候，可以正常运行，在重复使用的时候，则可能会报错：下面为子线程的run函数：```cppvoidrun(){QSqlDatabase*db=newQSqlDatabase(QSqlDatabase::addDatabase("QSQLITE"));Q
算法-动态规划-最大子数组和程序员南飞算法动态规划 leetcode java 开发语言数据结构职场和发展
力扣题目：53.最大子数组和53.描述：给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例1：输入：nums=[-2,1,-3,4,-1,2,1,-5,4]输出：6解释：连续子数组 [4,-1,2,1]的和最大，为 6。示例2：输入：nums=[1]输出：1示例3：输入：nums=[5,4,-1,7,8]输出：2
彻底解决分布式环境下Redisson消息队列监听重复执行问题 renkai721 JAVA 分布式 redisson redis数据重复微服务 springboot
问题现象：测试环境单台部署，没有问题，生产环境多台部署订单都是2条重复数据。问题描述：我们把每个服务都部署了2台，订单产生后，有redisson的mq发布，如果MQListener监听到就会执行后面的业务逻辑。现实的问题是2台MQListener都会监听到，会重复处理我们的逻辑，插入数据库或修改数据库或写入ES等都会执行2遍。本文的DEMO中使用的是redisson的mq来测试的，同时Rabbit
使用OPTIMIZE TABLE优化MySQL表空间 sg_knight 数据库 mysql 数据库表空间优化碎片
在MySQL数据库中，随着数据的不断增删改，表可能会产生碎片，导致表空间利用率下降，查询性能也会受到影响。为了解决这个问题，MySQL提供了OPTIMIZETABLE命令，它可以帮助我们重新组织表的物理存储结构，减少碎片，并可能回收未使用的空间。本文将详细介绍如何使用OPTIMIZETABLE来优化MySQL表空间。一、OPTIMIZETABLE的基本用法OPTIMIZETABLE命令的基本语法如
面试经典算法150题系列-除自身以外数组的乘积 betterManchester 面试经典算法题150题算法面试 java
除自身以外数组的乘积给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。示例1:输入:nums=[1,2,3,4]输出:[24,12,8,6]示例2:输入:nums=[-1,1,0,-3,3]输出
深度解析ECharts.js：构建现代化数据可视化的利器斯~内克 WebGL echarts 信息可视化前端
引言：数据可视化的新时代挑战在数字化转型浪潮中，数据可视化已成为企业决策和用户体验的关键环节。面对海量数据的呈现需求，传统表格已无法满足用户对直观洞察的渴求。作为百度开源的JavaScript可视化库，ECharts.js凭借其强大的功能和灵活的扩展性，正在成为前端开发者的首选工具。本文将从核心技术解析、实践指南到性能优化，带您全面掌握这个可视化利器。一、ECharts核心技术架构剖析1.1分层渲
Python数据可视化与地理空间分析 CrMylive. 信息可视化 python 开发语言
一、引言数据可视化与地理空间分析是数据科学领域中的两个重要领域，其中数据可视化侧重于将数据转换成可视化的图表，而地理空间分析则关注于如何在地理空间内处理与分析数据。Python作为一种高效、灵活、易用的编程语言，近年来在数据科学领域越来越受到欢迎。本文将以Python为工具，在数据可视化与地理空间分析方面进行详细探讨，并给出一些相关实例。二、数据可视化数据可视化是指利用图表、图形和其他视觉元素来展
近期生活随笔飞天kuma 生活杂谈创业人生生活
因为开店的原因，一直觉得没什么能和大家去分享的，但是最近听到了之前同事的情况，比较之下，还是准备写点什么。因为每天跟不同的客户打交道，所以现在会不会购买东西，也大概心里有数了，说话少，问的少的，往往比各种问的购买可能性会更高，因为可能一个产品有很多种，比如数据线，有三合一的，有1米的，有1.5米的，有2米的，本身在没有想好的情况下，让我去推荐，我也不知道需求点在哪，当我推荐了一圈之后，往往得到的答
Java基础知识三（运算符）浪迹天涯的贺 Java基础系列上 java 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档前言更新第三篇文章，这篇文章讲一下Java的运算符相关的知识，对于Java中所有的运算符的种类和内容做一个总结在Java编程中，运算符（Operators）是执行特定操作的符号，它们用于操作变量和数据。本文将详细介绍Java中的运算符种类、用法以及其作用。1.算术运算符（ArithmeticOperators）算术运算符用于执行基本的
JAVA：网络编程 Socket 的技术指南拾荒的小海螺 JAVA java 网络开发语言
1、简述JavaNIO（Non-blockingI/O）是一种基于通道（Channel）和缓冲区（Buffer）的I/O模型，支持非阻塞通信和多路复用，适合高并发场景。相比传统的阻塞I/O（BIO），NIO更高效，因为它避免了线程被阻塞，降低了系统资源消耗。代码样例：https://gitee.com/lhdxhl/springboot-example.git核心组件：Channel（通道）：数据
算法通关----除自己自身以外数组乘积 fang4084 算法通关算法
题目来源：leetcode--238题目内容：给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。示例1:输入:nums=[1,2,3,4]输出:[24,12,8,6]示例2:输入:nums=[-
在centos7里面安装 mysql5.6.44 SAFE20242034 #三 MySQL 运维 mysql
一查询系统自带的mysqlroot@obdserver~]#rpm-qa|grepmysql二卸载系统自带的mysql因为没有mysql，所以也不用卸载三下载安装官方的yum源[root@obdserver~]#ll/etc/yum.repos.d/总用量40-rw-r--r--.1rootroot25233月1201:22CentOS-Base.repo-rw-r--r--.1rootroot1
【数据库】MySQL备份与恢复策略：确保数据安全必备技能千益数据库数据库 mysql
在数据库管理中，数据是企业最宝贵的资产之一。无论是硬件故障、人为错误还是恶意攻击，数据丢失都可能对业务造成灾难性影响。因此，制定并实施有效的备份与恢复策略是确保数据安全的关键。本文将深入探讨MySQL备份与恢复的最佳实践，并通过丰富的实际案例帮助您理解如何在实际场景中应用这些策略。一、为什么需要备份与恢复策略？1.数据丢失的常见原因硬件故障：磁盘损坏、服务器宕机等。人为错误：误删数据、错误操作等。
WPF 打开文件、文件夹，另存为文件 BeanGo WPF wpf c#开发语言
打开文件代码：OpenFileDialogopenFileDialog=newOpenFileDialog();openFileDialog.Title="选择数据源文件";openFileDialog.Filter="txt文件|*.txt";openFileDialog.FileName=string.Empty;openFileDialog.FilterIndex=1;openFileDia
Linux 常用命令 - tail 【显示文件最后几行内容】 WKJay_ Linux 常用命令 linux 运维服务器
简介tail这个命令源自英文单词“尾巴”，它的主要功能是显示文件的最后几行内容。通过使用tail，用户可以查看文件的最新添加内容，特别是对于监控日志文件来说非常有用。tail命令默认显示文件的最后10行，但这可以通过参数调整。使用方式tail[参数]...[文件]...常用选项-c,--bytes=[+]NUM：输出每个文件的最后NUM个字节的数据；或者使用-c+NUM来输出从文件NUM个字节开始
MySQL 重复数据操作一只小熊猫呀 #MySQL MySQL 重复数据操作查询重复数据删除重复数据
1、查询重复数据SELECTa.*FROMtable_aaINNERJOIN(SELECTid_customerFROMtable_aGROUPBYid_customerHAVINGCOUNT(*)>1)bONa.id_customer=b.id_customer;说明：子查询（子选择b）选择所有id_customer并计算每个id_customer的出现次数。通过HAVINGCOUNT(*)>1
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情