weixin_30405421

python---基础知识回顾（四）（模块sys,os,random,hashlib,re,序列化json和pickle，xml，shutil，configparser，logging，datetim...

前提：dir,all,help,doc,file

dir:可以用来查看模块中的所有特性（函数，类，变量等）

>>> import copy
>>> dir(copy)
['Error', 'PyStringMap', '_EmptyClass', '__all__', '__builtins__', '__cached__',
 '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', '_c
opy_dispatch', '_copy_immutable', '_copy_with_constructor', '_copy_with_copy_met
hod', '_deepcopy_atomic', '_deepcopy_dict', '_deepcopy_dispatch', '_deepcopy_lis
t', '_deepcopy_method', '_deepcopy_tuple', '_keep_alive', '_reconstruct', 'built
ins', 'copy', 'deepcopy', 'dispatch_table', 'error', 'name', 't', 'weakref']
>>> [x for x in dir(copy) if not x.startswith('_')]
['Error', 'PyStringMap', 'builtins', 'copy', 'deepcopy', 'dispatch_table', 'erro
r', 'name', 't', 'weakref']

View Code

__all__:（dir中有这个变量）这个变量中包含了一个列表。和我们使用dir加上列表推导式相似。

>>> copy.__all__
['Error', 'copy', 'deepcopy']

View Code

他定义了模块的公有接口，或者说他告诉解释器当我们使用

from copy import *

时，会导入模块的那些函数方法。__all__在编写模块是，可以过滤掉大多不需要的函数方法。若是没有__all__，使用import *会将除了以下划线开头的所有全局名称导入

help:获取帮助，提供日常需要的信息

>>> help(copy)
Help on module copy:

NAME
    copy - Generic (shallow and deep) copying operations.

DESCRIPTION
    Interface summary:
....


>>> help(copy.copy)
Help on function copy in module copy:

copy(x)
    Shallow copy operation on arbitrary Python objects.

    See the module's __doc__ string for more info.

View Code

引用了__doc__特性，事实上是使用了文档字符串（写在模块开头，或者函数开头的）

__file__:获取文件位置：便于查看文件源代码位置：

>>> copy.__file__
'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python35\\lib\\copy
.py'

View Code

一.sys

sys.argv           命令行参数List，第一个元素是程序本身路径

import sys
args = sys.argv[1:] #默认0是程序名
args.reverse()
print(','.join(args))


D:\MyPython\day24\基础回顾\01装饰器>python test.py ag1 ag2 ag3
ag3,ag2,ag1

View Code

sys.exit(n)        退出程序，正常退出时exit(0)

>>> import sys
>>> sys.exit()

View Code

sys.version        获取Python解释程序的版本信息  #python --version

>>> sys.version
'3.5.4 (v3.5.4:3f56838, Aug  8 2017, 02:17:05) [MSC v.1900 64 bit (AMD64)]'

View Code

sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值

>>> sys.path
['', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python35\\pyth
on35.zip', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python35
\\DLLs', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python35\\
lib', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python35', 'C
:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python35\\lib\\site-p
ackages']

View Code

sys.platform       返回操作系统平台名称

>>> sys.platform
'win32'

View Code

sys.stdin          输入相关  有读取属性r  从屏幕中读取

>>> var = sys.stdin.read()
aasddsa
^Z
>>> var
'aasddsa\n'
>>> var = sys.stdin.read(5)
dsad
>>> var
'dsad\n'
>>>

View Code

sys.stdout         输出相关  有写入属性w  向屏幕中写入

>>> sys.stdout.write('dasf')
dasf4
>>> sys.stdout.flush()  #刷新当前屏幕  shell中无用

View Code

sys.stderror       错误相关  有写入属性w  向屏幕写入（会含有输出错误信息的信息长度）

print(sys.stderr)
print(sys.stderr.write("errfawfa"))


<_io.TextIOWrapper name='' mode='w' encoding='UTF-8'>
8
errfawfa

View Code

二，os

os.getcwd()                 获取当前工作目录，即当前python脚本工作的目录路径
os.chdir("dirname")         改变当前脚本工作目录；相当于shell下cd
os.curdir                   返回当前目录: ('.')
os.pardir                   获取当前目录的父目录字符串名：('..')
os.makedirs('dir1/dir2')    可生成多层递归目录
os.removedirs('dirname1')   若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.mkdir('dirname')         生成单级目录；相当于shell中mkdir dirname
os.rmdir('dirname')         删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdir dirname
os.listdir('dirname')       列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印
os.remove()                 删除一个文件
os.rename("oldname","new")  重命名文件/目录
os.stat('path/filename')    获取文件/目录信息
os.sep                      操作系统特定的路径分隔符，win下为"\\",Linux下为"/"
os.linesep                  当前平台使用的行终止符，win下为"\t\n",Linux下为"\n"
os.pathsep                  用于分割文件路径的字符串
os.name                     字符串指示当前使用平台。win->'nt'; Linux->'posix'

>>> sys.platform
'win32'
>>> os.name
'nt'

View Code

os.system("bash command")   运行shell命令，直接显示。用于运行外部程序

>>> os.system('ls -al')
total 50565

View Code

os.environ                  获取系统环境变量  在系统中高级环境变量Path设置中的数据
os.path.abspath(path)       返回path规范化的绝对路径
os.path.split(path)         将path分割成目录和文件名二元组返回
os.path.dirname(path)       返回path的目录。其实就是os.path.split(path)的第一个元素，就是返回上级目录

>>> os.path.dirname("c:/sys")
'c:/'
>>> os.path.dirname("c:/sys/windows/1.txt")
'c:/sys/windows'

View Code

os.path.basename(path)      返回path最后的文件名。如何path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)        如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)         如果path是绝对路径，返回True
os.path.isfile(path)        如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)         如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)      返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)      返回path所指向的文件或者目录的最后修改时间  是时间戳

三：random

该模块包括返回随机数的函数。可以用于模拟或者产生随机输出的程序。

>>> random.__all__
['Random', 'seed', 'random', 'uniform', 'randint', 'choice', 'sample', 'randrang
e', 'shuffle', 'normalvariate', 'lognormvariate', 'expovariate', 'vonmisesvariat
e', 'gammavariate', 'triangular', 'gauss', 'betavariate', 'paretovariate', 'weib
ullvariate', 'getstate', 'setstate', 'getrandbits', 'SystemRandom']

random.__all__

注意：事实上，所产生的数字都是伪随机数，也就是说他们看起来是完全随机的，实际上，他们是以一个可预测的系统作为基础。不过，已经很不错了。若是想实现真正的随机可以使用os中的urandom或者random中的SystemRandom

>>> random.random()        #返回一个在0-之间的随机数
0.5134022843262868
>>> help(random.random)
Help on built-in function random:

random(...) method of random.Random instance
    random() -> x in the interval [0, 1).


>>> random.randint(1,100)      #返回一个在1,100之间的整数
20

>>> random.randrange(1,100)    
80

四：hashlib

用于加密相关的操作，代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法

import hashlib

######### md5 ########

h2 = hashlib.md5()

h2.update(bytes('123456', encoding='utf-8'))
print(h2.hexdigest())    #是字符串十六进制
print(h2.digest())  #是字节byte型   通过.hex()可以转换为上面的字符串十六进制

补充：

digest()

>>> help(hashlib._hashlib.HASH.digest)
Help on method_descriptor:

digest(...)
    Return the digest value as a string of binary data.

返回一个bytes 八位一字节（ASCII），对于（编码的字符，若是ASCII中字符则直接显示，否则按照编码进行转换）
b'\xeaHWo0\xbe\x16i\x97\x16\x99\xc0\x9a\xd0\\\x94'

对于bytes编码的字符，若是ASCII中字符则直接显示，否则按照编码进行转换

>>> b = bytes("a",encoding="utf-8")
>>> b
b'a'
>>> b = bytes("a你",encoding="utf-8")
>>> b
b'a\xe4\xbd\xa0'

hexdigest()

>>> help(hashlib._hashlib.HASH.hexdigest)
Help on method_descriptor:

hexdigest(...)
    Return the digest value as a string of hexadecimal digits.

返回一个十六进制字符串str类型
'ea48576f30be1669971699c09ad05c94'

-------------------------------------------------------------------------------------

digest()转hexdigest()

>>> h2.digest().hex()

-------------------------------------------------------------------------------------

hexdigest()转digest()

需要使用binascii模块

>>> help(binascii)
Help on built-in module binascii:

NAME
    binascii - Conversion between binary data and ASCII
用于转换 --- 在二进制和ASCII码之间

binascii中a2b_hex

>>> help(binascii.a2b_hex)
Help on built-in function a2b_hex in module binascii:

a2b_hex(hexstr, /)
    Binary data of hexadecimal representation.
将十六进制字符串转化为二进制用bytes类型显示（ASCII）

    hexstr must contain an even number of hex digits (upper or lower case).
    This function is also available as "unhexlify()".
其中十六进制必须是偶数

一般我们直接使用十六进制字符串，直接是32位字符串

转换成功：

>>> binascii.a2b_hex(h2.hexdigest())
b'\xeaHWo0\xbe\x16i\x97\x16\x99\xc0\x9a\xd0\\\x94'
>>> h2.digest()
b'\xeaHWo0\xbe\x16i\x97\x16\x99\xc0\x9a\xd0\\\x94'
>>> h2.hexdigest()
'ea48576f30be1669971699c09ad05c94'
>>> binascii.a2b_hex(h2.hexdigest())
b'\xeaHWo0\xbe\x16i\x97\x16\x99\xc0\x9a\xd0\\\x94'

-------------------------------------------------------------------------------------

其中md5算法时不能被反解的，但是可以被撞库，获取密码。

更加安全的方法是在加密算法中添加自定义key再来进行加密：

没有key时：

>>> h1 = hashlib.md5(bytes("123456",encoding="utf-8"))
>>> h1.hexdigest()
'e10adc3949ba59abbe56e057f20f883e'

上面的数据很容易被撞库获取出来密码。尤其是这些简单的

-------------------------------------------------------------------------------------

使用自定义key时

>>> h2 = hashlib.md5(bytes("asd",encoding="utf-8"))
>>> h2.update(bytes("123456",encoding="utf-8"))
>>> h2.hexdigest()
'1e55dbf412cb74d5e2c21fb6452408c7'

相当于使用两次update：

>>> h3 = hashlib.md5()
>>> h3.update(byte("asd",encoding="utf-8"))
>>> h3.update(bytes("123456",encoding="utf-8"))
>>> h3.hexdigest()
'1e55dbf412cb74d5e2c21fb6452408c7'

-------------------------------------------------------------------------------------

######## sha1 ########（这些算法的使用和md5相似）

h = hashlib.sha1()
h.update(bytes('123456', encoding='utf-8'))
print(h.hexdigest())

SHA1, SHA224, SHA256, SHA384, SHA512使用时一样的

-------------------------------------------------------------------------------------

python内置还有一个 hmac 模块，它内部对我们创建 key 和内容进行进一步的处理然后再加密

import hmac
 
h = hmac.new(bytes('asd',encoding="utf-8"))
h.update(bytes('123456',encoding="utf-8"))
print(h.hexdigest())
#548b23c538c78d7053e3231919f78f36  与上面自定义key得出的密码不一样，说明在内部对key和内容又进行了处理

五：re正则模块

基础了解：正则表达式了解

　　　　 Python 正则表达式

（一）re模块中一些重要函数：

compile:根据原来包含正则表达式的字符串创建模式对象

函数re.compile将正则表达式（以字符串书写的）转换为模式对象，可以实现更加有效率的匹配。在调用search或者match函数的时候使用字符串正则表达式，他们也会在内部将正则表达式字符串转换为对象。与其每一次调用匹配时都去进行转换，不如在开始创建正则表达式时就使用对象，使用compile完成一次转换，后面就不需要转换。（调用方式也由re.search(正则字符串,匹配数据)----->正则对象.search(匹配数据)）、

import fileinput, re

pat = re.compile('Form: (.*) <.*?>$')  #*、+限定符都是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

for line in fileinput.input():
    m = pat.search(line)
    if m:
        print(m.group(1))

获取email发件人

search:在字符串中寻找模式(浏览整个字符串去匹配第一个)

函数re.search会在给定的字符串中(浏览整个字符串去匹配第一个)寻找第一个匹配的字符串。一旦找到，返回匹配对象，否则为空

>>> import re
>>> pat = re.compile("<(.*)>")
>>> st = "a email from "
>>> ret = pat.search(st)
>>> ret
<_sre.SRE_Match object; span=(13, 24), match=''>

View Code

否则为空：

>>> st2 = "a email from [email protected]"
>>> ret2 = pat.search(st2)
>>> ret2
>>>

View Code

匹配第一个：

pat2 = re.compile(r"\*\*(.+?)\*\*")
st = "**this** is **book**"

res = pat2.search(st)    #只会匹配出第一个，然后不再继续向后匹配--->只会匹配出   **this**

print(res.group(0))    #**this**
print(res.group(1))    #this


#向下则全部会报错：因为只匹配到第一组，只有0和1索引
#Traceback (most recent call last):
#  File "D:/MyPython/day24/基础回顾/01装饰器/test.py", line #59, in 
#   print(res.group(2))
#IndexError: no such group
print(res.group(2))    
print(res.group(3))

注意：findall会匹配所有，sub会替换所有匹配项

match:从起始位置开始匹配（只是从字符串开头开始匹配），匹配成功返回一个对象，未匹配成功返回None

import re
st = 'a email from '
pat = re.compile("<(.*)>")

ret3 = pat.match(st)
print(ret3)        #None  因为字符串开头没有匹配到

st = ' a email from '

pat = re.compile("<(.*)>")

ret3 = pat.match(st)　　　　#匹配数据出现在开头，才能够被匹配

print(ret3)  #<_sre.SRE_Match object; span=(0, 11), match=''>

View Code

split:会根据模式的匹配项来分割字符串。类似于字符串的split

some_text = "alpha, fawfgwa,,,,,fwafaw  fwafaaaa"

pat = re.compile('[, ]+')  #[]  中括号中的任意数据

ret = pat.split(some_text)

print(ret)  #['alpha', 'fawfgwa', 'fwafaw', 'fwafaaaa']

View Code

findall:以列表形式返回给定模式的所有匹配项

some_text = "[faw非f]服务[wfw发a]adawf[你faw]"

pat = re.compile('\[(.*?)\]')  #记得取消贪婪模式*和+后面加上?

ret = pat.findall(some_text)

print(ret)  #['faw非f', 'wfw发a', '你faw']

View Code

sub:替换匹配成功项的数据（含有替换字符串，替换个数）(相比于字符串replace来说查找更加灵活，替换也方便)

some_text = "[faw非f]服务[wfw发a]adawf[你faw]"

pat = re.compile('faw')  #记得取消贪婪模式*和+后面加上?

ret = pat.sub(" haha ",some_text,2)

print(ret)  #[ haha 非f]服务[wfw发a]adawf[你 haha ]

View Code

escape（string）:将字符串中所有条数的正则表达式字符转义（实用|用处不大）

some_text = "\. *+?"

ret = re.escape(some_text)

print(ret)  #\\\.\ \*\+\?

View Code

（二）匹配对象和组

首先了解一下什么是“组”：

我们所定义的匹配模式中，放在圆括号中的子模式就是组（单独的一个组，详细理解看补充中的栗子）。默认组0是我们整个匹配模式。其他的组号判断，一句他左侧的括号数

st = "https://www.baidu.com"
pat = re.compile("https://((.*?)\.(.*?)\.(.*))") 
#注意不要在这个匹配模式最后小括号中加上?取消贪婪模式，会出错，贪婪模式需要找到下一个界限（这里设置的是.）在哪，才会去获取到自己的边界。但是这里到最后就结束了，并没有找到下一个边界，所以不会匹配到最后一个

https://((www).(baidu).(com))
组0：https://www.baidu.com
组1：www.baidu.com
组2：www
组3：baidu
组4：com

匹配对象的重要方法：

group:获取给定子模式（组）的匹配项（若没有给出组号，默认为0.而且我们只能使用99个组（除0外），即1-99）

st = 'https://www.baidu.com'
pat = re.compile("https://((.*?)\.(.*?)\.(.*))")

ret3 = pat.search(st)

print(ret3)     #<_sre.SRE_Match object; span=(0, 21), match='https://www.baidu.com'>
print(ret3.group(0))    #https://www.baidu.com
print(ret3.group(1))    #www.baidu.com
print(ret3.group(2))    #www
print(ret3.group(3))    #baidu
print(ret3.group(4))    #com

View Code

start:获取给定组的开始位置

end:获取给定组的结束位置

span:获取一个组的开始和结束位置

st = 'https://www.baidu.com'
pat = re.compile("https://((.*?)\.(.*?)\.(.*))")

ret3 = pat.search(st)

print(ret3.group(2))    #www
print(ret3.span(2))     #(8, 11)
print(ret3.start(2))    #8
print(ret3.end(2))      #11

View Code

补充：组和sub

多用于页面模板渲染等。可以按照组号进行替换

st = 'https://www.baidu.com'
pat = re.compile("https://((.*?)\.(.*?)\.(.*))")

ret = pat.sub(r"\4",st)
# ret = re.sub(pat,r'\4',st)

print(ret)    #只返回了替换组号的数据com

注意：上面出现的情况是因为：

sub函数进行替换时：

sub(pat,repl,string)是使用repl将pat中匹配模式字符串全部替换，而我们这里pat就是 https://((.*?)\.(.*?)\.(.*)) ------ https://www.baidu.com，而repl就是我们获取的

com

,所以替换出了问题

这里顺便再举一个栗子，让我们好好重新了解一下什么是组：

pat2 = re.compile(r"\*\*(.+?)\*\*")
st = "**this** is **book**"

ret = pat2.sub(r'\1',st)  
#注意：sub会将所有pat的匹配项进行替换  **this**  和  **book**  都是符合我们pat匹配模式的匹配项。他们每一个都是一个单独的组，都有自己的组号
#而这里使用\1是去匹配了每一个组的组号为1的数据，都进行了替换（而且替换是将组中的数据都进行替换）
#将**this**  --> this
#将**book**  --> book
相当于将组0替换为我们想要的数据（这里我们想要注意，不能对组0进行替换操作,像\0是会得出错误信息的）

print(ret)
#this is book

这里我们想要注意，不能对组0进行替换操作,像\0是会得出错误信息的

pat2 = re.compile(r"\*\*(.+?)\*\*")
st = "**this** is **book**"

ret = pat2.sub(r'\0',st)
print(ret)

#  is    错误：\0获取的是空格

错误原因：

对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中，所捕获的每个子匹配都按照在正则表达式模式中从左到右出现的顺序存储。
缓冲区编号从 1 开始，最多可存储 99 个捕获的子表达式。

进行替换时获取数据\1   \组号会从缓存区中获取，而\0并没有存放在缓冲区中，所以获取的\0为空

而group(0)可以获取组0数据，是因为默认为0时，直接返回匹配对象中的字符串，而不是去缓冲区中去找（效率高）。但是对于sub替换时，则是无法去匹配对象中快速获取数据了

若是真的想替换整体数据，我们需要对整体加上括号作为一个组号来进行修改

pat2 = re.compile(r"(\*\*(.+)\*\*)")
st = "**this** is **book**"

ret = pat2.sub(r'\1',st) 
print(ret)
#**this** is **book**

其他补充看分类标签中正则部分

六：序列化json和pickle

通过将对象序列化可以将其存储在变量或者文件中,可以保存当时对象的状态,实现其生命周期的延长。并且需要时可以再次将这个对象读取出来。

其中主要有两个模块pickle和json，上面两个都有相似的功能：dumps,dump（序列化）,loads.load（反序列化）其中dumps和loads是直接转换为str字符串类型，进行操作，而dump和load是需要先将数据导入file-like Object中，然后读取出来。

pickle：用于【python特有的类型】和【python基本数据类型】间进行转换（只能在python内部工作）

cPickle和pickle功能是一样的，但是cPickle是c语言写的，速度要快写。
所以我们最好使用：
try:
    import cPickle as pickle
except ImportError:
    import pickle

序列化：

>>> d = dict(name='Bob', age=20, score=88)
>>> id(d)
17302664
>>> pickle.dumps(d)
b'\x80\x03}q\x00(X\x03\x00\x00\x00ageq\x01K\x14X\x04\x00\x00\x00nameq\x02X\x03\x
00\x00\x00Bobq\x03X\x05\x00\x00\x00scoreq\x04KXu.'
#这些都是Python保存的对象内部信息，是将在内存中存储的数据（对象）直接序列化

反序列化：

>>> d2 = pickle.loads(s)
>>> d2
{'age': 20, 'name': 'Bob', 'score': 88}
>>> id(d2)
17302472

注意：虽然pickle是将内存中的数据全部序列化，但是当反序列化后，获取的数据，只是数据相同，不再是原来的数据，由上面两个的id我们不难发现

json：用于【字符串】和【python基本数据类型】间进行转换（用于不同的编程语言之间传递对象）

与pickle相似，不过是将基本数据类型（列表，字典，string,int,float,bool,None等）转换为字符串

>>> d = dict(name='Bob', age=20, score=88)
>>> json.dumps(d)
'{"age": 20, "name": "Bob", "score": 88}'

补充：对于json序列化的这些基本数据类型。其实都是对象（python一切皆对象）

>>> dict(name='Bob', age=20, score=88)
{'age': 20, 'name': 'Bob', 'score': 88}
>>> type(dict)
<class 'type'>

那么我们能不能直接使用json来序列化对象？

class MyDict:
    def __init__(self,name,age):
        self.name = name
        self.age = age

d = MyDict("mk",6)

json.dumps(d)   #不行
#TypeError: <__main__.MyDict instance at 0x0000000002577BC8> is not JSON serializable不是可序列化对象

那么如何将一个对象变为可序列化对象。毕竟基础类型也是对象，而且序列化成功了。那么去看json.dumps提供的信息。查找时哪个参数会导致TypeError

def dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
        allow_nan=True, cls=None, indent=None, separators=None,
        encoding='utf-8', default=None, sort_keys=False, **kw):
    """Serialize ``obj`` to a JSON formatted ``str``.

    If ``skipkeys`` is false then ``dict`` keys that are not basic types
    (``str``, ``unicode``, ``int``, ``long``, ``float``, ``bool``, ``None``)
    will be skipped instead of raising a ``TypeError``.

    ......
    ``default(obj)`` is a function that should return a serializable version
    of obj or raise TypeError. The default simply raises TypeError.

    ......"""
    逻辑代码

其中skipkeys:是说对于字典的key，如果skipkeys设置是默认false，那么key只能是基础数据类型

(``str``, ``unicode``, ``int``, ``long``, ``float``, ``bool``, ``None``)

d = {'a':6,True:10,11:12,'d':[1,2,3]}  #对值（只要是python基础类型像字典，列表的话）没有其他要求

json.dumps(d,skipkeys=False)

但是key是其他像元组（可哈希类型），就会报错，TypeError

当skipkeys设置为True时，其他数据类型（可哈希的）就可以作为键（但是会将这个键值对跳过）：

d = {10:'faw',(12,2,):12}

ret = json.dumps(d,skipkeys=True)  #正确
{"10": "faw"}  #元组的消失了

其中default可以就是把任意一个对象变成一个可序列为JSON的对象，但是我们需要为`这个对象`专门写一个转换函数，再把函数传进去即可：

class MyDict:
    def __init__(self,name,age):
        self.name = name
        self.age = age


d = MyDict("mk",6)

def conv(obj):
    return {
        'name':obj.name,
        'age':obj.age
    }

ret = json.dumps(d,default=conv)
print(ret)  #{"age": 6, "name": "mk"}

对于不同的类我们需要写入不同的转换函数，这样有点麻烦，不如在定义类时，写入__dict__,序列化是就使用obj.__dict__进行序列化

补充：注意下转换函数，是对我们要json序列化中的特殊类型去进行转换

def conv(date_obj):
        return date_obj.strftime("%Y-%m-%d %H:%M:%S")

def batch_task_mgr(request):
    task_log_obj = models.TaskLogDetail.objects.filter(task=task_obj.task_obj).values("id","status","result",'date')　　#其中date是datetime类型，我们需要去转换
　　
    for task_log in task_log_obj:
        task_log['date2'] = task_log['date']　　#向字典找那个再添加一个特殊数据


    log_data = json.dumps(list(task_log_obj),default=conv)　　
　　 #现在数据是一个列表
　　 #[
　　 #{'id':1,'status':0,'result':'ddd', 'date': datetime.datetime(2018, 6, 14, 23, 11, 33, 719467, tzinfo=),'date2': 'date': datetime.datetime(2018, 6, 14, 23, 11, 33, 719467, tzinfo=)},
　　 #{'id':2,'status':0,'result':'ddd', 'date': datetime.datetime(2018, 6, 14, 23, 11, 33, 719467, tzinfo=),'date2': 'date': datetime.datetime(2018, 6, 14, 23, 11, 33, 719467, tzinfo=)},
　　 #]

上面的转换函数，会去每一个列表数据中获取特殊的，不能直接json序列化的数据，task_log_obj[0]['date'],task_log_obj[0]['date2']，task_log_obj[1]['date'],task_log_obj[1]['date2']这些数据分别放入conv中，作为参数进行处理

json反序列化对象

我们传入的是一个"对象"，返回的时候却是一个字典，这似乎不太符合我们的要求。同样的，我们查看帮助文档，看看反序列化时可否直接转换为对象

def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None,
        parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
 
    ``object_hook`` is an optional function that will be called with the
    result of any object literal decode (a ``dict``). The return value of
    ``object_hook`` will be used instead of the ``dict``. This feature
    can be used to implement custom decoders (e.g. JSON-RPC class hinting).

object_hook：是一个回调函数，我们自定义的解码函数，通过一个自定义解码函数，我们可以将数据拿去再建一个对象

class MyDict:
    def __init__(self,name,age):
        self.name = name
        self.age = age

def dconvo(dic):
    return MyDict(dic['name'],dic['age'])

lret = json.loads(ret,object_hook=dconvo)
print(lret)  #<__main__.MyDict instance at 0x00000000024E6EC8>

七：xml

XML是实现不同语言或程序之间进行数据交换的协议。类似于HTML标签


    "Liechtenstein">
        "yes">2
        2023
        141100
        "E" name="Austria" />
        "W" name="Switzerland" />
    
    "Singapore">
        "yes">5
        2026
        59900
        "N" name="Malaysia" />
    
    "Panama">
        "yes">69
        2026
        13600
        "W" name="Costa Rica" />
        "E" name="Colombia" />

xml基本格式

操作XML有三种方法：ElementTree，DOM和SAX。

DOM会把整个XML读入内存，解析为树，因此占用内存大，解析慢，优点是可以任意遍历树的节点。

SAX是流模式，边读边解析，占用内存小，解析快，缺点是我们需要自己处理事件。

ElementTree就像一个轻量级的DOM，具有方便友好的API。代码可用性好，速度快，消耗内存少，这里主要介绍ElementTree。

ElementTree

1.解析xml获取根节点：

from xml.etree import ElementTree as ET

#打开文件，读取xml内容
str_xml = open('ts.xml','r').read()

#将字符串解析为xml文档对象，获取xml文件的根节点
root = ET.XML(str_xml)

print(root)  #'data' at 0x253b7b8>

ElementTree.XML解析字符串

from xml.etree import ElementTree as ET

tree = ET.parse('ts.xml')   #获取整个文档树object at 0x00000000024C6EB8>

root = tree.getroot()   #获取根节点'data' at 0x24ce7f0>

ElementTree.parse直接解析文件

2.操作xml：xml格式是结点内可以嵌套，对于每一个结点都有相同的操作功能，便于操作

节点类型：

查找节点操作的功能：

class Element(object):

    tag = None  　　　　　　　　　　　　　　　　　　　　　　　  #当前节点的标签名,字符串
 
    attrib = None··　　　　　　　　　　　　　　　　　　　　　　 #当前节点的属性，字典，会有多个属性和值
　　 
    text = None　　　　　　　　　　　　　　　　　　  　　　　　 #当前节点的文本内容，字符串

    tail = None 　　　　　　　　　　　　　　　　　　　　　　　  #看全部代码中的注释。是该节点闭合后到下一个节点开始之间的文本（注释吗？不是注释哟）

    def __init__(self, tag, attrib={}, **extra):...　　　#初始化数据（上面的）

    def __repr__(self):...　　　　　　　　　　　　　　　　　　#输出指定格式字符串

class Test(object):
    def __init__(self,name,age):
        self.name = name
        self.age = age
        
t = Test("asde",16)
print(t)  #<__main__.Test object at 0x0000000001E449E8>
上面直接打印对象，并不是很友好，显示的是对象的内存地址

class Test(object):
    def __init__(self,name,age):
        self.name = name
        self.age = age

    def __str__(self):
        return "%s is %s"%(self.name,self.age)

t = Test("asde",16)
print(t)  #asde is 16
打印操作会首先尝试__str__和str内置函数(print运行的内部等价形式)，它通常应该返回一个友好的显示
但是在命令行中直接输出对象时，还是输出对象地址


>>> class Test(object):
...     def __init__(self,name,age):
...         self.name = name
...         self.age = age
...     def __repr__(self):
...         return "%s is %s"%(self.name,self.age)
...
>>> t = Test("asde",16)
>>> t
asde is 16
而__repr__不止对print对于命令行也是十分友好的

__repr__是面向程序开发者的，__str__是针对于用户

补充__repr__和_str__区别


    def makeelement(self, tag, attrib):...　　　　　　　　 #创建一个新节点

    def copy(self):...　　　　　　　　　　　　　　　　　　　　 #返回当前节点的复制本

    def __len__(self):...　　　　　　　　　　　　　　　　　　　#返回子节点个数

    def __nonzero__(self):...

    def __getitem__(self, index):...　　　　　　　　　　　　 #字典，列表操作，用于修改节点中的文本内容。
　　#但是这里只允许是int索引列表，毕竟通过key寻找的结点不是唯一，所以用int索引寻找更加可靠

    ##
    # Returns the number of subelements.  Note that this only counts
    # full elements; to check if there's any content in an element, you
    # have to check both the length and the text attribute.
    #
    # @return The number of subelements.

    def __setitem__(self, index, element):...


    def __delitem__(self, index):...

    def append(self, element):...　　　　　　　　　　　　　　#为当前节点追加一个元素

    def extend(self, elements):...　　　　　　　　　　　　　 #为当前节点追加多个子节点

    def insert(self, index, element):...　　　　　　　　　　#向当前节点中插入一个子节点

    def remove(self, element):...　　　　　　　　　　　　　　#删除当前节点中的某个子节点

    def getchildren(self):...　　　　　　　　　　　　　　　　 #获取所有子节点（废弃：直接使用list(节点)或者直接迭代即可）

    def find(self, path, namespaces=None):...　　　　　　  #获取第一个寻找到的子节点

    def findtext(self, path, default=None, namespaces=None):...   #获取第一个寻找到的子节点内容

    def findall(self, path, namespaces=None):...　　　　　 #获取所有指定子节点

    def iterfind(self, path, namespaces=None):...　　　　　#获取所有指定的子节点，并创建一个迭代器，可以被for循环

    def clear(self):...　　　　　　　　　　　　　　　　　　　　 #清空节点

    def get(self, key, default=None):...　　　　　　　　　　 #获取当前节点的属性值

    def set(self, key, value):...　　　　　　　　　　　　　　 #设置当前节点的属性值

    def keys(self):...　　　　　　　　　　　　　　　　　　　　  #获取当前节点的所有属性的keys

    def items(self):...　　　　　　　　　　　　　　　　　　　　 #获取当前节点的所有属性值,每个属性都是一个键值对

    def iter(self, tag=None):...　　　　　　　　　　　　　　　#在当前节点的子孙节点中寻找指定tag的所有节点，返回一个迭代器（for）

    def getiterator(self, tag=None):...　　　　　　　　     #与上面相似，看全部代码（废弃）

    def itertext(self):...　　　　　　　　　　　　　　　　　　 #根据节点名称self.tag寻找指定的结点内容，并返回一个迭代器

class Element(object):
    # text...tail

    ##
    # (Attribute) Element tag.

    tag = None

    ##
    # (Attribute) Element attribute dictionary.  Where possible, use
    # {@link #Element.get},
    # {@link #Element.set},
    # {@link #Element.keys}, and
    # {@link #Element.items} to access
    # element attributes.

    attrib = None

    ##
    # (Attribute) Text before first subelement.  This is either a
    # string or the value None.  Note that if there was no text, this
    # attribute may be either None or an empty string, depending on
    # the parser.

    text = None

    ##
    # (Attribute) Text after this element's end tag, but before the
    # next sibling element's start tag.  This is either a string or
    # the value None.  Note that if there was no text, this attribute
    # may be either None or an empty string, depending on the parser.

    tail = None # text after end tag, if any

    # constructor

    def __init__(self, tag, attrib={}, **extra):
        attrib = attrib.copy()
        attrib.update(extra)
        self.tag = tag
        self.attrib = attrib
        self._children = []

    def __repr__(self):
        return "" % (repr(self.tag), id(self))

    ##
    # Creates a new element object of the same type as this element.
    #
    # @param tag Element tag.
    # @param attrib Element attributes, given as a dictionary.
    # @return A new element instance.

    def makeelement(self, tag, attrib):
        return self.__class__(tag, attrib)

    ##
    # (Experimental) Copies the current element.  This creates a
    # shallow copy; subelements will be shared with the original tree.
    #
    # @return A new element instance.

    def copy(self):
        elem = self.makeelement(self.tag, self.attrib)
        elem.text = self.text
        elem.tail = self.tail
        elem[:] = self
        return elem

    ##
    # Returns the number of subelements.  Note that this only counts
    # full elements; to check if there's any content in an element, you
    # have to check both the length and the text attribute.
    #
    # @return The number of subelements.

    def __len__(self):
        return len(self._children)

    def __nonzero__(self):
        warnings.warn(
            "The behavior of this method will change in future versions.  "
            "Use specific 'len(elem)' or 'elem is not None' test instead.",
            FutureWarning, stacklevel=2
            )
        return len(self._children) != 0 # emulate old behaviour, for now

    ##
    # Returns the given subelement, by index.
    #
    # @param index What subelement to return.
    # @return The given subelement.
    # @exception IndexError If the given element does not exist.

    def __getitem__(self, index):
        return self._children[index]

    ##
    # Replaces the given subelement, by index.
    #
    # @param index What subelement to replace.
    # @param element The new element value.
    # @exception IndexError If the given element does not exist.

    def __setitem__(self, index, element):
        # if isinstance(index, slice):
        #     for elt in element:
        #         assert iselement(elt)
        # else:
        #     assert iselement(element)
        self._children[index] = element

    ##
    # Deletes the given subelement, by index.
    #
    # @param index What subelement to delete.
    # @exception IndexError If the given element does not exist.

    def __delitem__(self, index):
        del self._children[index]

    ##
    # Adds a subelement to the end of this element.  In document order,
    # the new element will appear after the last existing subelement (or
    # directly after the text, if it's the first subelement), but before
    # the end tag for this element.
    #
    # @param element The element to add.

    def append(self, element):
        # assert iselement(element)
        self._children.append(element)

    ##
    # Appends subelements from a sequence.
    #
    # @param elements A sequence object with zero or more elements.
    # @since 1.3

    def extend(self, elements):
        # for element in elements:
        #     assert iselement(element)
        self._children.extend(elements)

    ##
    # Inserts a subelement at the given position in this element.
    #
    # @param index Where to insert the new subelement.

    def insert(self, index, element):
        # assert iselement(element)
        self._children.insert(index, element)

    ##
    # Removes a matching subelement.  Unlike the find methods,
    # this method compares elements based on identity, not on tag
    # value or contents.  To remove subelements by other means, the
    # easiest way is often to use a list comprehension to select what
    # elements to keep, and use slice assignment to update the parent
    # element.
    #
    # @param element What element to remove.
    # @exception ValueError If a matching element could not be found.

    def remove(self, element):
        # assert iselement(element)
        self._children.remove(element)

    ##
    # (Deprecated) Returns all subelements.  The elements are returned
    # in document order.
    #
    # @return A list of subelements.
    # @defreturn list of Element instances

    def getchildren(self):
        warnings.warn(
            "This method will be removed in future versions.  "
            "Use 'list(elem)' or iteration over elem instead.",
            DeprecationWarning, stacklevel=2
            )
        return self._children

    ##
    # Finds the first matching subelement, by tag name or path.
    #
    # @param path What element to look for.
    # @keyparam namespaces Optional namespace prefix map.
    # @return The first matching element, or None if no element was found.
    # @defreturn Element or None

    def find(self, path, namespaces=None):
        return ElementPath.find(self, path, namespaces)

    ##
    # Finds text for the first matching subelement, by tag name or path.
    #
    # @param path What element to look for.
    # @param default What to return if the element was not found.
    # @keyparam namespaces Optional namespace prefix map.
    # @return The text content of the first matching element, or the
    #     default value no element was found.  Note that if the element
    #     is found, but has no text content, this method returns an
    #     empty string.
    # @defreturn string

    def findtext(self, path, default=None, namespaces=None):
        return ElementPath.findtext(self, path, default, namespaces)

    ##
    # Finds all matching subelements, by tag name or path.
    #
    # @param path What element to look for.
    # @keyparam namespaces Optional namespace prefix map.
    # @return A list or other sequence containing all matching elements,
    #    in document order.
    # @defreturn list of Element instances

    def findall(self, path, namespaces=None):
        return ElementPath.findall(self, path, namespaces)

    ##
    # Finds all matching subelements, by tag name or path.
    #
    # @param path What element to look for.
    # @keyparam namespaces Optional namespace prefix map.
    # @return An iterator or sequence containing all matching elements,
    #    in document order.
    # @defreturn a generated sequence of Element instances

    def iterfind(self, path, namespaces=None):
        return ElementPath.iterfind(self, path, namespaces)

    ##
    # Resets an element.  This function removes all subelements, clears
    # all attributes, and sets the text and tail attributes
    # to None.

    def clear(self):
        self.attrib.clear()
        self._children = []
        self.text = self.tail = None

    ##
    # Gets an element attribute.  Equivalent to attrib.get, but
    # some implementations may handle this a bit more efficiently.
    #
    # @param key What attribute to look for.
    # @param default What to return if the attribute was not found.
    # @return The attribute value, or the default value, if the
    #     attribute was not found.
    # @defreturn string or None

    def get(self, key, default=None):
        return self.attrib.get(key, default)

    ##
    # Sets an element attribute.  Equivalent to attrib[key] = value,
    # but some implementations may handle this a bit more efficiently.
    #
    # @param key What attribute to set.
    # @param value The attribute value.

    def set(self, key, value):
        self.attrib[key] = value

    ##
    # Gets a list of attribute names.  The names are returned in an
    # arbitrary order (just like for an ordinary Python dictionary).
    # Equivalent to attrib.keys().
    #
    # @return A list of element attribute names.
    # @defreturn list of strings

    def keys(self):
        return self.attrib.keys()

    ##
    # Gets element attributes, as a sequence.  The attributes are
    # returned in an arbitrary order.  Equivalent to attrib.items().
    #
    # @return A list of (name, value) tuples for all attributes.
    # @defreturn list of (string, string) tuples

    def items(self):
        return self.attrib.items()

    ##
    # Creates a tree iterator.  The iterator loops over this element
    # and all subelements, in document order, and returns all elements
    # with a matching tag.
    # 
    # If the tree structure is modified during iteration, new or removed
    # elements may or may not be included.  To get a stable set, use the
    # list() function on the iterator, and loop over the resulting list.
    #
    # @param tag What tags to look for (default is to return all elements).
    # @return An iterator containing all the matching elements.
    # @defreturn iterator

    def iter(self, tag=None):
        if tag == "*":
            tag = None
        if tag is None or self.tag == tag:
            yield self
        for e in self._children:
            for e in e.iter(tag):
                yield e

    # compatibility
    def getiterator(self, tag=None):
        # Change for a DeprecationWarning in 1.4
        warnings.warn(
            "This method will be removed in future versions.  "
            "Use 'elem.iter()' or 'list(elem.iter())' instead.",
            PendingDeprecationWarning, stacklevel=2
        )
        return list(self.iter(tag))

    ##
    # Creates a text iterator.  The iterator loops over this element
    # and all subelements, in document order, and returns all inner
    # text.
    #
    # @return An iterator containing all inner text.
    # @defreturn iterator

    def itertext(self):
        tag = self.tag
        if not isinstance(tag, basestring) and tag is not None:
            return
        if self.text:
            yield self.text
        for e in self:
            for s in e.itertext():
                yield s
            if e.tail:
                yield e.tail

全部代码

注意：只有iter会获取匹配子孙节点，其他的只会获取下一级中的子节点

a：获取结点的成员属性以及使用iter遍历指定的子孙所有节点

tree = ET.parse('ts.xml')   #获取整个文档树object at 0x00000000024C6EB8>

root = tree.getroot()   #获取根节点'data' at 0x24ce7f0>

first_rank = root.iter('rank')
for item in first_rank:
    print(item.tag,item.attrib,item.text,item.tail)
输出结果：
('rank', {'updated': 'yes'}, '2', '\n        ')
('rank', {'updated': 'yes'}, '5', '\n        ')
('rank', {'updated': 'yes'}, '69', '\n        ')

View Code

b：获取遍历xml文档所有内容（3层）

from xml.etree import ElementTree as ET

tree = ET.parse('ts.xml')   #获取整个文档树object at 0x00000000024C6EB8>

root = tree.getroot()   #获取根节点'data' at 0x24ce7f0>

#已知节点共3层
#遍历第二层
for child in root:
    print(child.tag,child.attrib)
    #遍历第三层
    for item in child:
        print('---%s-%s'%(item.tag,item.text),item.attrib)

View Code

c：修改节点内容

注意：由于修改的节点时，均是在内存中进行，其不会影响文件中的内容。所以，如果想要修改，则需要重新将内存中的内容写到文件。

from xml.etree import ElementTree as ET

data = open("ts.xml","r").read()
root = ET.XML(data)

for item in root.iter("rank"):
    #排名内容加一
    new_rank = int(item.text) + 1
    item.text = str(new_rank)   #注意只能是字符串，否则TypeError

    #添加/修改属性
    item.set('name','dsa')

    #删除属性
    del item.attrib['name']  #因为属性本来就是字典


#上面操作都是在内存中进行的，我们需要将他保存在文件中
#而保存数据，需要树结构，然后向树中添加数据（将根节点添加上去，数据都会添加，就像链表一样）
#保数据
tree = ET.ElementTree(root)
tree.write("newts.xml",encoding="utf-8")

解析字符串来修改和保存文件

from xml.etree import ElementTree as ET

tree = ET.parse('ts.xml')   #获取整个文档树object at 0x00000000024C6EB8>
root = tree.getroot()   #获取根节点'data' at 0x24ce7f0>

for item in root.iter("rank"):
    #排名内容加一
    new_rank = int(item.text) + 1
    item.text = str(new_rank)   #注意只能是字符串，否则TypeError

    #添加/修改属性
    item.set('name','dsa')

    #删除属性
    del item.attrib['name']  #因为属性本来就是字典


#保数据
#树在解析文件时已经存在，这棵树是包含所有数据的（包括根节点）
tree.write("newts.xml",encoding="utf-8")

直接解析文件来修改和保存文件

d:删除节点，只写了解析字符串。另一种同上

from xml.etree import ElementTree as ET

tree = ET.parse('ts.xml')   #获取整个文档树object at 0x00000000024C6EB8>
root = tree.getroot()   #获取根节点'data' at 0x24ce7f0>

for item in root.findall("country"):
    #排名小于大于50删除
    rank = int(item.find("rank").text)
    if rank > 50:
        root.remove(item)   #remove是根据父来移除子


#上面操作都是在内存中进行的，我们需要将他保存在文件中
#而保存数据，需要树结构，而且每个树需要一个根节点
#保数据
tree = ET.ElementTree(root)
tree.write("newts.xml",encoding="utf-8")

解析字符串来删除结点和保存文件

3.创建xml文档

创建方式和上面的解析字符串后保存文档相似。都是需要树结构（文档对象），xml数据,其中数据需要通过根节点添加进入树结构中，才可以被保存

创建方式有3种：

方式一：先创建好各个元素节点（相互之间并没有关联），然后使用append向上级逐渐追加，最后将根节点放入文档对象，然后写入文件。使用Element和append

from xml.etree import ElementTree as ET

#创建元素
root = ET.Element("School")

major1 = ET.Element("major",{'name':"材料"})
major2 = ET.Element("major",{'name':"计算机"})

classes1 = ET.Element("class")
classes1.text = "3"

classes2 = ET.Element("class")
classes2.text = "5"
#创建连接关系

#专业添加班级数
major1.append(classes1)
major2.append(classes2)

#根节点添加专业
root.append(major1)
root.append(major2)

#保存
tree = ET.ElementTree(root)
tree.write("school.xml",encoding="utf-8",xml_declaration=True)

View Code

注意：python2.7不支持中文写入，需要再做处理，分析:windows下cmd默认的编码是ASCII编码 ,windows的中文环境下编码是GBK（一般我们还是保存为utf-8）

在python2.7中，还是支持reload和setdefaultdefault这两个函数的（python3中已经全部统一为Unicode，所以不需要，被废弃了）

from xml.etree import ElementTree as ET
import sys

#创建元素
root = ET.Element("School")
print(sys.getdefaultencoding()) #ascii
reload(sys)
sys.setdefaultencoding("utf-8")

major1 = ET.Element("major",{'name':"材料"})
major2 = ET.Element("major",{'name':"计算机"})

classes1 = ET.Element("class")
classes1.text = "3"

classes2 = ET.Element("class")
classes2.text = "5"
#创建连接关系

#专业添加班级数
major1.append(classes1)
major2.append(classes2)

#根节点添加专业
root.append(major1)
root.append(major2)

#保存
tree = ET.ElementTree(root)
tree.write("school.xml",encoding="utf-8",xml_declaration=True)

python写入中文的处理

方式二：使用makeelement创建节点。和直接创建相似。但是这个方法的功能似乎有点不对，原意应该是使用当前节点去创建子节点。但是这里的实现方法和方法一一样。只是单纯创建一个独立的节点。并没有关联。python3中也提及使用SubElement代替他，所以只需简单了解这个方法

    　　"""Create a new element with the same type.

        *tag* is a string containing the element name.
        *attrib* is a dictionary containing the element attributes.

        Do not call this method, use the SubElement factory function instead.

        """

from xml.etree import ElementTree as ET


#创建元素
root = ET.Element("School")

major1 = root.makeelement("major",{'name':"材料"})
major2 = root.makeelement("major",{'name':"计算机"})

classes1 = major1.makeelement("class",{})
classes1.text = "3"

classes2 = major2.makeelement("class",{})
classes2.text = "5"
#创建连接关系

#专业添加班级数
major1.append(classes1)
major2.append(classes2)

#根节点添加专业
root.append(major1)
root.append(major2)

#保存
tree = ET.ElementTree(root)
tree.write("school2.xml",encoding="utf-8",xml_declaration=True)

基本使用

major1 = root.makeelement("major",{'name':"材料"})
major2 = root.makeelement("major",{'name':"计算机"})

classes1 = major1.makeelement("class",{})
classes1.text = "3"

classes2 = major2.makeelement("class",{})
classes2.text = "5"
#创建连接关系

#专业添加班级数
major1.append(classes2)
major2.append(classes1)


#从这个例子中不难看出，这里只是单纯的创建一个独立的节点。对于是谁（哪个节点）创建的他，并没有任何关联
上面例子中使用    “材料”创建班级3个，“计算机”创建班级5个，但是添加关系时，调换顺序后，依然成功。所以说。这个功能有点鸡肋。要想实现可以直接使用Element类创建，或者使用sunelement方法

makeelement新节点与创建他的节点没有关联

方法三：使用SubElement（该方法属于ElementTree）为当前节点创建子节点，创建时自动添加管理，不需要我们再去追加。

def SubElement(parent, tag, attrib={}, **extra)

from xml.etree import ElementTree as ET


#创建元素
root = ET.Element("School")

major1 = ET.SubElement(root,"major",{'name':"材料"})
major2 = ET.SubElement(root,"major",{'name':"计算机"})

classes1 = ET.SubElement(major1,"class",{})
classes1.text = "3"

classes2 = ET.SubElement(major2,"class",{})
classes2.text = "5"

#保存
tree = ET.ElementTree(root)
tree.write("school3.xml",encoding="utf-8",xml_declaration=True)

View Code

注意：我们使用上面方法创建的是不带缩进的，完全写在一起。不利于人为浏览。所以我们需要设置缩进xml.dom中的minidom

from xml.etree import ElementTree as ET
from xml.dom import minidom

#对xml节点转换为字符串进行缩进处理
def prettify(elem):
    '''
    对xml节点转换为字符串进行缩进处理
    :param elem:
    :return:
    '''
    elem_str = ET.tostring(elem,encoding="utf-8")   #先解析为字符串
    reparsed = minidom.parseString(elem_str)        #再将字符串解析为dom对象，因为dom中含有可以处理缩进的方法
    return reparsed.toprettyxml(indent='\t')        #将dom对象转换为字符串（其中添加缩进）

#创建元素
root = ET.Element("School")

major1 = ET.SubElement(root,"major",{'name':"材料"})
major2 = ET.SubElement(root,"major",{'name':"计算机"})

classes1 = ET.SubElement(major1,"class",{})
classes1.text = "3"

classes2 = ET.SubElement(major2,"class",{})
classes2.text = "5"

raw_string = prettify(root)

#保存
fp = open("school5.xml","w",encoding="utf-8")
fp.write(raw_string)
fp.close()

自定义方法中调用函进行转换。保存时需要使用文件保存方法

4.命名空间：

XML 命名空间提供避免元素命名冲突的方法。

python操作命名空间：

ET.register_namespace('com',"http://www.company.com") #some name

# build a tree structure
root = ET.Element("{http://www.company.com}STUFF")
body = ET.SubElement(root, "{http://www.company.com}MORE_STUFF", attrib={"{http://www.company.com}hhh": "123"})
body.text = "STUFF EVERYWHERE!"

# wrap it in an ElementTree instance, and save as XML
tree = ET.ElementTree(root)

View Code

八：shutil（高级的文件、文件夹、压缩包处理模块）

对外接口：

__all__ = ["copyfileobj", "copyfile", "copymode", "copystat", "copy", "copy2",
           "copytree", "move", "rmtree", "make_archive","unpack_archive",

 ...]

1.copyfileobj(fsrc, fdst, length=16*1024)将文件内容拷贝拷贝到另一个文件中去（需要将两个文件打开，注意编码）

import shutil

shutil.copyfileobj(open('school3.xml','r',encoding="utf-8"),open('new_sch.xml','w',encoding="utf-8"))

copyfileobj

2.copyfile(src, dst, *, follow_symlinks=True)：拷贝文件

import shutil

shutil.copyfile('school3.xml','new_sch3.xml')

copyfile

3.copymode(src, dst, *, follow_symlinks=True)：仅仅拷贝权限，其他内容不变

import shutil

shutil.copymode('newts.xml','2.xml')

copymode

4.copystat(src, dst, *, follow_symlinks=True)：仅拷贝状态（主要是访问时间，修改时间）创建时间没有修改，而且dst文件必须已存在(mode bits, atime, mtime, flags)

import shutil

shutil.copystat('newts.xml','2.xml')

copystat

5.copy(src, dst, *, follow_symlinks=True)：拷贝内容数据和权限Copy data and mode bits ("cp src dst")

import shutil

ret = shutil.copy('newts.xml','2.xml')  #返回目的文件名
print(ret)#2.xml

copy

6.copy2(src, dst, *, follow_symlinks=True):拷贝文件数据和状态信息Copy data and all stat info ("cp -p src dst")

import shutil

ret = shutil.copy2('newts.xml','2.xml')  #返回目的文件名
print(ret)#2.xml

copy2

7.copytree(src, dst, symlinks=False, ignore=None, copy_function=copy2, ignore_dangling_symlinks=False)：拷贝目录树，且目的目录不存在

注意：会将下面的文件一起拷贝，注意避免循环拷贝，不然报错，而且占据大量空间

import shutil

ret = shutil.copytree("D:/MyPython/day24/基础回顾","D:/tree/")

copytree

8.move(src, dst, copy_function=copy2)：移动文件，目的目录必须已存在

import shutil

ret = shutil.move("1.xml","D:/MyPython/day24/基础回顾")

move

9.rmtree(path, ignore_errors=False, οnerrοr=None)：递归的删除目录下的文件已经目录

import shutil

ret = shutil.rmtree("D:/MyPython/day24/基础回顾/02")

rmtree

10.make_archive(base_name, format, root_dir=None, base_dir=None, verbose=0, dry_run=0, owner=None, group=None, logger=None):

压缩文件，并返回文件路径：

'format' is the archive format: one of "zip", "tar", "gztar",
    "bztar", or "xztar".  Or any other registered format.

def register_archive_format(name, function, extra_args=None, description=''):
    """Registers an archive format.

    name is the name of the format. function is the callable that will be
    used to create archives. If provided, extra_args is a sequence of
    (name, value) tuples that will be passed as arguments to the callable.
    description can be provided to describe the format, and will be returned
    by the get_archive_formats() function.
    """
    if extra_args is None:
        extra_args = []
    if not callable(function):
        raise TypeError('The %s object is not callable' % function)
    if not isinstance(extra_args, (tuple, list)):
        raise TypeError('extra_args needs to be a sequence')
    for element in extra_args:
        if not isinstance(element, (tuple, list)) or len(element) !=2:
            raise TypeError('extra_args elements are : (arg_name, value)')

    _ARCHIVE_FORMATS[name] = (function, extra_args, description)

register_archive_format

base_name:压缩后的文件名

format:压缩格式（后缀会显示在文件名后面）

root_dir:要压缩的文件夹路径，必须是目录，默认是压缩当前文件夹。注意，若是没有base_dir压缩的文件中解压后全是文件（不含目录）

base_dir:会将目录一块压缩（不含根目录），而且可以指定文件进行压缩。优先级高于root_dir

owner:用户，默认当前用户

group:组，默认当前组

logger:用于记录日志，通常是logging.Logger对象

import shutil

ret = shutil.make_archive("3","zip",base_dir="D:/MyPython/day24/基础回顾/03/1.xml")  #返回目的文件名
print(ret)#3.zip

其中3.zip中目录结构是：MyPython/day24/基础回顾/03/1.xml

base_dir

import shutil

ret = shutil.make_archive("3","zip",root_dir="D:/MyPython/day24/基础回顾/03/")  #返回目的文件名
print(ret)#D:\MyPython\day24\基础回顾\01装饰器\3.zip

#其中3.zip中是root_dir目录下的文件及目录

root_dir

import shutil

ret = shutil.make_archive("3","zip",root_dir="D:/MyPython/day24/基础回顾/02/",base_dir="D:/MyPython/day24/基础回顾/03/2.xml")  #返回目的文件名
print(ret)#D:\MyPython\day24\基础回顾\01装饰器\3.zip

#其中内容会是 MyPython/day24/基础回顾/03/2.xml，几乎与root_dir无关了，但是加上root_dir会返回压缩文件的全路径

base_dir和root_dir

11.unpack_archive(filename, extract_dir=None, format=None)：解压文件,filename:文件名,extract_dir:解压目录，默认当前，，format：默认文件后缀

import shutil

shutil.unpack_archive("3.zip")

unpack_archive

.....

九：configparser

configparser用于处理特定格式的文件（配置文件），其本质上是利用open来操作文件。

A configuration file consists of sections, lead by a "[section]" header,
and followed by "name: value" entries, with continuations and such in
the style of RFC 822.

如：my.ini中

[client]

port=3306

[mysql]

default-character-set=utf8

也支持key:val

# Example MySQL config file for small systems.
#
# This is for a system with little memory (<= 64M) where MySQL is only used
# from time to time and it's important that the mysqld daemon
# doesn't use much resources.
#
# MySQL programs look for option files in a set of
# locations which depend on the deployment platform.
# You can copy this option file to one of those
# locations. For information about these locations, see:
# http://dev.mysql.com/doc/mysql/en/option-files.html
#
# In this file, you can use all long options that a program supports.
# If you want to know which options a program supports, run the program
# with the "--help" option.

# The following options will be passed to all MySQL clients
[client]
#password    = your_password
port        = 3306
socket        = /tmp/mysql.sock

# Here follows entries for some specific programs

# The MySQL server
[mysqld]
port        = 3306
socket        = /tmp/mysql.sock
;skip-external-locking
key_buffer_size = 16K
max_allowed_packet = 1M
table_open_cache = 4
sort_buffer_size = 64K
read_buffer_size = 256K
read_rnd_buffer_size = 256K
net_buffer_length = 2K
thread_stack = 128K

# Don't listen on a TCP/IP port at all. This can be a security enhancement,
# if all processes that need to connect to mysqld run on the same host.
# All interaction with mysqld must be made via Unix sockets or named pipes.
# Note that using this option without enabling named pipes on Windows
# (using the "enable-named-pipe" option) will render mysqld useless!
# 
#skip-networking
server-id    = 1

# Uncomment the following if you want to log updates
#log-bin=mysql-bin

# binary logging format - mixed recommended
#binlog_format=mixed

# Causes updates to non-transactional engines using statement format to be
# written directly to binary log. Before using this option make sure that
# there are no dependencies between transactional and non-transactional
# tables such as in the statement INSERT INTO t_myisam SELECT * FROM
# t_innodb; otherwise, slaves may diverge from the master.
#binlog_direct_non_transactional_updates=TRUE

# Uncomment the following if you are using InnoDB tables
#innodb_data_home_dir = C:\\mysql\\data\\
#innodb_data_file_path = ibdata1:10M:autoextend
#innodb_log_group_home_dir = C:\\mysql\\data\\
# You can set .._buffer_pool_size up to 50 - 80 %
# of RAM but beware of setting memory usage too high
#innodb_buffer_pool_size = 16M
#innodb_additional_mem_pool_size = 2M
# Set .._log_file_size to 25 % of buffer pool size
#innodb_log_file_size = 5M
#innodb_log_buffer_size = 8M
#innodb_flush_log_at_trx_commit = 1
#innodb_lock_wait_timeout = 50

[mysqldump]
;quick
max_allowed_packet = 16M

[mysql]
;no-auto-rehash
# Remove the next comment character if you are not familiar with SQL
#safe-updates

[myisamchk]
key_buffer_size = 8M
sort_buffer_size = 8M

[mysqlhotcopy]
;interactive-timeout

my.ini

1.获取所有节点：

import configparser

config = configparser.ConfigParser()
config.read("my.ini",encoding="utf-8")

ret = config.sections()  #获取所有节点
print(ret)  #['client', 'mysqld', 'mysqldump', 'mysql', 'myisamchk', 'mysqlhotcopy']

2.获取指定节点下的所有键值对：

import configparser

config = configparser.ConfigParser()
config.read("my.ini",encoding="utf-8")

ret = config.items("client")

print(ret)  #[('port', '3306'), ('socket', '/tmp/mysql.sock')]

3.获取指定节点下的所有key：

ret = config.options("client")

print(ret)  #['port', 'socket']

4.获取指定节点下指定key的值：

ret = config.get("client","port")

print(ret)  #3306

5.检测，删除，添加节点：（注意：对于更新节点后，最后及时更新文件write）

import configparser

config = configparser.ConfigParser()
config.read("my.ini",encoding="utf-8")

#检测
has_sec = config.has_section("client")
print(has_sec) #True
has_sec = config.has_section("client2")
print(has_sec) #False

#添加：
config.add_section("client2")  #已存在的节点再添加会出错
config.write(open("my.ini",'w'))

#删除：
config.remove_section("client2")
config.write(open("my.ini",'w'))

6.检测，删除，添加节点下的键值对

import configparser

config = configparser.ConfigParser()
config.read("my.ini",encoding="utf-8")

#检测
has_sec = config.has_option("client","port")
print(has_sec) #True
has_sec = config.has_option("client","port2")
print(has_sec) #False

#添加和更新：
config.set("client","port2","1223")
config.write(open("my.ini",'w'))

#删除：
config.remove_option("client","port2")
config.write(open("my.ini",'w'))

十：logging日志模块

用于便捷记录日志且线程安全的模块

1.单文件日志

a.控制台流输出日志：

import logging
import sys

logging.basicConfig(stream=sys.stdout,
                    format="%(asctime)s - %(name)s -%(levelname)s -%(module)s:  %(message)s",
                    datefmt='%Y-%m-%d %H:%M:%S %p',
                    level=10)


logging.debug("debug")
logging.info("info")
logging.warning("warning")
logging.error('error')
logging.critical('critical')
logging.log(9,'log')

b.文件输出日志：

import logging

logging.basicConfig(filename='log.log',
                    format="%(asctime)s - %(name)s -%(levelname)s -%(module)s:  %(message)s",
                    datefmt='%Y-%m-%d %H:%M:%S %p',
                    level=10)

logging.debug("debug")
logging.info("info")
logging.warning("warning")
logging.error('error')
logging.critical('critical')
logging.log(10,'log')　　#注意log(level,msg,...)

CRITICAL = 50
FATAL = CRITICAL
ERROR = 40
WARNING = 30
WARN = WARNING
INFO = 20
DEBUG = 10
NOTSET = 0

日志等级

当前等级大于等于日志等级时，才会被记录

logging.basicConfig()函数中的具体参数：
filename：指定的文件名创建FiledHandler，这样日志会被存储在指定的文件中；
filemode：   文件打开方式，在指定了filename时使用这个参数，默认值为“w”还可指定为“a”；
format：指定handler使用的日志显示格式；
datefmt：指定日期时间格式。，格式参考strftime时间格式化（下文）
level：设置rootlogger的日志级别
stream：   用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件，默认为sys.stderr。
  若同时列出了filename和stream两个参数，则stream参数会被忽略。

format参数中可能用到的格式化信息：

%(name)s	Logger的名字
%(levelno)s	数字形式的日志级别
%(levelname)s	文本形式的日志级别
%(pathname)s	调用日志输出函数的模块的完整路径名，可能没有
%(filename)s	调用日志输出函数的模块的文件名
%(module)s	调用日志输出函数的模块名
%(funcName)s	调用日志输出函数的函数名
%(lineno)d	调用日志输出函数的语句所在的代码行
%(created)f	当前时间，用UNIX标准的表示时间的浮点数表示
%(relativeCreated)d	输出日志信息时的，自Logger创建以来的毫秒数
%(asctime)s	字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d	线程ID。可能没有
%(threadName)s	线程名。可能没有
%(process)d	进程ID。可能没有
%(message)s	用户输出的消息

2.若是想让流和文件日志一块存在，需要向日志对象添加句柄logging.getLogger().addHandler(console)

若是想在控制台显示日志，需要加上：

import logging

logging.basicConfig(filename='log.log',
                    format="%(asctime)s - %(name)s -%(levelname)s -%(module)s:  %(message)s",
                    datefmt='%Y-%m-%d %H:%M:%S %p',
                    level=10)

View Code

console = logging.StreamHandler()                  # 定义一个流handler，用于系统输出（控制台）
console.setLevel(logging.INFO)                     # 定义控制台输出日志级别
formatter = logging.Formatter('%(asctime)s  %(filename)s : %(levelname)s  %(message)s')  #定义该日志格式
console.setFormatter(formatter)　　#设置格式

print(logging.getLogger())  #  #是一个日志对象

logging.getLogger().addHandler(console) # 获取当前日志对象，然后向该日志添加日志句柄（放入self.handlers列表中），在输出日志时，会去循环Logger对象中的self.handlers = []

    def callHandlers(self, record):
        """
        Pass a record to all relevant handlers.

        Loop through all handlers for this logger and its parents in the
        logger hierarchy. If no handler was found, output a one-off error
        message to sys.stderr. Stop searching up the hierarchy whenever a
        logger with the "propagate" attribute set to zero is found - that
        will be the last logger whose handlers are called.
        """
        c = self
        found = 0
        while c:
            for hdlr in c.handlers:
                found = found + 1
                if record.levelno >= hdlr.level:
                    hdlr.handle(record)
            if not c.propagate:
                c = None    #break out
            else:
                c = c.parent
        if (found == 0):
            if lastResort:
                if record.levelno >= lastResort.level:
                    lastResort.handle(record)
            elif raiseExceptions and not self.manager.emittedNoHandlerWarning:
                sys.stderr.write("No handlers could be found for logger"
                                 " \"%s\"\n" % self.name)
                self.manager.emittedNoHandlerWarning = True

内部代码

logging.debug("debug")
logging.info("info")
logging.warning("warning")
logging.error('error')
logging.critical('critical')
logging.log(9,'log')

View Code

若想输出多文件日志：

logging.basicConfig(stream=sys.stdout,
                    format="%(asctime)s - %(name)s -%(levelname)s -%(module)s:  %(message)s",
                    datefmt='%Y-%m-%d %H:%M:%S %p',
                    level=10)
file1 = logging.FileHandler("f1.log",'a',encoding="utf-8")
fmt = logging.Formatter("%(asctime)s - %(name)s -%(levelname)s -%(module)s:  %(message)s")
file1.setFormatter(fmt)

file2 = logging.FileHandler("f2.log",'a',encoding="utf-8")
fmt = logging.Formatter("%(asctime)s - %(name)s -%(levelname)s -%(module)s:  %(message)s")
file2.setFormatter(fmt)

logging.getLogger().addHandler(file1)
logging.getLogger().addHandler(file2)

logging.debug("debug")
logging.info("info")
logging.warning("warning")
logging.error('error')
logging.critical('critical')
logging.log(9,'log')

十一：datetime和time模块

datetime：datetime是Python处理日期和时间的标准库。

1.获取当前日期：

>>> import datetime
>>> dt = datetime.datetime.now()  
>>> dt
datetime.datetime(2018, 4, 20, 21, 0, 29, 308843)
>>> print(dt)
2018-04-20 21:00:29.308843
>>> type(dt)
<class 'datetime.datetime'>

2.获取指定日期：

>>> dt = datetime.datetime(2018,4,12,12,24)
>>> dt
datetime.datetime(2018, 4, 12, 12, 24)
>>> print(dt)
2018-04-12 12:24:00

3.datetime转时间戳timestamp

在计算机中，时间实际上是用数字表示的。我们把1970年1月1日 00:00:00 UTC+00:00时区的时刻称为epoch time，记为0（1970年以前的时间timestamp为负数），
当前时间就是相对于epoch time的秒数，称为timestamp。

timestamp = 0 = 1970-1-1 00:00:00 UTC+0:00

>>> dt.timestamp()
1523507040.0

4.timestamp时间戳转datetime

>>> datetime.datetime.fromtimestamp(st)
datetime.datetime(2018, 4, 12, 12, 24)

5.str转datetime:转换方法是通过datetime.strptime()实现，需要一个日期和时间的格式化字符串：

>>> datetime.datetime.strptime("2016-4-12 18:12:59",'%Y-%m-%d %H:%M:%S')
datetime.datetime(2016, 4, 12, 18, 12, 59)

6.datetime转str

一般格式：直接print即可，因为datetime中内置__str__

>>> st = datetime.datetime.now().__str__()
>>> st
'2018-04-20 21:09:29.068715'
>>> type(st)
<class 'str'>

但是要进行格式转换，则需要strftime()

from datetime import datetime

now = datetime.now()

st = now.strftime("%Y-%m-%d")
print(st)  #2018-04-20

7.datetime进行加减

需要导入timedelta类

from datetime import datetime,timedelta

now = datetime.now()
now = now + timedelta(days=10)

st = now.strftime("%Y-%m-%d")
print(st)  #2018-04-30

time

时间相关的操作，时间有三种表示方式：

时间戳 1970年1月1日之后的秒，即：time.time()
格式化的字符串 2018-04-20，即：time.strftime('%Y-%m-%d')
结构化时间元组包含了：年、日、星期等... time.struct_time 即：time.localtime()

time操作的主要函数

localtime([secs])　　　 将秒数转换为日期元组，不写秒数，默认现在时间
asctime([tuple])　　　　将时间元组转换为字符串
mktime([tuple])　　　　 将时间元组转换为秒数，与localtime相反
sleep(secs)　　　　　　  休眠
strptime　　　　　　　　  字符串解析为时间元组
strftime　　　　　　　　　将时间格式为字符串
time()　　　　　　　　　　当前时间戳

>>> import time
>>> time.time()
1524230368.0729766
>>> time.strftime("%Y-%m-%d")
'2018-04-20'
>>> time.localtime()  #返回一个日期结构元组，可用下面的asctime进行转换
time.struct_time(tm_year=2018, tm_mon=4, tm_mday=20, tm_hour=21, tm_min=20, tm_s
ec=21, tm_wday=4, tm_yday=110, tm_isdst=0)
>>> time.asctime()　　
'Fri Apr 20 21:21:47 2018'

　　 Convert a time tuple to a string, e.g. 'Sat Jun 06 16:26:11 1998'.
    When the time tuple is not present, current time as returned by localtime()
    is used.

>>> time.strptime("2017-01-02","%Y-%m-%d")　　#字符串转换为时间格式
time.struct_time(tm_year=2017, tm_mon=1, tm_mday=2, tm_hour=0, tm_min=0, tm_sec
0, tm_wday=0, tm_yday=2, tm_isdst=-1)

    %Y  Year with century as a decimal number.
    %m  Month as a decimal number [01,12].
    %d  Day of the month as a decimal number [01,31].
    %H  Hour (24-hour clock) as a decimal number [00,23].
    %M  Minute as a decimal number [00,59].
    %S  Second as a decimal number [00,61].
    %z  Time zone offset from UTC.
    %a  Locale's abbreviated weekday name.
    %A  Locale's full weekday name.
    %b  Locale's abbreviated month name.
    %B  Locale's full month name.
    %c  Locale's appropriate date and time representation.
    %I  Hour (12-hour clock) as a decimal number [01,12].
    %p  Locale's equivalent of either AM or PM.

日期占位符

注意：

datetime表示的时间需要时区信息才能确定一个特定的时间，否则只能视为本地时间。

如果要存储datetime，最佳方法是将其转换为timestamp再存储，因为timestamp的值与时区完全无关。

十二：paramiko

paramiko是一个用于做远程控制的模块，使用该模块可以对远程服务器进行命令或文件操作，值得一说的是，fabric和ansible内部的远程管理就是使用的paramiko来现实。

import paramiko

ssh = paramiko.SSHClient()
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
ssh.connect('192.168.218.128', 22, 'adminld', 'adminld')
stdin, stdout, stderr = ssh.exec_command('df')
print(stdout.read())
ssh.close()

执行命令 -- 用户名+密码

import paramiko

private_key_path = '/home/auto/.ssh/id_rsa'
key = paramiko.RSAKey.from_private_key_file(private_key_path)

ssh = paramiko.SSHClient()
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
ssh.connect('主机名 ', 端口, '用户名', key)

stdin, stdout, stderr = ssh.exec_command('df')
print stdout.read()
ssh.close()

使用私钥免密码登录

paramiko 远程登录

python运维之paramiko

注意：下面的上传和下载文件，都必须写文件路径，而不是目录

import os,sys
import paramiko

t = paramiko.Transport(('192.168.218.128',22))
t.connect(username='adminld',password='adminld')
sftp = paramiko.SFTPClient.from_transport(t)
sftp.put('/tmp/test.py','/tmp/test.py')
t.close()


import os,sys
import paramiko

t = paramiko.Transport(('192.168.218.128',22))
t.connect(username='adminld',password='adminld')
sftp = paramiko.SFTPClient.from_transport(t)
sftp.get('/tmp/test.py','/tmp/test2.py')
t.close()

上传下载文件（使用用户名密码）

import paramiko

private_key_path = 'pwd'
key = paramiko.RSAKey.from_private_key_file(private_key_path,password="adminld")

t = paramiko.Transport(('192.168.218.128',22))
t.connect(username='adminld',pkey=key)

sftp = paramiko.SFTPClient.from_transport(t)
sftp.put('/tmp/test.py','/tmp/test.py')
t.close()

import paramiko

private_key_path = 'pwd'
key = paramiko.RSAKey.from_private_key_file(private_key_path,password="adminld")

t = paramiko.Transport(('192.168.218.128',22))
t.connect(username='adminld',pkey=key)

sftp = paramiko.SFTPClient.from_transport(t)
sftp.get('/tmp/test.py','/tmp/test2.py')
t.close()

上传下载文件（使用秘钥）

推文：使用ssh-keygen和ssh-copy-id三步实现SSH无密码登录

推文：在Windows下通过密钥认证机制连接Linux服务器的方法

推文：在WINDOWS下如何使用密钥对远程登录服务器？

推文：图解公钥与私钥

https://www.linuxprobe.com/public-private-key.html

十三：requests

urllib内置模块的使用：

urllib提供的功能就是利用程序去执行各种HTTP请求。如果要模拟浏览器完成特定功能，需要把请求伪装成浏览器。伪装的方法是先监控浏览器发出的请求，再根据浏览器的请求头来伪装，User-Agent头就是用来标识浏览器的。

Get：豆瓣的一个URL`https://api.douban.com/v2/book/2129650`

from urllib import request

with request.urlopen('https://api.douban.com/v2/book/2129650') as f:
    data = f.read()
    print('Status:', f.status, f.reason)
    for k, v in f.getheaders():             #获取请求头
        print('%s: %s' % (k, v))
    print('Data:', data.decode('utf-8'))    #获取响应数据

Status: 200 OK
Date: Fri, 20 Apr 2018 14:30:44 GMT
Content-Type: application/json; charset=utf-8
Content-Length: 2138
Connection: close
Vary: Accept-Encoding
X-Ratelimit-Remaining2: 99
X-Ratelimit-Limit2: 100
Expires: Sun, 1 Jan 2006 01:00:00 GMT
Pragma: no-cache
Cache-Control: must-revalidate, no-cache, private
Set-Cookie: bid=sRgrHMHx5oM; Expires=Sat, 20-Apr-19 14:30:44 GMT; Domain=.douban.com; Path=/
X-DOUBAN-NEWBID: sRgrHMHx5oM
X-DAE-Node: dis8
X-DAE-App: book
Server: dae
Data: {"rating":{"max":10,"numRaters":16,"average":"7.4","min":0},"subtitle":"","author":["廖雪峰"],"pubdate":"2007","tags":[{"count":21,"name":"spring","title":"spring"},{"count":13,"name":"Java","title":"Java"},{"count":6,"name":"javaee","title":"javaee"},{"count":5,"name":"j2ee","title":"j2ee"},{"count":4,"name":"计算机","title":"计算机"},{"count":4,"name":"编程","title":"编程"},{"count":3,"name":"藏书","title":"藏书"},{"count":3,"name":"POJO","title":"POJO"}],"origin_title":"","image":"https://img3.doubanio.com\/view\/subject\/m\/public\/s2552283.jpg","binding":"平装","translator":[],"catalog":"","pages":"509","images":{"small":"https://img3.doubanio.com\/view\/subject\/s\/public\/s2552283.jpg","large":"https://img3.doubanio.com\/view\/subject\/l\/public\/s2552283.jpg","medium":"https://img3.doubanio.com\/view\/subject\/m\/public\/s2552283.jpg"},"alt":"https:\/\/book.douban.com\/subject\/2129650\/","id":"2129650","publisher":"电子工业出版社","isbn10":"7121042622","isbn13":"9787121042621","title":"Spring 2.0核心技术与最佳实践","url":"https:\/\/api.douban.com\/v2\/book\/2129650","alt_title":"","author_intro":"","summary":"本书注重实践而又深入理论，由浅入深且详细介绍了Spring 2.0框架的几乎全部的内容，并重点突出2.0版本的新特性。本书将为读者展示如何应用Spring 2.0框架创建灵活高效的JavaEE应用，并提供了一个真正可直接部署的完整的Web应用程序——Live在线书店(http:\/\/www.livebookstore.net)。\n在介绍Spring框架的同时，本书还介绍了与Spring相关的大量第三方框架，涉及领域全面，实用性强。本书另一大特色是实用性强，易于上手，以实际项目为出发点，介绍项目开发中应遵循的最佳开发模式。\n本书还介绍了大量实践性极强的例子，并给出了完整的配置步骤，几乎覆盖了Spring 2.0版本的新特性。\n本书适合有一定Java基础的读者，对JavaEE开发人员特别有帮助。本书既可以作为Spring 2.0的学习指南，也可以作为实际项目开发的参考手册。","price":"59.8"}

输出数据

可以设置请求头：来仿造信息（模拟手机登录）

from urllib import request

req = request.Request('http://www.douban.com/')
req.add_header('User-Agent', 'Mozilla/6.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/8.0 Mobile/10A5376e Safari/8536.25')
with request.urlopen(req) as f:
    print('Status:', f.status, f.reason)
    for k, v in f.getheaders():
        print('%s: %s' % (k, v))
    print('Data:', f.read().decode('utf-8'))

POST:如果要以POST发送一个请求，只需要把参数`data`以bytes形式传入。

我们模拟一个微博登录，先读取登录的邮箱和口令，然后按照weibo.cn的登录页的格式以username=xxx&password=xxx的编码传入：

from urllib import request, parse

print('Login to weibo.cn...')
email = input('Email: ')
passwd = input('Password: ')
login_data = parse.urlencode([
    ('username', email),
    ('password', passwd),
    ('entry', 'mweibo'),
    ('client_id', ''),
    ('savestate', '1'),
    ('ec', ''),
    ('pagerefer', 'https://passport.weibo.cn/signin/welcome?entry=mweibo&r=http%3A%2F%2Fm.weibo.cn%2F')
])

req = request.Request('https://passport.weibo.cn/sso/login')
req.add_header('Origin', 'https://passport.weibo.cn')
req.add_header('User-Agent', 'Mozilla/6.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/8.0 Mobile/10A5376e Safari/8536.25')
req.add_header('Referer', 'https://passport.weibo.cn/signin/login?entry=mweibo&res=wel&wm=3349&r=http%3A%2F%2Fm.weibo.cn%2F')

with request.urlopen(req, data=login_data.encode('utf-8')) as f:
    print('Status:', f.status, f.reason)
    for k, v in f.getheaders():
        print('%s: %s' % (k, v))
    print('Data:', f.read().decode('utf-8'))

View Code

但是urllib模块并非太好，这里使用requests

requests使用：

是使用 Apache2 Licensed 许可证的基于Python开发的HTTP 库，其在Python内置模块的基础上进行了高度的封装，从而使得Pythoner进行网络请求时，变得美好了许多，使用Requests可以轻而易举的完成浏览器可有的任何操作。

import requests
#无参
ret = requests.get('https://github.com/timeline.json')
#有参
payload = {'key1': 'value1', 'key2': 'value2'}
ret = requests.get("http://httpbin.org/get", params=payload)

print(ret.url)
print(ret.text)

GET

# 1、基本POST实例
 
import requests
 
payload = {'key1': 'value1', 'key2': 'value2'}
ret = requests.post("http://httpbin.org/post", data=payload)
 
print(ret.text)
 
 
# 2、发送请求头和数据实例
 
import requests
import json
 
url = 'https://api.github.com/some/endpoint'
payload = {'some': 'data'}
headers = {'content-type': 'application/json'}
 
ret = requests.post(url, data=json.dumps(payload), headers=headers)
 
print(ret.text)
print(ret.cookies)

POST

requests.get(url, params=None, **kwargs)
requests.post(url, data=None, json=None, **kwargs)
requests.put(url, data=None, **kwargs)
requests.head(url, **kwargs)
requests.delete(url, **kwargs)
requests.patch(url, data=None, **kwargs)
requests.options(url, **kwargs)
 
# 以上方法均是在此方法的基础上构建
requests.request(method, url, **kwargs)

其他请求

转载于:https://www.cnblogs.com/ssyfj/p/8877931.html

你可能感兴趣的:(json,数据库,shell)

MySQL有哪些高可用方案？ java1234_小锋 mysql java 开发语言
大家好，我是锋哥。今天分享关于【MySQL有哪些高可用方案？】面试题。希望对大家有帮助；MySQL有哪些高可用方案？1000道互联网大厂Java工程师精选面试题-Java资源分享网MySQL高可用（HighAvailability，HA）方案主要是通过一系列技术和架构来确保MySQL数据库在出现故障时仍然可以继续提供服务。以下是一些常见的MySQL高可用方案：1.主从复制（Master-Slave
一张表多少记录，会成为大表？如何计算 18你磊哥 mysql 数据库 mysql
首先，“大表”的定义并不是绝对的。不同的数据库系统、不同的硬件配置、不同的查询模式，对“大”的定义可能都不一样。比如，对于MySQL来说，百万级别的记录可能已经算大表，而对于一些分布式数据库，可能处理十亿级别的数据才算挑战。接下来，用户可能想知道如何判断自己的表是否过大，以及如何计算这个阈值。这时候，我需要考虑几个方面：数据量、性能指标、存储引擎的特性、索引情况、查询复杂度等。数据量方面，表的记录
JavaEE 项目常见错误解决方案一弦一柱 JavaEE 常见错误中文乱码 JSP 404
JavaEE项目常见错误解决方案数据库连接JavaBean获取不到数据库字段值或出现意料之外的值业务中出现null或""404NOTFOUNDGET请求中文乱码form表单提交中文乱码最近的实训中，练了一个比较基础的项目，JSP+Servlet+JavaBean，完成两张表的CRUD操作，前端使用Bootstrap和JQuery，交互使用AJAX，IDE选用Eclipse,在时间比较仓促的情况下完
OpenHarmony子系统开发 - 部件配置规则 __Benco 子系统开发 openharmony harmonyos 人工智能
OpenHarmony子系统开发-部件配置规则部件的bundle.json放在部件源码的根目录下。以泛sensor子系统的sensor服务部件为例，部件属性定义描述文件字段说明如下：{"name":"@ohos/sensor_lite",#HPM部件英文名称，格式"@组织/部件名称""description":"Sensorservices",#部件功能一句话描述"version":"3.1",#
定期备份数据库：基于 Shell 脚本的自动化方案 mysql服务器脚本
数据库备份这件事，说实话，我一直没怎么上心。平时服务器跑得好好的，谁会想着备份呢？直到某天真出问题了，才意识到自己平时有多“懒”。我相信很多人跟我一样，觉得这东西看起来麻烦，等到数据库挂了、数据丢失了，才感叹自己怎么就没提前准备好呢？有一次数据库问题搞得我手忙脚乱，最后还好有个朋友给了我个备份文件，才算是有惊无险。经历了这次以后，我决定不能再拖了，必须把备份这事儿自动化起来。所以，我写了一个简单的
用flask做个简单llm-api 格瑞Lxf flask python 后端
详细文档见：flask中文文档快速上手—Flask中文文档(2.3.x)(dormousehole.readthedocs.io)也可以看英文文档。接收端：开放本机5000端口apifromflaskimportFlask,jsonify,requestapp=Flask(__name__)fromutils.llmimportload_llmllms=load_llm()defllm(quest
在线监控+日志分析方案徐福记c 运维运维
1.在线监控系统设计技术选型：Prometheus+Grafana+各ExporterPrometheus：负责定时拉取各服务指标数据并存储。Grafana：可视化仪表盘，支持多数据源（Prometheus、Loki等）。Exporter：SpringBoot应用：通过Micrometer暴露/actuator/prometheus端点。MySQL：部署mysqld_exporter采集数据库性能
技术分享 | MySQL8.0 内部临时表占用磁盘空间问题排查数据库mysql
本文为墨天轮数据库管理服务团队第43期技术分享，内容原创，如需转载请联系小墨（VX：modb666）并注明来源。概念描述到了mysql8.0版本，SQL运行过程中产生的内部临时表已经有了变化，存放位置由innodb\_temp\_tablespaces\_dir参数控制，默认放在$DATADIR/#innodb\_temp/目录下，由多个.ibt文件构成。并且当数据库连接断开时，.ibt文件的大小
golang中使用mysql事务彩色代码 Golang编程语言 MySQL数据库 mysql golang 数据库
在Go语言中，可以使用第三方库来处理MySQL事务。在示例中，我们将使用database/sql包与github.com/go-sql-driver/mysql驱动程序来连接和执行MySQL数据库操作。首先，确保你已经安装了相应的依赖库。你可以使用以下命令来安装它们：goget-udatabase/sqlgoget-ugithub.com/go-sql-driver/mysql接下来，我们将演示一
微信小程序云开发的sql语法 where `$and` 运算符怎么用？踩坑总结！代码简单说 2025开发必备微信小程序 sql 小程序 where 微信小程序and
微信小程序云开发$and组合查询时间戳转换**最近在小程序云开发里用$and组合查询，结果直接翻车，明明条件写对了，却总是查不出数据，要么就是报错，真是要被折腾疯了，官方文档也没给完整示例，最终折腾了半天，终于找到正确用法，现在分享出来，避免大家踩坑1.$and查询失败的真正原因在云开发数据库查询时，如果你的$and组合条件查不出数据，大概率是因为数据类型不匹配，特别是在时间筛选时，很多人会写成这
Golang实现一个事务型内存数据库 qingwave Code 数据库 golang redis
内存数据库经我们经常用到，例如Redis，那么如何从零实现一个内存数据库呢，本文旨在介绍如何使用Golang编写一个KV内存数据库MossDB。特性MossDB是一个纯Golang编写、可嵌入的、键值型内存数据库，包含以下特性可持久化，类似RedisAOF(AppendonlyLog)支持事务支持近实时的TTL(TimetoLive),可以实现毫秒级的过期删除前缀搜索Watch接口，可以监听某个键
flink-cdc实时增量同步mysql数据到elasticsearch 大数据技术派 #Flink elasticsearch flink mysql
什么是CDC？CDC是（ChangeDataCapture变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入INSERT、更新UPDATE、删除DELETE等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。1.环境准备mysqlelasticsearchflinkonyarn说明：如果没有安装hadoop，那么可以不用yarn，直
MySQL保姆级教程（SQL语法基础篇）从小白到高手的进阶指南，收藏这一篇就够了网安导师小李网络安全编程程序员 mysql sql adb 安全 web安全网络自动化
本章节精心构构造SQL语法学习之旅的基石，旨在从基础出发，逐步深入，全面解析SQL语法规则并辅以丰富实例。通过这一篇章，您将循序渐进地掌握MySQL的核心语法，开启数据库操作的新境界。1：SQL语言概述SQL（StructuredQueryLanguage），简称SQL。结构化查询语言包含6个部分：类型释义范例数据查询语言DQL：DataQueryLanguage如SELECT数据操作语言DML：
Golang后端学习笔记 — 6. Golang操作数据库事务的方法宝码 Golang后端学习笔记 golang 数据库事务 postgresql
之前，学习了对数据库的每个表执行CRUD操作。真实的场景中，我们经常需要执行一个事务，它组合了多个表的相关操作。本节学习如何在Golang中实现它。在开始之前，先聊一下事务。什么是数据库事务？它是一个单一的工作单元，通常由多个表操作组成。比如：在我们的小银行项目中，我们要从张三的账户中向李四的账户中转账10元。该交易就包括5个操作，涉及到accounts表、entries表和transfers表：
接口测试中遇到的最大的困难是什么？Java接口测试中用到的框架有哪些？海姐软件测试接口测试测试工具
接口测试中的最大困难环境依赖与数据准备接口测试常依赖外部服务或数据库，测试环境不稳定（如第三方接口延迟）会导致测试结果不可靠。解决方案：使用Mock技术（如Mockito）模拟外部依赖，或通过Docker容器化测试环境，确保数据隔离。参数与逻辑复杂度复杂接口可能涉及多参数组合、加密签名（如Token、OAuth）或动态参数（如时间戳），手工构造请求容易出错。示例：电商接口需同时验证商品库存、用户优
【Spring】_Spring事务与事务传播机制 _周游 Spring JavaEE 数据库 sql
目录1.创建项目、数据库及MyBatis配置1.1创建数据库及java实体类1.2使用yml配置MyBatis1.3对应三层架构开发2.Spring编程式事务2.1编写UserController类2.2接口测试2.23关于事务回滚与事务提交的日志3.Spring声明式事务3.1编写TransController类3.2接口测试3.3关于@Transactional实现事务回滚的情况3.3.1重新
likeadmin 安装与使用指南强和毓Hadley
likeadmin安装与使用指南项目地址:https://gitcode.com/gh_mirrors/li/likeadmin目录结构及介绍在克隆或下载likeadmin项目后，你会看到以下主要目录：admin:存放所有后端管理相关的代码。controller:控制器目录，负责处理HTTP请求。model:数据模型目录，用于数据库操作。service:服务层目录，提供业务逻辑。frontend:
我与DeepSeek读《大型网站技术架构》（5）下诺亚凹凸曼架构
万无一失：网站的高可用架构4.高可用的数据保证数据存储高可用的手段主要是数据备份和失效转移机制。缓存服务的高可用争论1.缓存服务需要实现高可用核心论据：避免雪崩效应：缓存宕机导致数据库瞬时压力骤增，可能引发级联故障。提升用户体验：缓存直接支撑高频访问，其不可用会导致延迟飙升、功能异常。数据热备价值：部分缓存数据（如会话信息）可能无持久化备份，丢失后影响业务连续性。适用场景：高并发实时系统：如电商秒
leetcode-sql数据库面试题冲刺（高频SQL五十题）我想吃烤肉肉 sql 测试面试数据库 leetcode sql
题目：2356.每位教师所教授的科目种类的数量表:Teacher±------------±-----+|ColumnName|Type|±------------±-----+|teacher_id|int||subject_id|int||dept_id|int|±------------±-----+在SQL中，(subject_id,dept_id)是该表的主键。该表中的每一行都表示带有t
Redis缓存穿透、雪崩、击穿的解决方案 Fanxt_Ja 缓存 redis 数据库 java spring cloud intellij-idea
在大型业务系统或用户活跃量较大的环境中，用户往往对某些数据的访问量会非常大，为了保护数据库而引入了缓存Redis，但是其也会出现一些问题，而导致严重的后果，比如缓存穿透、缓存雪崩、缓存击穿，下面我将针对这几个问题给出解决方案。1.缓存穿透缓存穿透发生的原因就是“用户”访问一个缓存中不存在，数据库中也不存在的数据。当这种请求量非常大时，就会对数据库造成非常大的压力。为了解决这个问题，通常有两种解决方
本地部署Hive集群克里斯蒂亚诺罗纳尔多阿维罗 hive hadoop 数据仓库
规划服务机器Hive本体部署在Node1元数据服务所需的关系型数据库(MYSQL)部署在Node1安装MYSQL数据库#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysql-2022#安装Mysqlyum库rpm-Uvhhttp://repo.mysql.com//mysql57-community-release-el7-7.noarch
MySql索引使用沐千熏 mysql 数据库
索引类型#主键索引：PRIMARY这设立主键后数据库自动建立索引，InnoDB为聚簇索引，主键索引列不能为空（NUll）；#唯一索引：UNIQUE索引列的值必须唯一。可以为空值，但是必须只有一个；#普通索引（组合索引）：NORMAL也称为非唯一索引，允许重复值和NULL值。一个索引可以包含多个列，多个列共同组成一个复杂的索引；#全文索引：FULLTEXTFullText（MySQL5.7之前，只有
SpringBoot中的导入导出(SpringBoot导出word文档、Hutool导入excel、easypoi之easy导入数据库、导出excel文件、POI设置单元格式) 种豆走天下 spring boot java spring
SpringBoot中的导入导出java导出word文档1先准备好一个导出Word文档的模板。例如：2.打开doc文件后，文件中的另存为，然后选择保存类型为2003版本的(*.xml)3、刚生成的xml文件里面比较乱，要整理一下，方法如下：使用Eclipse/idea,新建一个jsp,把xml里面的东西覆盖更新刚才的jsp,ctrl+Shift+F/ctrl+alt+L把文件整理一下，在拷贝出来，
uniapp开发app时权限仅获取一次，拒绝后不再拉取已拒绝权限聆听+自律 uni-app 前端 javascript
"app-plus":{..."checkPermissionDenied":true,}在manifest.json中添加以上内容即可详情参考uniapp官方文档背景|uni-app官网(dcloud.net.cn)
解析JSON的这 6 种方案（带示例）浪九天企业级开发效率提升 java spring spring boot spring cloud
目录1.使用Gson详细解释运用场景代码示例2.使用Jackson详细解释运用场景代码示例3.使用JSON.simple详细解释运用场景代码示例4.使用org.json详细解释运用场景代码示例5.使用FastJSON详细解释运用场景代码示例6.使用Moshi详细解释运用场景代码示例在Java中，有多种方案可以用于解析JSON数据，以下为你详细介绍6种常见的方案：1.使用Gson详细解释Gson是G
【软件测试】接口自动化测试用例通常包含哪些要素小马哥编程自动化测试用例
接口自动化测试用例通常包含以下要素：用例ID：唯一标识符，便于追踪和管理。用例名称：简要描述测试目的。接口信息：URL：接口地址。请求方法：如GET、POST、PUT、DELETE等。请求参数：Headers：如Content-Type、Authorization等。QueryParameters：GET请求中的查询参数。Body：POST/PUT请求的请求体，通常为JSON或XML。预期结果：状
.NET 6 WebApi使用JWT wenqi.xu .net .netcore
JWT（JsonWebToken）jwt是一种用于身份验证的开放标准，他可以在网络之间传递信息，jwt由三部分组成：头部，载荷，签名。头部包含了令牌的类型和加密算法，载荷包含了用户的信息，签名则是对头部和载荷的加密结果。jwt鉴权验证是指在用户登录成功后，服务器生成一个jwt令牌并返回给客户端，客户端在后续的请求中携带该令牌，服务通过令牌的签名来确定用户的身份和权限。这种方式可以避免在每个请求中都
如何在Spring Boot中实现数据加密后端springboot
如何在SpringBoot中实现数据加密大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！一、数据加密的重要性与应用场景在当今信息安全日益受到重视的背景下，数据加密成为保护敏感信息不被未授权访问的重要手段。SpringBoot作为一种流行的Java开发框架，提供了多种方式来实现数据加密，适用于用户密码、数据库连接、敏感配置等场景。二、
页面跳转隐藏url参数 Otaku love travel html html 前端
在某些特定的情况下，直接请求会在url显示参数传值等，基于简单的安全性考虑，可以去掉参数，但是传参问题有出现了，以下提供了一个简单的解决方案1、a标签直接url跳转改为点击事件2、调用以下方法httpPostLocationUrl/***页面跳转*@paramurl请求地址xxx\xxx?xxx=xx&xx=xx*@paramparams可选参数json对象数据{‘a’:1}*/functionh
HIBERNATE - 符合Java习惯的关系数据库持久化 popkiler Atleap代码读解 hibernate 数据库 java session class payment
HIBERNATE-符合Java习惯的关系数据库持久化Hibernate2参考文档2.1.1TableofContents前言1.在Tomcat中快速上手1.1.开始Hibernate之旅1.2.第一个可持久化类1.3.映射cat1.4.与猫同乐1.5.结语2.体系结构2.1.总览2.2.持久化对象标识（PersistentObjectIdentity）2.3.JMX集成2.4.JCA支持3.Se
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

python---基础知识回顾（四）（模块sys,os,random,hashlib,re,序列化json和pickle，xml，shutil，configparser，logging，datetim...

前提：dir,__all__,help,__doc__,__file__

二，os

三：random

四：hashlib

五：re正则模块

（一）re模块中一些重要函数：

compile:根据原来包含正则表达式的字符串创建模式对象

search:在字符串中寻找模式(浏览整个字符串去匹配第一个)

match:从起始位置开始匹配（只是从字符串开头开始匹配），匹配成功返回一个对象，未匹配成功返回None

split:会根据模式的匹配项来分割字符串。类似于字符串的split

findall:以列表形式返回给定模式的所有匹配项

sub:替换匹配成功项的数据（含有替换字符串，替换个数）(相比于字符串replace来说查找更加灵活，替换也方便)

escape（string）:将字符串中所有条数的正则表达式字符转义（实用|用处不大）

（二）匹配对象和组

group:获取给定子模式（组）的匹配项（若没有给出组号，默认为0.而且我们只能使用99个组（除0外），即1-99）

start:获取给定组的开始位置

end:获取给定组的结束位置

span:获取一个组的开始和结束位置

补充：组和sub

\4

\4

com

com

六：序列化json和pickle

pickle：用于【python特有的类型】 和 【python基本数据类型】间进行转换（只能在python内部工作）

json：用于【字符串】和 【python基本数据类型】 间进行转换（用于不同的编程语言之间传递对象）

其中skipkeys:是说对于字典的key，如果skipkeys设置是默认false，那么key只能是基础数据类型

其中default可以就是把任意一个对象变成一个可序列为JSON的对象，但是我们需要为这个对象专门写一个转换函数，再把函数传进去即可：

json反序列化对象

object_hook：是一个回调函数，我们自定义的解码函数，通过一个自定义解码函数，我们可以将数据拿去再建一个对象

七：xml

ElementTree

1.解析xml获取根节点：

2.操作xml：xml格式是结点内可以嵌套，对于每一个结点都有相同的操作功能，便于操作

3.创建xml文档

4.命名空间：

八：shutil（高级的 文件、文件夹、压缩包 处理模块）

九：configparser

十：logging日志模块

1.单文件日志

2.若是想让流和文件日志一块存在，需要向日志对象添加句柄logging.getLogger().addHandler(console)

十一：datetime和time模块

datetime：datetime是Python处理日期和时间的标准库。

time

十二：paramiko

十三：requests

urllib内置模块的使用：

Get：豆瓣的一个URLhttps://api.douban.com/v2/book/2129650

POST:如果要以POST发送一个请求，只需要把参数data以bytes形式传入。

requests使用：

你可能感兴趣的:(json,数据库,shell)

前提：dir,all,help,doc,file

pickle：用于【python特有的类型】和【python基本数据类型】间进行转换（只能在python内部工作）

json：用于【字符串】和【python基本数据类型】间进行转换（用于不同的编程语言之间传递对象）

其中default可以就是把任意一个对象变成一个可序列为JSON的对象，但是我们需要为`这个对象`专门写一个转换函数，再把函数传进去即可：

八：shutil（高级的文件、文件夹、压缩包处理模块）

Get：豆瓣的一个URL`https://api.douban.com/v2/book/2129650`

POST:如果要以POST发送一个请求，只需要把参数`data`以bytes形式传入。