bylfsj

python内存机制与垃圾回收、调优手段

python

一、python的内存机制
二、python的垃圾回收
- 1. 引用计数
  - 1.1 原理:
  - 1.2 优缺点：
    - 1.3 一个例子：
  - 1.4 两种情况：
    - 1.5 一个特殊的实例：
- 2. 标记清除
  - 2.1 原理：
  - 2.2 优缺点：
- 3. 分代回收
  - 3.1 原理：
- 4. 三种情况触发垃圾回收：
- 5. 小整数对象池与intern机制
三、调优手段
- 1. 手动垃圾回收
- 2. 调高垃圾回收阈值
- 3. 避免循环引用
  - 3.1 手动解循环引用
  - 3.2 使用弱引用

一、python的内存机制

python中的内存机制如下所示：

    _____   ______   ______       ________
   [ int ] [ dict ] [ list ] ... [ string ]       Python core         |
+3 | <----- Object-specific memory -----> | <-- Non-object memory --> |
    _______________________________       |                           |
   [   Python's object allocator   ]      |                           |
+2 | ####### Object memory ####### | <------ Internal buffers ------> |
    ______________________________________________________________    |
   [          Python's raw memory allocator (PyMem_ API)          ]   |
+1 | <----- Python memory (under PyMem manager's control) ------> |   |
    __________________________________________________________________
   [    Underlying general-purpose allocator (ex: C library malloc)   ]
 0 | <------ Virtual memory allocated for the python process -------> |

=========================================================================
_______________________________________________________________________
[ OS-specific Virtual Memory Manager (VMM) ]
-1 | <-– Kernel dynamic storage allocation & management (page-based) —> |
__________________________________ __________________________________
[ ] [ ]
-2 | <-- Physical memory: ROM/RAM –> | | <-- Secondary storage (swap) --> |

解释：

-1，-2层主要由操作系统进行操作。
第0层是由C语言中的malloc，free等内存分配和释放函数进行内存操作
第1层则是在第0层的基础之上对其提供的接口进行了统一的封装。

　　　　这是因为：虽然不同的操作系统都提供标准定义的内存管理接口，但是对于某些特殊的情况，不同的操作系统都有不同的行为，比如说调用malloc(0)，有的操作系统会返回NULL，表示内存申请失败；然而有的操作系统会返回一个貌似正常的指针，但是这个指针所指的内存并不是有效的。为了广泛的移植性，Python必须保证相同的语义一定代表相同的运行行为。

第2层是内存池，由Python的接口函数PyMem_Malloc函数实现。

　　Python为了避免频繁的申请和删除内存所造成系统切换于用户态和核心态的开销，从而引入了内存池机制，专门用来管理小内存的申请和释放。当对象小于256K时有该层直接在内存池中分配内存，大于则退化由低层来进行分配，如由malloc函数进行分配。整个小块内存的内存池可以视为一个层次结构，其一共分为4个层次，从下之上分别是block、pool、arena和内存池。需要说明的是：block、pool和area都是代码中可以找到的实体，而最顶层的内存池只是一个概念上的东西，表示Python对于整个小块内存分配和释放行为的内存管理机制。
　　(1) block：最小的内存单元，大小为8的整数倍。有很多种类的block，不同种类的block都有不同的内存大小，申请内存的时候只需要找到适合自身大小的block即可，当然申请的内存也是存在一个上限，如果超过这个上限，则退化到使用最底层的malloc进行申请。

　　(2) pool：一个pool管理着一堆有固定大小的内存块，其大小通常为一个系统内存页的大小。

　　(3) arena：多个pool组合成一个arena。

　　(4) 内存池：一个整体的概念。

python内存池设计参考文章：https://blog.csdn.net/zhzhl202/article/details/7547445

第3层是最上层，也就是我们对Python对象的直接操作。直接面向用户，它提供给我们int，list，string，dict等方法。

二、python的垃圾回收

　　Python中的垃圾回收是以引用计数为主，分代收集为辅。引用计数的缺陷是循环引用的问题，为了解决循环引用的问题，又有了标记 - 清除技术。

　　在Python中，如果一个对象的引用数为0，Python虚拟机就会回收这个对象的内存。

1. 引用计数

1.1 原理:

　　当一个对象的引用被创建或者复制时，对象的引用计数加1；当一个对象的引用被销毁时，对象的引用计数减1，当对象的引用计数减少为0时，就意味着对象已经再没有被使用了，可以将其内存释放掉。

1.2 优缺点：

优点：引用计数有一个很大的优点，即实时性，任何内存，一旦没有指向它的引用，就会被立即回收，而其他的垃圾收集技术必须在某种特殊条件下才能进行无效内存的回收。
缺点：但是它也有弱点，引用计数机制所带来的维护引用计数的额外操作与Python运行中所进行的内存分配和释放，引用赋值的次数是成正比的，这显然比其它那些垃圾收集技术所带来的额外操作只是与待回收的内存数量有关的效率要低。同时，引用技术还存在另外一个很大的问题 — 循环引用，因为对象之间相互引用，每个对象的引用都不会为0，所以这些对象所占用的内存始终都不会被释放掉。（这也标记－清除计数存在的意义。）

1.3 一个例子：

# encoding=utf-8

class ClassA():
def init(self):
print(‘object born id:%s’ % str(hex(id(self)))) # hex()将10进制整数转换成16进制，以字符串形式表示。

def __del__(self):
    print('object del     id:%s' % str(hex(id(self))))

def func():
c1 = ClassA()
del c1

func()

程序输出：

object born    id:0x194921515f8
object del     id:0x194921515f8

　　c1=ClassA()会创建一个对象，放在0x194921515f8内存中，c1变量指向这个内存，这时候这个内存的引用计数是1。del c1后，c1变量不再指向0x194921515f8内存，所以这块内存的引用计数减一，等于0，所以就销毁了这个对象，然后释放内存。

1.4 两种情况：

** 1.4.1 导致引用计数+1的情况：**

对象被创建，例如a=3，b=ClassA()
对象被引用，例如b=a
对象被作为参数，传入到一个函数中，例如func(a)。实际上在函数内部可以看到引用计数是+2
对象作为一个元素，存储在容器中，例如list1=[a,a]

** 1.4.2 导致引用计数-1的情况：**

对象的别名被显式销毁，例如del a
对象的别名被赋予新的对象，例如a=24
一个对象离开它的作用域，例如f函数执行完毕时，func函数中的局部变量（全局变量不会）
对象所在的容器被销毁，或从容器中删除对象

1.5 一个特殊的实例：

def f1(n):
    print("in function:", sys.getrefcount(n) - 1)

x = 22
print(“init x：”, sys.getrefcount(x) - 1)
a = 22
print(“after a：”, sys.getrefcount(x) - 1)
b = a
print(“after b：”, sys.getrefcount(x) - 1)
f1(x)
print(“after function：”, sys.getrefcount(22) - 1)

运行结果：

init x： 12
after a： 13
after b： 14
in function: 16
after function： 14

　　可以看到，调用函数后再函数内部引用计数是+2，原因是： 多的那一个引用是函数栈保存了入参对形参的引用，这导致计数+2。

这个结论参考文章：https://www.cnblogs.com/hellcat/p/10450785.html

2. 标记清除

　　标记－清除只关注那些可能会产生循环引用的对象，显然，像是int、stringt这些不可变对象是不可能产生循环引用的，因为它们内部不可能持有其它对象的引用。在Python中, 所有能够引用其他对象的对象都被称为容器(container)。Python中的循环引用总是发生在container对象之间，也就是能够在内部持有其它对象的对象，比如list、dict、class等等。

前面提到过，循环引用使得内存无法被回收，即造成了内存泄漏。下面看一个实例：

class ClassA():
    def __init__(self, x=None):
        self.t = x
        print('object born    id:%s' % str(hex(id(self))))

def f2():
c1=ClassA()
c2=ClassA()
c1.t=c2
c2.t=c1
del c1
del c2

执行f2()，会产生一个循环引用，即是del c1、c2，内存还是没有被释放，如果进程中存在大量的这种情况，那么进程占用的内存会不断增大。

object born    id:0x1a29f609390
object born    id:0x1a29f609400

　　创建了c1，c2后，0x1a29f609390（c1对应的内存，记为内存1）,0x1a29f609400（c2对应的内存，记为内存2）这两块内存的引用计数都是1，执行c1.t=c2和c2.t=c1后，这两块内存的引用计数变成2.
在del c1后，内存1的对象的引用计数变为1，由于不是为0，所以内存1的对象不会被销毁，所以内存2的对象的引用数依然是2，在del c2后，同理，内存1的对象，内存2的对象的引用数都是1。删除了c1，c2之后，这两个对象不可能再从程序中调用，就没有什么用处了。但是由于引用环的存在，这两个对象的引用计数都没有降到0，导致垃圾回收器都不会回收它们，所以就会导致内存泄露。

2.1 原理：

　　为了记录下所有的容器对象, Python将每一个容器都链到了一个双向链表中, 之所以使用双向链表是为了方便快速的在容器集合中插入和删除对象. 有了这个维护了所有容器对象的双向链表以后, Python在垃圾回收时使用如下步骤来寻找需要释放的对象:

(1) 对于每一个容器对象, 设置一个gc_refs值, 并将其初始化为该对象的引用计数值
(2) 对于每一个容器对象, 找到所有其引用的对象, 将被引用对象的gc_refs值减1
(3) 执行完步骤2以后所有gc_refs值还大于0的对象都被非容器对象引用着, 至少存在一个非循环引用. 因此不能释放这些对象, 将他们放入另一个集合
(4) 在步骤3中不能被释放的对象, 如果他们引用着某个对象, 被引用的对象也是不能被释放的, 因此将这些对象也放入另一个集合中
(5) 此时还剩下的对象都是无法到达的对象. 现在可以释放这些对象了

2.2 优缺点：

优点：当然是解决了循环引用的问题。
缺点：标记和清除的过程效率不高。

3. 分代回收

　　Python同时采用了分代(generation)回收的策略。这一策略的基本假设是，存活时间越久的对象，越不可能在后面的程序中变成垃圾。我们的程序往往会产生大量的对象，许多对象很快产生和消失，但也有一些对象长期被使用。出于信任和效率，对于这样一些“长寿”对象，我们相信它们的用处，所以减少在垃圾回收中扫描它们的频率。

3.1 原理：

　　将系统中的所有内存块根据其存活时间划分为不同的集合，每一个集合就成为一个“代”，Python默认定义了三代对象集合，垃圾收集的频率随着“代”的存活时间的增大而减小。也就是说，活得越长的对象，就越不可能是垃圾，就应该减少对它的垃圾收集频率。

　　Python默认定义的对象分为0，1，2三代。所有的新建对象都是0代对象。当某一代对象经历过垃圾回收，依然存活，那么它就被归入下一代对象。垃圾回收启动时，一定会扫描所有的0代对象。如果0代经过一定次数垃圾回收，那么就启动对0代和1代的扫描清理。当1代也经历了一定次数的垃圾回收后，那么会启动对0，1，2，即对所有对象进行扫描。

4. 三种情况触发垃圾回收：

1、调用gc.collect()
2、GC达到阀值时
3、程序退出时

5. 小整数对象池与intern机制

　　由于整数使用广泛，为了避免为整数频繁销毁、申请内存空间，引入了小整数对象池。[-5,257)是提前定义好的，不会销毁，单个字母也是。

那对于其他整数，或者其他字符串的不可变类型，如果存在重复的多个，例如：

m1 = "mark"
m2 = "mark"
m3 = "mark"
m4 = "mark"
m5 = "mark"
m6 = "mark"

print(m1 is m5)

它的运行结果是：True

如果每次声明都开辟出一段空间，很显然不合理，这个时候python就会使用intern机制，靠引用计数来维护。

总结：

1、小整数[-5，257)：共用对象，常驻内存
2、单个字符：共用对象，常驻内存
3、单个单词等不可变类型，默认开启intern机制，共用对象，引用计数为0时销毁。

三、调优手段

引用文章：https://blog.csdn.net/zxmzhaoxuan/article/details/82492515

1. 手动垃圾回收

　　对Python的垃圾回收进行调优的一个最简单的手段便是关闭自动回收, 根据情况手动触发. 例如在用Python开发游戏时, 可以在一局游戏的开始关闭GC, 然后在该局游戏结束后手动调用一次GC清理内存. 这样能完全避免在游戏过程中因此 GC造成卡顿. 但是缺点是在游戏过程中可能因为内存溢出导致游戏崩溃.

2. 调高垃圾回收阈值

　　相比完全手动的垃圾回收, 一个更温和的方法是调高垃圾回收的阈值. 例如一个游戏可能在某个时刻产生大量的子弹对象(假如是2000个). 而此时Python的垃圾回收的threshold0为1000. 则一次垃圾回收会被触发, 但这2000个子弹对象并不需要被回收. 如果此时 Python的垃圾回收的threshold0为10000, 则不会触发垃圾回收. 若干秒后, 这些子弹命中目标被删除, 内存被引用计数机制自动释放, 一次(可能很耗时的)垃圾回收被完全的避免了.

　　调高阈值的方法能在一定程度上避免内存溢出的问题(但不能完全避免), 同时可能减少可观的垃圾回收开销. 根据具体项目的不同, 甚至是程序输入的不同, 合适的阈值也不同. 因此需要反复测试找到一个合适的阈值, 这也算调高阈值这种手段的一个缺点.

3. 避免循环引用

　　一个可能更好的方法是使用良好的编程习惯尽可能的避免循环引用. 两种常见的手段包括: 手动解循环引用和使用弱引用.

3.1 手动解循环引用

　　手动解循环引用指在编写代码时写好解开循环引用的代码, 在一个对象使用结束不再需要时调用. 例如:

class A(object):
    def __init__(self):
        self.child = None
def destroy(self):
    self.child = None

class B(object):
def init(self):
self.parent = None

def destroy(self):
    self.parent = None

def test3():
a = A()
b = B()
a.child = b
b.parent = a
a.destroy()
b.destroy()

3.2 使用弱引用

　　弱引用指当引用一个对象时, 不增加该对象的引用计数, 当需要使用到该对象的时候需要首先检查该对象是否还存在. 弱引用的实现方式有多种, Python自带一个弱引用库weakref, 其详细文档参加这里. 使用weakref改写我们的代码:

def test4():
    a = A()
    b = B()
    a.child = weakref.ref(b)
    b.parent = weakref.ref(a)

　　除了使用Python自带的weakref库以外, 通常我们也可以根据自己项目的业务逻辑实现弱引用. 例如在游戏开发中, 通常很多对象都是有其唯一的ID的. 在引用一个对象时我们可以保存其ID而不是直接引用该对象. 在需要使用该对象的时候首先根据ID去检查该对象是否存在.

分类: Python

好文要顶关注我收藏该文

长安223
关注 - 2
粉丝 - 4

+加关注




«  上一篇：    N皇后问题的python实现


»  下一篇：    2019vivo秋招提前批笔试题第3题

mac怎么查python的版本_Mac下如何查看Python的版本？ A格调 mac怎么查python的版本
[1，terminal:input:whichpython2,terminal:input:python--->importsys---->printsys.pathok!goodluck!!]问题：Mac下如何查看Python的版本？系统：MacOSX软件：Python编程语言：Python[Mac配置Python开发环境(Eclipse+Pydev+Python)1、首先下载MAC版的64位E
Python---元组（tuple）李奕状今天写代码了吗 python 开发语言后端
作为一个Python初学者，我想通过写博客的方式来记录下来自己成长的过程，同时也分享一下自己学习到的知识。以下都是一个Python初学者对Python语言的一些浅见和个人理解。‘’'元组属于不可变序列，不能改变元组中的元素，因此，元素没有增加元素、修改元素、删除元素的相关方法元组支持如下操作：索引访问切片操作连接操作成员关系操作比较运算操作计数：元组长度len()、最大值max()、最小值min(
python---爬取QQ音乐 SRestia python
如Cookie为非vip，仅能获取非vip歌曲1.下载包pipinstalljsonpath2.代码importosimporttimeimportrequestsfromjsonpathimportjsonpathdefsearch_and_download_qq_music(query_text):headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0
Python---列表和元组 HaiFan. Python python
专栏：python个人主页：HaiFan.专栏简介：本专栏主要更新一些python的基础知识，也会实现一些小游戏和通讯录，学时管理系统之类的，有兴趣的朋友可以关注一下。列表和元组前言列表的的概念列表的创建访问下标切片操作遍历列表元素新增元素列表的查找和删除连接列表关于元组总结前言元组和列表的大部分功能都是差不多的，但是有一个功能是有非常明显的区别：列表可变，创建好了，随时可以更改，元组不可变，创建
Python---数据合并(pd.merge()\pd.concat()\combine_fist()) 门前一头牛 Python 数据分析与挖掘技术 python 数据挖掘数据分析
Pandas中有一些内置的合并数据集函数，具体如下：pandas.merge()：依据一个或多个键将多个DataFrame连接起来，类似于数据库连接；pandas.concat()：可以沿着一个轴将多个对象堆叠起来；combine_first()：可以将重复数据编制在一起，用以填充另一个对象的缺失值。df1.combine_first(df2)pandas.concat()Pandas.conca
python---高阶特性 bw-1111 python
一.生成式详解1.列表生成式一个用来生成列表的特定语法形式的表达式。是python提供的一种生成列表的简介形式，可快速生成一个新的list。需求:生成100个验证码(4个字母组成的验证码)importstringimportrandomcodes=[]forcountinrange(100):code="".join(random.sample(string.ascii_letters,4))co
Python---网络编程知识详解（学习笔记）基础部分一道秘制的小菜网络服务器运维 python 人工智能
目录一、IP地址1.引入IP地址2.ip地址的分类2.1IPv4的5种类别以及共有IP和私有IP2.1.1按照基本格式划分2.1.2按照功能用途来划分2.1.2特殊的P地址一、IP地址1.引入IP地址特点：在逻辑上标记一台电脑（唯一标记）作用：不能有重复的发送者需要：destip：192.168.30.5（目的ip，用来说明到那个电脑）content：内容srcip：192.168.10.2（源i
Python---核心知识2之面向对象2方法 hello_我的哥
方法：首先什么是方法？其实方法和函数差不多，也是描述某个功能，动作的代码块，比如人类，有吃饭的方法，有玩扑克的方法，方法和函数不一样的是，方法是有宿主的，也就是有目标调用的，而函数没有目标调用；方法的划分：方法分为实例方法也就是对象方法，类方法和静态方法，划分的规则是方法的第一个参数必须要接收的数据类型；实例方法：默认第一个参数需要接收到一个实例，类方法：默认第一个参数需要接收到一个类，静态方法，
python---数据结构---prim(无向网+邻接表东箭武 python 数据结构开发语言
importheapqclassGraph:def__init__(self,vertices):self.V=verticesself.graph={}defadd_edge(self,u,v,w):ifunotinself.graph:self.graph[u]=[]ifvnotinself.graph:self.graph[v]=[]self.graph[u].append((v,w))se
python---数据结构---栈--进制转换东箭武 python 数据结构开发语言
classSeqStack(object):def__init__(self):self.top=0self.StackSize=500self.stack=[Noneforxinrange(0,500)]defStackEmpty(self):ifself.top==0:returnTrueelse:returnFalsedefgetTop(self):ifself.StackEmpty():p
python---核心知识6之面向对象之遍历操作 hello_我的哥
遍历：我们知道字符串或者列表都可以用forin进行遍历，那是因为他们具有可迭代的特点，那么针对对象，我们让对象可以被遍历，应该怎么做呢，其实就是重写__getitem__或者__iter__方法：1.重写__getitem__，它的规则其实是把它的所有返回值组成了一个可迭代的对象，我们遍历的是这个可迭代对象，classPerson:def__init__(self):self.age=1def__
Matplotlib笔记海绵宝宝阿铭
Matplotlib画图两种画图方法[1]1.plt.XXX傻瓜式画图法和Matlab的基础画图语法差不多（多了一个plt.）#python--->matlabplt.figure(1)--->figure(1)plt.subplot(211)--->subplot(211)plt.plot()--->plot()但其实plt.subplot()也可以玩出花儿来：ax=plt.subplot()#
基础小白快速入门Python---布尔值（bool）和运算符 yuanbenshidiaos Python python 开发语言
啥是布尔类型？在Python语言中，有一类数据数据，表示数据的真和假，并且运行结果非真即假，即True和False这个类型我们成为布尔类型布尔类型可以参加什么运算？布尔类型可以参加的运算如下：与运算：同真为真或运算：一真为真非运算：反转结果布尔类型的扩展：在Python语言中，布尔类型的应用不止如此,在Python中，除了explicitly的True和False值，其他所有对象都可以进行真值测试
基础小白快速入门Python---数据类型之字符串 yuanbenshidiaos Python python 开发语言
在之前我们有讲过数字型数据，今天我们要进行展开讲述的是，字符串啥是字符串？字符串是由零个或者多个字符组成的有序序列，在编程语言中，字符串通常用于表示文本信息，字符串中的每个字符都有其特定的位置，位置通常从0开始计数。Python的字符串格式表现的非常简单其中，helloworld就是一个简单的字符串Python的字符串的具体表示规则？Python的编译相对于java和c语言简单，所以在Python
python---数据容器 two 倩 pycharm ide python
目录环境安装python语法打印语句注释变量变量声明变量类型boolean类型占位符控制数据精度输入输出条件控制循环语句while循环for循环函数None类型数据容器列表元组字符串序列集合字典环境安装1、安装python运行环境WelcometoPython.org2、安装python的集成开发环境pyCharmpython语法打印语句注释"""多行注释"""#单行注释#打印字符串内容print
python---列表相关操作方法幼姿沫
列表相关操作方法#list列表是存储不同数据的容器并且可以存储不同类型的数据可以进行索引查找数据names=['jack','mary','jully','mark',5,6,4,8]print(names,type(names),names[-1])foriinnames:print(i)#enumerate枚举将索引和对应的内容进行匹配foriinenumerate(names):print(
Python---多态及访问限制（Python基础内容完结~） Wanyu677 python 开发语言
#接下来介绍类的多态csdn#首先，概念：对不同的类型的变量进行相同的操作，可以根据对象（或类）类型的不同而表现出不同的行为#不同类型的对象对同一消息会做出不同的相应#看代码，进一步了解classUser(object):def__init__(self,name):self.name=namedefprintUser(self):print('hello!',self.name)classUse
Python---类（属性的修改和增加） Wanyu677 python
#那么如何修改和增加类属性呢？#修改类属性，也就是修改类里面的变量#从类方法去修改和增加类属性#1.从内部增加或者修改类属性classClassA():#定义一个类v1='奥特曼'@classmethod#使用类方法不可省去deffun1(cls):print('原来的v1值是：'+cls.v1)cls.v1=input('请输入修改v1的值：')print('修改后v1的值为：'+cls.v1)
Python---类（初始化函数） Wanyu677 python
#1.初始化函数:当创建一个实例时，这个函数就会被调用classClassA():def__init__(self):print('实例化成功')#实例化a=ClassA()"""当代码在执行a=ClassA()的语句时，就自动调用了__init__(self)函数而这个__init__(self)函数就是初始化函数，也叫构造函数初始化函数的写法是固定的格式：中间是init，意思是初始化然后前后都
Python---爬虫学习1 Wanyu677 python 爬虫学习
importrequestsimporttimefrombs4importBeautifulSoupimportpandasaspddefget_film(link,headers):#定义一个get_film的函数，接受两个参数：link和headers。link是电影信息的URL，headers是一个字典，包含了发送HTTP请求时需要使用的HTTP头信息res=requests.get(lin
Python---类的继承 Wanyu677 python 开发语言
"""一、定义类的继承类的继承：相关概念在前面已经论述再来了解一下继承的基本语法classClassName(BaseClassName):...在定义类的时候，可以再括号里写继承的类，如果不用继承类的时候，也要写继承object类，因为python中object是所有类的父类上面的代码时单继承，python也支持多继承classClassName(Base1,Base2,....):...多继承
Python---类方法 Wanyu677 python 前端
#类方法#1.类方法如何调用类属性"""classnumA():s1="两点"@classmethoddeffun1(cls):print("我是fun1"+cls.fun1())#调用numA.s1()原因：第八行第十一行#报错TypeError:'str'objectisnotcallable注意报错解决办法：需要把fun1方法更改为实例方法，而不是类方法因为类方法需要使用cls参数来访问类的
Python---爬虫学习（详细注释/优化） Wanyu677 python 爬虫学习
frombs4importBeautifulSoupimportre#正则表表达式文字匹配importurllib.request,urllib.error#指定url，获取网页数据importxlwtfindlink=re.compile(r'ahref="(.*?)">')#电影链接findImageSrc=re.compile(r'(.*)')#标题findRating=re.compile
python---练习题1-40道 mr. 刘liu python
1、题目：有四个数字：1、2、3、4，能组成多少个互不相同且无重复数字的三位数？各是多少？程序分析：可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去掉不满足条件的排列。#1,2,3,4#range(1,5)为1，2，3，4forxinrange(1,5):foryinrange(1,5):forzinrange(1,5):ifx!=yandy!=zandz!=x:print(x
python爬虫小案例抓取豆瓣电影_Python---正则表达式与爬虫小实例（抓取豆瓣电影中评分大于等于8分的影片）... 卢觉悟
本文是利用python，正则表达式构造爬虫，去爬豆瓣的标签下的电影，通过分数作为区分。#coding=utf-8###到豆瓣电影列表抓去大于等于8分的电影##http://movie.douban.com/tag/%E5%8A%A8%E4%BD%9C?start=0&type=Timporturllib2importreimportsys#获取当前系统编码格式type=sys.getfilesys
python---免费验证码识别库（ddddocr）测试-安静
前言在做UI自动化时，无论是APP还是Web在登录页面经常会遇到需要输入验证码的时候，网上也有很多方法进行帮助我们，比如通过百度OCR的接口或者其他平台的开源接口，但是大多数都是收费的，对于我们个人学习，非常不友好，以前小编也分享过，今天小编再介绍一个python的开源库，带带弟弟ocr(ddddocr)ddddocrGithub：https://kgithub.com/sml2h3/ddddoc
python---简单银行ATM系统阿喵1288 python python 开发语言 numpy
money=500000name=Nonename=input("请输入您的姓名：")defquery(show_header):ifshow_header:print("-------查询余额-------")print(f"{name},您好，您的余额剩余{money}元")defsaving(num):globalmoneymoney+=numprint("-------存款-------"
Python---多进程---多线程小希 fighting python
总结1-多进程：计算机分配资源的最小单位。2-多线程：CPU进行任务切换的最小单位。3-线程不能独立存在，必须存在在进程中。4-多进程中，多个子进程和主进程间，不会共享全局变量5-多线程中，多个子线程和主线程间，会共享全局变量6-将子线程，标记为守护线程。只有设置为守护线程的，才会在主线程运行结束后，跟着结束。否则不受任何影响并发与并行并发：在一段时间内快速交替去执行多个任务（多线程）并行：在一段
python---（面对对象）图书管理系统小猪是个帅哥 python
上述图片是图书馆的部分功能：功能一：add_book():添加图书defadd_book():books_dict={}#初始化一个空字典来存储书籍信息whileTrue:book_id=input("输入要添加图书的id")ifbook_idinbooks_dict:#如果ID已经存在于字典中print("ID已存在，请重新输入")continue#跳到下一轮循环重新输入idifnotbook_
Python---静态Web服务器-多任务版唯元素 python 前端服务器
1.静态Web服务器的问题目前的Web服务器，不能支持多用户同时访问，只能一个一个的处理客户端的请求，那么如何开发多任务版的web服务器同时处理多个客户端的请求?可以使用多线程，比进程更加节省内存资源。多任务版web服务器程序的实现步骤:当客户端和服务端建立连接成功，创建子线程，使用子线程专门处理客户端的请求，防止主线程阻塞。把创建的子线程设置成为守护主线程，防止主线程无法退出。2.静态Web服务
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class