xybaby

Python内存优化：Profile，slots，compact dict

　　实际项目中，pythoner更加关注的是Python的性能问题，之前也写过一篇文章《Python性能优化》介绍Python性能优化的一些方法。而本文，关注的是Python的内存优化，一般说来，如果不发生内存泄露，运行在服务端的Python代码不用太关心内存，但是如果运行在客户端（比如移动平台上），那还是有优化的必要。具体而言，本文主要针对的Cpython，而且不涉及C扩展。　　

　　我们知道，Python使用引用技术和垃圾回收来管理内存，底层也有各种类型的内存池，那我们怎么得知一段代码使用的内存情况呢？工欲善其事必先利其器，直接看windows下的任务管理器或者linux下的top肯定是不准的。

　　本文地址：http://www.cnblogs.com/xybaby/p/7488216.html

Pytracemalloc

　　对于基本类型，可以通过sys.getsizeof()来查看对象占用的内存大小。以下是在64位Linux下的一些结果：

>>> import sys

>>> sys.getsizeof(1)

24

>>> sys.getsizeof([])

72

>>> sys.getsizeof(())

56

>>> sys.getsizeof({})

280

>>> sys.getsizeof(True)

24

　　可以看到，即使是一个int类型(1)也需要占用24个字节，远远高于C语言中int的范围。因为Python中一切都是对象，int也不例外（事实上是PyIntObject），除了真正存储的数值，还需要保存引用计数信息、类型信息，更具体的可以参见《Python源码剖析》。

　　而对于更复杂的组合类型，复杂的代码，使用getsizeof来查看就不准确了，因为在Python中变量仅仅指向一个对象，这个时候就需要更高级的工具，比如guppy，pysizer，pytracemalloc，objgraph。在这里重点介绍pytracemalloc。

　　在Python3.4中，已经支持了pytracemalloc，如果使用python2.7版本，则需要对源码打补丁，然后重新编译。pytracemalloc在pep454中提出，主要有以下几个特点：

Traceback where an object was allocated
Statistics on allocated memory blocks per filename and per line number: total size, number and average size of allocated memory blocks
Compute the differences between two snapshots to detect memory leaks

　　简单来说，pytracemalloc hook住了python申请和释放内存的接口，从而能够追踪对象的分配和回收情况。对内存分配的统计数据可以精确到每个文件、每一行代码，也可以按照调用栈做聚合分析。而且还支持快照（snapshot）功能，比较两个快照之间的差异可以发现潜在的内存泄露。

　　下面通过一个例子来简单介绍pytracemalloc的用法和接口，关于更详细用法和API，可以参考这份详尽的文档或者pytracemalloc的作者在pycon上的演讲ppt。

 1 import tracemalloc
 2 
 3 NUM_OF_ATTR =  10
 4 NUM_OF_INSTANCE = 100
 5  
 6 class Slots(object):
 7     __slots__ = ['attr%s'%i for i in range(NUM_OF_ATTR)]
 8     def __init__(self):
 9         value_lst = (1.0, True, [], {}, ())
10         for i in range(NUM_OF_ATTR):
11             setattr(self, 'attr%s'%i, value_lst[i % len(value_lst)])
12 
13 
14 class NoSlots(object):
15     def __init__(self):
16         value_lst = (1.0, True, [], {}, ())
17         for i in range(NUM_OF_ATTR):
18             setattr(self, 'attr%s'%i, value_lst[i % len(value_lst)])
19 
20 
21 
22 def generate_some_objs():
23     lst = []
24     for i in range(NUM_OF_INSTANCE):
25         o = Slots() if i % 2 else NoSlots()
26         lst.append(o)
27     return lst
28 
29 
30 if __name__ == '__main__':
31     tracemalloc.start(3)
32 
33     t = generate_some_objs() 
34 
35     snapshot = tracemalloc.take_snapshot()
36     top_stats = snapshot.statistics('lineno') # lineno filename traceback
37 
38     print(tracemalloc.get_traced_memory())
39     for stat in top_stats[:10]:
40         print(stat)

　　在上面的代码中，用到了pytracemalloc几个核心的API：

　　start(nframe: int=1)　　

　　　　pytracemalloc的一大好处就是可以随时启停，start函数即开始追踪内存分配，相应的stop会停止追踪。start函数有一个参数，nframes : 内存分配时记录的栈的深度，这个值越大，pytracemalloc本身消耗的内存越多，在计算cumulative数据的时候有用。

　　get_traced_memory()

　　　　返回值是拥有两个元素的tuple，第一个元素是当前分配的内存，第二个元素是自内存追踪启动以来的内存峰值。

　　take_snapshot()　　　　

　　　　返回当前内存分配快照，返回值是Snapshot对象，该对象可以按照单个文件、单行、单个调用栈统计内存分配情况　　　　

　　运行环境：windows 64位python3.4

(62280, 62920)

test.py:10: size=16.8 KiB, count=144, average=120 B

test.py:17: size=16.7 KiB, count=142, average=120 B

test.py:19: size=9952 B, count=100, average=100 B

test.py:26: size=9792 B, count=102, average=96 B

test.py:27: size=848 B, count=1, average=848 B

test.py:34: size=456 B, count=1, average=456 B

test.py:36: size=448 B, count=1, average=448 B

D:\Python3.4\lib\tracemalloc.py:474: size=64 B, count=1, average=64 B

　　如果将第36行的“lineno“改成“filename”，那么结果如下

(62136, 62764)

test.py:0: size=54.5 KiB, count=491, average=114 B

D:\Python3.4\lib\tracemalloc.py:0: size=64 B, count=1, average=64 B

　　有了Profile结果之后，可以看出来在哪个文件中有大量的内存分配。与性能优化相同，造成瓶颈的有两种情况：单个对象占用了大量的内存；同时大量存在的小对象。对于前者，优化的手段并不多，惰性初始化属性可能有一些帮助；而对于后者，当同样类型的对象大量存在时，可以使用slots进行优化。

Slots

　　默认情况下，自定义的对象都使用dict来存储属性（通过obj.__dict__查看），而python中的dict大小一般比实际存储的元素个数要大（以此降低hash冲突概率），因此会浪费一定的空间。在新式类中使用__slots__，就是告诉Python虚拟机，这种类型的对象只会用到这些属性，因此虚拟机预留足够的空间就行了，如果声明了__slots__，那么对象就不会再有__dict__属性。

　　使用slots到底能带来多少内存优化呢，首先看看这篇文章，对于一个只有三个属性的Image类，使用__slots__之后内存从25.5G下降到16.2G，节省了9G的空间！

　　到底能省多少，取决于类自身有多少属性、属性的类型，以及同时存在多少个类的实例。下面通过一段简单代码测试一下：

 1 # -*- coding: utf-8 -*-
 2 import sys
 3 import tracemalloc
 4 
 5 NUM_OF_ATTR =  3 #3 # 10 # 30 #90
 6 NUM_OF_INSTANCE = 10 # 10 # 100
 7  
 8 class Slots(object):
 9     __slots__ = ['attr%s'%i for i in range(NUM_OF_ATTR)]
10     def __init__(self):
11         value_lst = (1.0, True, [], {}, ())
12         for i in range(NUM_OF_ATTR):
13             setattr(self, 'attr%s'%i, value_lst[i % len(value_lst)])
14 
15 
16 class NoSlots(object):
17     def __init__(self):
18         value_lst = (1.0, True, [], {}, ())
19         for i in range(NUM_OF_ATTR):
20             setattr(self, 'attr%s'%i, value_lst[i % len(value_lst)])
21 
22 if __name__ == '__main__':
23     clz = Slots if len(sys.argv) > 1 else NoSlots
24     tracemalloc.start()
25     objs = [clz() for i in range(NUM_OF_INSTANCE)]
26     print(tracemalloc.get_traced_memory()[0])

　　上面的代码，主要是在每个实例的属性数目、并发存在的实例数目两个维度进行测试，并没有测试不同的属性类型。结果如下表：

　　百分比为内存优化百分比，计算公式为(b - a) / b，其中b为没有使用__slots__时分配的内存， a为使用了__slots__时分配的内存。

注意事项

　　关于__slots__，Python文档有非常详尽的介绍，这里只强调几点注意事项

　　第一：基类和子类都必须__slots__，即使基类或者子类没有属性

>>> class Base(object):

... pass

...

>>> class Derived(Base):

... __slots__ = ('a', )

...

>>> d.__slots__

('a',)

>>> getattr(d, '__dict__', 'No Dict')

{}

　　从上面的示例可以看到，子类的对象还是有__dict__属性，原因就在于基类没有声明__slots__。因此，可以通过看子类的实例有没有__dict__属性来判断slots的使用是否正确

　　第二：子类会继承基类的__slots__

　　更准确的说，如果访问属性的时候没有在子类的__slots__找到，会继续在基类的__slots__查找，因为Python使用descriptor在类这个层级实现__slots__的，具体可以参见《 python属性查找深入理解》一文

>>> class Base(object):

...     __slots__ = ('a',)

...

>>> class Derived(Base):

...     __slots__ = ('b', )

...

>>> d = Derived()

>>> d.__slots__

('b',)

>>> getattr(d, '__dict__', 'No Dict')

'No Dict'

>>> d.a = 1

>>> d.c = 0

Traceback (most recent call last):

  File "", line 1, in

AttributeError: 'Derived' object has no attribute 'c'

objgraph

　　在大型工程中，怎么排查有哪些大量存在的对象呢，毕竟同一个类型存在的对象越多，优化越有效果。除了直接看代码，最好使的就是使用objgraph.py的show_most_common_types(N)函数，该函数返回Python gc管理的所有对象中，数目前N多的对象，在排除掉python builtin对象之后，剩下的就是可优化的对象。比如在最上面的代码中：在最后加上这么两句：

import objgraph

objgraph.show_most_common_types(25)

　　输出如下：

再论Python dict

　　前面介绍slots的时候，就提到Python自定义的对象中通过dict来管理属性。这种机制极大的提高了Python的灵活性 -- 可以随时给对象增加属性，但是其实现机制也带来了内存上的浪费。不管是python源码，还是Python程序，都大量使用了dict，因此这部分内存浪费不容小视。

　　python中的dict使用的是散列表（类似C++中的std::unordered_map），当计算出的hash值冲突的时候，采用开放地址法解决冲突（另一种常见的冲突解决算法是链表法）。为了降低冲突概率，当装填因子（实际存储的元素与散列表长度的比值）超过2/3的时候就会对散列表进行扩容，因此散列表中一定会存在一些未使用的槽。

　　下面简单看看PyDictObject的数据结构（python2.7.3 dictobject.h）

 1 #define PyDict_MINSIZE 8
 2 
 3 typedef struct {
 4     /* Cached hash code of me_key.  Note that hash codes are C longs.
 5      * We have to use Py_ssize_t instead because dict_popitem() abuses
 6      * me_hash to hold a search finger.
 7      */
 8     Py_ssize_t me_hash;
 9     PyObject *me_key;
10     PyObject *me_value;
11 } PyDictEntry;
12 
13 
14 typedef struct _dictobject PyDictObject;
15 struct _dictobject {
16     PyObject_HEAD
17     Py_ssize_t ma_fill;  /* # Active + # Dummy */
18     Py_ssize_t ma_used;  /* # Active */
19 
20     /* The table contains ma_mask + 1 slots, and that's a power of 2.
21      * We store the mask instead of the size because the mask is more
22      * frequently needed.
23      */
24     Py_ssize_t ma_mask;
25 
26     /* ma_table points to ma_smalltable for small tables, else to
27      * additional malloc'ed memory.  ma_table is never NULL!  This rule
28      * saves repeated runtime null-tests in the workhorse getitem and
29      * setitem calls.
30      */
31     PyDictEntry *ma_table;
32     PyDictEntry *(*ma_lookup)(PyDictObject *mp, PyObject *key, long hash);
33     PyDictEntry ma_smalltable[PyDict_MINSIZE];
34 };

　　从定义可以看出，除了固定的部分（几个Py_ssize_t），PyDictObject中主要是PyDictEntry对象，PyDictEntrty包含一个Py_ssize_t（int）和两个指针。上面源码中的注释（第26行）指出，当dict的元素比较少时，ma_table指向ma_smalltable，当元素增多时，ma_table会指向新申请的空间。ma_smalltable的作用在于Python（不管是源码还是代码）都大量使用dict，一般来说，存储的元素也不会太多，因此Python就先开辟好PyDict_MINSIZE(默认为8)个空间。

　　为什么说PyDictObject存在浪费呢，PyDictEntry在32位下也有12个字节，那么即使在ma_smalltable（ma_table）中大量的位置没有被使用时，也要占用这么多字节。用这篇文章中的例子：

　　假设有这么一个dict：　　d = {'timmy': 'red', 'barry': 'green', 'guido': 'blue'}

　　在Python源码中的视图就是这样的：

　# 　下面的entries就是ma_smalltable

entries = [['--', '--', '--'],
           [-8522787127447073495, 'barry', 'green'],
           ['--', '--', '--'],
           ['--', '--', '--'],
           ['--', '--', '--'],
           [-9092791511155847987, 'timmy', 'red'],
           ['--', '--', '--'],
           [-6480567542315338377, 'guido', 'blue']]

　　然而，完全可以这么存储：

　indices = [None, 1, None, None, None, 0, None, 2]

entries =  [[-9092791511155847987, 'timmy', 'red'],
                [-8522787127447073495, 'barry', 'green'],
                [-6480567542315338377, 'guido', 'blue']]

　　indices的作用类似ma_smalltable，但只存储一个数组的索引值，数组只存储实际存在的元素（PyDictEntry），当dict中的元素越稀疏，相比上一种存储方式使用的内存越少。而且，这种实现， dict就是有序的（按插入时间排序）

　　这就是python3.6中新的dict实现，Compact dict! Stackoverflow上也有相关讨论。

总结

　　本文中介绍了Python内存优化的Profile工具，最有效的优化方法：使用slots，也介绍了在python3.6中新的dict实现。

　　当然，还有一些良好的编码习惯。比如尽量使用immutable而不是mutable对象：使用tuple而不是list，使用frozenset而不是set；另外，就是尽量使用迭代器，比如python2.7中，使用xrange而不是range，dict的iterxx版本。

references

pytracemalloc

pep454： Add a new tracemalloc module to trace Python memory allocations　　

save-ram-with-python-slots/

Python源码分析-PyDictObject

More compact dictionaries with faster iteration

Auto PY to EXE：一键将Python脚本转换为可执行文件方玉蜜United
AutoPYtoEXE：一键将Python脚本转换为可执行文件项目地址:https://gitcode.com/gh_mirrors/au/auto-py-to-exe在软件开发的世界里，将Python脚本转换为可执行文件（.exe）是一个常见的需求。无论是为了分发给非技术用户，还是为了保护源代码，这个过程都显得尤为重要。今天，我们要介绍的是一款强大的工具——AutoPYtoEXE，它能够帮助你轻
Python蓝桥杯刷题--妮妮的蓝桥果园2（split，map）重生之我要成为代码大佬蓝桥python学习算法 python 开发语言蓝桥杯
题目在蓝桥镇，妮妮拥有一片美丽的果园。果园中有N种不同的水果树，每种水果树上的水果都有其特别的价值。妮妮记下了每种水果的价值，用一个正整数Ai来表示。现在妮妮想知道，如果他把果园里所有种类的水果都摘下来卖掉，他能获得多少的总价值。你能帮助妮妮计算一下吗？输入格式输入的第一行包含一个整数N，表示果园中水果的种类数。接下来的一行包含N个整数A1,A2,...,AN，分别表示每种水果的价值。其中，满足1
利用auto-py-to-exe库的简单图形界面实现.py到.exe的转换 Lins号丹 Python编程 py文件打包 exe文件转换 auto-py-to-exe
文章目录1.auto-py-to-exe简介2.安装与使用3.配置项介绍4.打包完成1.auto-py-to-exe简介运行.py文件需要配套相应的Python解释器和相关的依赖项，而很多时候我们会面临光有待演示的.py程序，而没有支持演示的环境的尴尬。一种解决办法就是，将.py文件及其依赖的内容打包成可执行文件.exe，这样，就算用户电脑没有安装Python相关环境，也能够成功运行代码。Pyth
Python|基于DeepSeek大模型，实现文本内容仿写（8）写python的鑫哥 AI大模型实战应用人工智能 python 大模型 DeepSeek Kimi 文本仿写
前言本文是该专栏的第8篇，后面会持续分享AI大模型干货知识，记得关注。我们在处理文本数据项目的时候，有时可能会遇到这样的需求。比如说，指定某些文本模板样例，需要仿写或者生成该“模板”样例数据。再或者说，通过给予某些指定类型的关键词，生成关键词相关领域的文本素材或内容。如果单单投入人力去完成，这肯定是没问题，但耗费的更多是人力成本。而现阶段，对于这种需求，大大可以选择大模型去完成。而本文，笔者将基于
【Python爬虫实战】深入解析 Scrapy 管道：数据清洗、验证与存储的实战指南易辰君 python爬虫 python 爬虫开发语言
个人主页：易辰君-CSDN博客系列专栏：https://blog.csdn.net/2401_86688088/category_12797772.html目录前言一、了解ScrapyShell二、配置文件settings.py（一）为什么需要配置文件（二）配置文件的使用方法（三）常用字段及其含义三、管道的深入使用（一）管道的常用方法（二）管道的实现（三）启用管道四、管道的常见应用场景五、管道使用
【Python爬虫实战】轻量级爬虫利器：DrissionPage之SessionPage与WebPage模块详解易辰君 python爬虫 python 爬虫开发语言
个人主页：易辰君-CSDN博客系列专栏：https://blog.csdn.net/2401_86688088/category_12797772.html目录前言一、SessionPage（一）SessionPage模块的基本功能（二）基本使用（三）常用方法（四）页面元素定位和数据提取（五）Cookie和会话管理（六）SessionPage的优点和局限性（七）SessionPage和Driver
【Python爬虫实战】全面解析 DrissionPage：简化 Python 浏览器自动化的三种模式易辰君 python爬虫 python 爬虫开发语言
个人主页：易辰君-CSDN博客系列专栏：https://blog.csdn.net/2401_86688088/category_12797772.html目录前言一、DrissionPage简介（一）ChromiumPage（二）WebPage（三）SessionPage（四）三大模块总结二、ChromiumPage（一）初始化ChromiumPage（二）基本操作（三）等待元素加载（四）执行J
用Python找到童年的乐趣，制作一款贪吃蛇小游戏。新手教程！ 2401_83703951 程序员 python pygame 开发语言
开发工具python版本：3.6.8编辑器：pycharm相关模块importcopyimportrandomimportpygame模块安装pipinstall-ihttps://pypi.doubanio.com/simple/--trusted-hostpypi.doubanio.compygame实现效果这个就是代码运行的效果了。以前就是这样一个极为枯燥的游戏都能很多人抢着玩，一人一条命，
python循环——九九乘法表（更加轻松的理解循环结构）李雨非-19期-河北工职大成长 python python 开发语言循环
感受首先，得明确意识到这个问题，就是我的循环结构学的一塌糊涂，完全不能很好的使用这个循环来实现各种九九乘法表达输出，这样的循环结构太差了，还需要我自己找时间来补充一下循环的使用，来拓宽自己的思考方向，这是个不错的机会，让我更加充分的体会循环的嵌套。重点在写博客中对可迭代对象的求知欲不断的加深，让我对于对象以及可迭代的认识更深了，不得不说，有时候还是得写出来才可以给予自己更加强大的欲望，从而推动自己
在 Python 中使用 Ollama API 一路追寻大模型 Python Ollama LLM linux python
在Python中使用OllamaAPI在本文中，我们将简单介绍如何在Python中使用OllamaAPI。无论你是想进行简单的聊天对话、使用流式响应处理大数据、还是希望在本地进行模型的创建、复制、删除等操作，本文都可以为你提供指导。此外，我们还展示了如何使用自定义客户端和异步编程来优化你的应用程序性能，环境准备在开始使用Python与OllamaAPI交互之前，请确保您的开发环境满足以下条件：Py
【数据库】PyMySQL详解：轻松实现Python与MySQL的高效交互易辰君数据库 mysql python 数据库
目录前言一、PyMySQL的特点二、安装三、基本用法（一）连接MySQL数据库（二）数据查询（三）插入数据（四）更新和删除数据（五）事务管理四、游标类型五、安全性六、常见错误处理七、性能优化八、总结前言PyMySQL是一个纯Python的库，用于连接MySQL数据库，并执行SQL语句。它是MySQLdb的替代品，但不同于后者，PyMySQL不需要C语言的依赖，因此更加轻量且易于安装和使用。该库的主
Python 中无穷的表示梦想是优秀社畜 Python python 编程语言经验分享
我们在python编程过程中可能需要设定一个无穷大的值来辅助我们的逻辑语句，下面展示python中无穷大的表示，和无穷的判断方法。上代码！！！#无穷的判断需要导入math模块importmath#正无穷zheng_wq=float('inf')#负无穷fu_wq=-float('inf')#float('-inf')#判断是否无穷math.isinf(zhengwq)#最终结果是True希望我的笔
ubuntu安装miniconda MWbayern ubuntu
Anaconda是一个开源的Python包管理器，而Miniconda则是轻量级的Anaconda下载地址ubuntu安装在下载地址里面下载相应文件或者sudoapt-getinstallwgetwgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh之后运行该文件bashMiniconda3-latest-
python中drop用法去重_如何使用drop_duplicates进行简单去重（入门篇） weixin_39991055 python中drop用法去重
什么是去重呢？简单来说，数据去重指的是删除重复数据。在一个数字文件集合中，找出重复的数据并将其删除，只保存唯一的数据单元。在我们的数据预处理过程中，这是一项我们经常需要进行的操作。去重有哪些好处？节省存储空间提升写入性能提高模型精度今天我们就来简单介绍一下，在pandas中如何使用drop_duplicates进行去重。一、函数体及主要参数函数体：df.drop_duplicates(subset
python中legend设置_如何使用python legend()函数？ weixin_39906130 python中legend设置
当我们需要去设置一个图示，并且在细节掌控上需要我们对于背景的颜色，以及边框颜色等属性，需要去做处理的时候，一般大家想到的模块或者函数都只能解决部分。结合起来可以完成上述所说的要求，但是有一个函数是专门为制定个性化的图例而工作的，这就是本章要跟大家介绍的legend()函数。函数功能：设置图例的字体、大小、颜色等属性，制定个性化。函数语法：plt.legend()函数参数：Loc，指代地理位置实例代
python中数字应该用什么表示_python的特殊数字类型（无穷大、无穷小等） weixin_39646018
float('inf')表示正无穷-float('inf')或float('-inf')表示负无穷其中，inf均可以写成Inf起步python中整型不用担心溢出，因为python理论上可以表示无限大的整数，直到把内存挤爆。而无穷大在编程中常常需要的。比如，从一组数字中筛选出最小的数字。一般使用一个临时变量用于存储最后结果，变量去逐个比较和不断地更新。而这临时变量一般要初始无穷大或者去第一个元素的值
基于人工智能的Python面试题请一直在路上 python 开发语言
基于人工智能的Python面试题1.Python中的元组与列表区别是什么？列表是可变类型，元组不是。列表是引用类型，元组不是。列表使用场景更宽泛，元组更多用于一些数据不可变的场景，例如参数、或者返回值。2.Python中的字典是否有序？python3.6之前字典是无序的，之后是有序的。原因可以参考下这个帖子https://blog.csdn.net/weixin_48629601/article/
JAVA 反射(JAVA面试题) geejkse_seff java 开发语言
5.1.2.JAVA反射5.1.2.1.动态语言动态语言，是指程序在运行时可以改变其结构：新的函数可以引进，已有的函数可以被删除等结构上的变化。比如常见的JavaScript就是动态语言，除此之外Ruby,Python等也属于动态语言，而C、C++则不属于动态语言。从反射角度说JAVA属于半动态语言。5.1.2.2.反射机制概念（运行状态中知道类所有的属性和方法）在Java中的反射机制是指在运行状
如何运用Python爬虫快速获得1688商品详情数据小爬虫程序猿 API python 爬虫开发语言
在数字化时代，数据的价值日益凸显，尤其是在电商领域。对于企业来说，获取竞争对手的商品信息是分析市场趋势、制定营销策略的重要手段。1688作为中国领先的B2B电商平台，拥有海量的商品数据。本文将介绍如何使用Python编写爬虫程序，以合法合规的方式快速获取1688商品详情，为电商企业提供数据支持。1.环境准备在开始编写代码之前，我们需要准备以下开发环境：Python3.x：确保已安装Python3.
python微博关键词爬虫嵌入式开发项目 2025年爬虫精通专栏 python 爬虫开发语言媒体
目录记一次阿里云盾滑块验证分析并通过操作环境数据接口proxy配置根据关键词获取userid根据userid获取信息数据保存数据：记一次阿里云盾滑块验证分析并通过操作环境win10、macPython3.9数据接口搜索https://**********?containerid=100103type%3D{chanenl}%26q%3D{quote(self.words)}&page_type=s
python matplotlib legend()参数详解请一直在路上 python matplotlib 开发语言
在Python的Matplotlib库中，legend函数用于添加图例，帮助解释图表中不同数据系列或数据点的含义。legend函数有很多参数，可以自定义图例的各个方面，从位置到样式，从字体大小到边框。下面是一些常用参数的详细解释：importmatplotlib.pyplotasplt#创建一些数据x=[1,2,3,4]y1=[1,4,9,16]y2=[1,2,3,4]#绘制数据plt.plot(
Python+Pytest+Allure+Git+Jenkins数据驱动接口自动化测试框架_python+pytest+allure+jenkins架构 2401_87378716 python pytest git
接口测试流程1、需求评审，熟悉业务和需求2、开发提供接口文档3、编写接口测试用例4、用例评审5、提测后开始测试6、提交测试报告两种常见的HTTP请求方法：GET和POST二、项目说明本框架是一套基于Python+Pytest+Requests+Allure+Jenkins而设计的数据驱动接口自动化测试的框架。技术栈Python、Pytest、Requests、Pactverity、Excel、Js
python运行方式威胁情报收集站 pycharm ide python
#python代码运行方式第一种：交互式解释器。第二种：命令行运行python源代码。第三种：使用编辑器或集成开发环境（IDE）。比如：pycharm。（IDE：IntegratedDevelopmentEnvironment）详细教程：https://edu.csdn.net/job/pythonbe_01/python-3-3
【强化学习】PyTorch-RL框架大雨淅淅人工智能 pytorch 人工智能 python 深度学习机器学习
目录一、框架简介二、核心功能三、学习环境配置四、学习资源五、实践与应用六、常见问题与解决方案七、深入理解强化学习概念八、构建自己的强化学习环境九、调试与优化十、参与社区与持续学习一、框架简介PyTorch-RL是一个基于PyTorch框架的深度强化学习项目。它充分利用了PyTorch的强大功能，提供了易于使用且高效的深度强化学习算法实现。该项目的主要编程语言是Python，旨在帮助开发者快速实现和
运行python程序的两种方式交互式和文件式_执行Python程序的两种方式 weixin_39610085
交互式(了解)交互式环境下，敲完一条命令按下enter键马上能看到结果，调试程序方便。程序无法永久保存，关掉cmd窗口数据就消失了。命令行式(了解)打开文本编辑器，在文本编辑器中写入一串字符。文本编辑器写的代码毫无意义，只是一堆字符，并且文件的后缀名没有影响。由于python语言是解释型语言，我们直接使用python打开文件，python会读一行翻译一行，并且这个文件是永久保存在硬盘中的。但是需要
【python基础】python GIL(全局解释器锁) 和多线程锁 shengnan_wsn python python 开发语言后端
文章目录什么是GIL？有了GIL还需要线程锁吗？参考资料1：[终于有人把GIL全局解释器说清楚了](https://zhuanlan.zhihu.com/p/311877485)2：[浅谈Python多线程之GIL描述](https://blog.csdn.net/qq_34359754/article/details/115209158)3：[多线程锁机制](https://www.cnblog
windows下python运行的方法好烦好烦方法
python有2中运行模式，一种是交互运行模式，一种是脚本运行模式。（假设用户已经安装好，网上很多例子）交互运行方和matlab命令窗口有点类似，有2中方法，一种是用它自带的开发环境IDLE，一种是在命令窗口下运行，建议2种方法都掌握，因为我们要在命令窗口模式下运行脚本文件。用开始菜单键win+r直接打开命令窗口，输入python字符回车，应该会出现如下提示： ![打开](https://im
【WRF后处理】基于NCL处理wrf运行结果wrfout_d01 WW、forever WRF模型原理及应用 WRF NCL
【WRF后处理】基于NCL处理wrf运行结果wrfout_d01NCL概述wrf-python和NCL总结WRF后处理数据信息查看诊断变量的获取插值参考NCL概述NCARCommandLanguage（NCL）是由美国大气研究中心（NCAR）推出的一款用于科学数据计算和可视化的免费软件。它有着非常强大的文件输入和输出功能，可读写netCDF-3、netCDF-4classic、HDF4、binar
常用Python GUI库推荐！老男孩IT教育 python 开发语言
tkinter的全称是TkInterface，是Python自带的GUI库，支持跨平台的GUl程序开发，只要安装了python就可以直接使用它。那么pythontkinter是什么?常用PythonGUI库有哪些?具体请看下文。pythontkinter是什么?tkinter是Python的标准GUI库。Python使用tkinter可以快速的创建GUI应用程序。由于tkinter是内置到Pyth
第 7 课Python 容器类型与相关操作嵌入式老牛 Python入门 python 开发语言
1.容器介绍对象是Python中对数据的抽象，Python程序中的所有数据都是由对象或对象间关系来表示的。Python中，可包含其他对象的引用的对象，称之为“容器”。容器的例子有元组、列表和字典等。这些引用的对象是容器对象值的组成部分。常用的容器主要划分为两种：序列（如：列表、元组等）和映射（如：字典）。序列中，每个元素都有下标，它们是有序的。映射中，每个元素都有名称（又称“键”），它们是无序的。
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag