LessenPaul

Python中源码之字符串底层解析

文章目录

1、Python2中的PystringObject

1.2 PyStringObject的创建
1.3 intern机制
1.4 字符串缓冲池
1.5 PyStringObject的某些操作效率

2、Python3中的PyUnicodeObject

Python的对象分为 “可变对象” 和 “不可变对象”，可变对象也还可以分为 “可变” 和 “不可变”，这里所谓的可变就是说对象所维护的数据是可以变化的，举个例子说明，list容器中的元素可以进行添加、删除、修改等操作，也就是说这个容器对象所维护的数据是可以动态变化的；而所谓 “不可变” 就是说，此对象中所维护的数据一旦创建后就不能发生改变，即便对这个对象进行某种操作后生成的数据也只能是一个新的地址，例如tuple容器。这一节我们将研究Python中的字符串对象。

1、Python2中的PystringObject

在本节我们也会先来解析一下Python2中对于字符串对象的实现，然后再简述一下在Python3中的字符串对象和Python2中有什么不同。实际Python中的字符串对象就是通过PyStringObject来实现的，它是一个内存大小可变的一个对象（不是说不可变吗？怎么又可变了？什么鬼？）。之所以说它可变是因为在创建字符串对象的时候，我们是不能提前预知字符串的长度的，所以在PyStringObject对象中必须要有可以用来记录字符串长度的成员。举个例子，‘java’ 和 ‘Python’ 这两个字符串的长度显然是不一样的，因此这两个字符串所占用的内存空间也是不一样的。But talk is cheap, show me the code, 让我们来看看底层C语言的实现

// stringobject.h
typedef struct {
    PyObject_VAR_HEAD;  // 这是在PyObject中定义的宏
    long ob_shash;
    int ob_sstate;
    char ob_sval[1];
}PyStringObject;

可以非常清楚地看见，PyStringObject的头部实际上是一个PyObject_VAR_HEAD，这个头部中维护了一个ob_size的变量，这个变量用来保存可变内存的大小。

ob_shash变量是用来缓存该对象的哈希值，之所以缓存哈希值是因为避免重复计算，它具体的实现算法大家有兴趣可以去参考一下源码，这里我们的重点是解析Python，就不展开了。

ob_sstate变量用于记录该对象是否已经经过了intern机制的处理，这个intern机制是个啥？我们后面会详细聊这个牛逼哄哄的玩意儿。

ob_sval是一个字符数组，这是个啥玩意儿？为啥数组长度只有1 ？你接着往下看就知道了。实际上这货是一个字符指针，这个指针指向了一段内存，而这段内存就是这个字符串对象中所维护的实际的字符串。这段装有实际字符串的字节数（在c语言中一个字符用一个字节来存储）就是由上面说的PyObject_VAR_HEAD中的ob_size变量来维护的。需要注意的是，ob_sval这个字符指针指向的内存字节数也就是长度并不是ob_size,而是ob_size+1。我们知道在C语言中，对于一段字符串结束的标志是一个叫做 ‘\0’ 的字符，所以在PyStringObject的字符串对象中，不以 ‘\0’ 作为结束处理，万一这个字符串中间有这个字符呢，那不就傻X了吗？所以我们在最后末尾添加结束字符，所以这段内存就必须满足ob_sval[ob_size + 1] = ‘\0’. 实际上在Python2中所有变长对象的实现机制都是基于这个叫做ob_size的玩意儿来的。

1.2 PyStringObject的创建

与Python中的整数对象一样，PyStringObject对象也有多种创建方式。原生的创建方式就是通过PyString_FromString

// stringobject.c
PyObject* PyString_FromString(const char *str) {
    register size_t size;
    register PyStringObject *op;
    // (1)判断字符串长度
    size = strlen(str);
    if (size > PY_SSIZE_T_MAX) {
        return null;
}
    // (2)处理null string
    if (size == 0 && (op = nullstring) != NULL) {
        return (PyObject *)op;
}
    // (3)处理字符
    if (size == 1 && (op = characters[*str & UCHAR_MAX]) != NULL) {
        return (PyObject *)op;
}
    // 创建新的PyStringObject对象
    op = (PyStringObject *)PyObject_MALLOC(sizeof(PyStringObject) + size);
    PyObject_INIT_VAR(OP, &PyString_Type, size);
    op -> ob_shash = -1;   // 在对象创建时对象哈希值置为 -1
    op -> ob_sstate = SSTATE_NOT_INTERNED;
    memcpy(op -> ob_sval, str, size+1);
    //........
}

可以看见这个函数所接受的参数是一个结束符为 ‘\0’的字符串的指针，第一步检查传入参数的长度，如果大于PY_SSIZE_T_MAX所定义的长度则不会返回字符串对象，这个变量是一个与系统相关的值，总之它很大，除非你传入一个N个g的字符串。第二步就是对空字符串的处理，这一步需要好好扳饬一哈，假如传入函数的字符串是一个空串，从代码逻辑上看好像都会返回一个PyStringObject，其实不然。我们看到在 if 语句中有一个nullstring的变量，实际上这是一个PyStringObject的指针，这个指针是负责处理空字符串，如果第一次创建一个空串，此时nullstring被初始化为NULL，所以这时会为这个空字符创建一个PyStringObject对象，并且将此对象通过intern机制共享，并且将这个被共享的对象赋值给nullstring指针。当再次需要创建一个空串对象时，则直接将nullstring指针指向的这个对象返回即可。

如果传入的是一个有效的字符串，那么Python将会为这个对象申请内存空间，这个内存空间分为两部分，一部分是PyStringObject本身的内存，另一部分是用于存储实际字符串的空间，我们知道由于在C中，字符串是以字符数组的形式存在的，而一个字符是一个字节存储的，所以这个额外的大小就是size。需要注意的是，上面提出了一个疑问，ob_sval数组的长度为1，现在我们就来解答。上面说过这个字符数组是一个指向实际字符串的指针，也就是说这个数组的首地址实际上存放的就是字符串的第一个字符，然后依次在数组中存放其他字符，并且在最后存放一个 ‘\0’ 的结束字符，整个结构入下图所示（丑得我自己都没法儿看）。在申请完内存空间后，将对象的hash缓存值设置为-1，，将intern标志设置为SSTATE_NOT_INTERNED

这是创建字符串对象的一种方式，还有一种方式是通过PyString_FromStringAndSize,这种方式与第一种无二，只是没有传入参数必须以 ‘\0’结尾的限制。

1.3 intern机制
先上一段code

stringobject.c
PyObject* PyString_FromString(const char *str){
    // .........
    //共享长度较短的字符串对象
    if (size == 0){
        PyObject *t = (PyObject *)op;
        PyString_internInplace(&t);
        op = (PyStringObject *)t;
        nullstring = op;
} else if (size == 1){
    PyObject *t = (PyObject *)op;
    PyString_InternInplace(&t);
    op = (PyStringObject *)t;
    characters[*str & UCHAR_MAX] = op;
}
    return (PyObject *)op;
}

还记得上面我们创建字符串对象的代码吗？或许在看创建对象代码时有一点懵逼，但是看到这里相信你就豁然开朗了。没错，当字符数组的长度为1 的时候会先经过intern机制处理，并且让nullstring指向这个对象，以后在创建一个空串时就直接将这个共享的对象返回即可。其用意在于在Python运行的这个期间，对于小字符串而言只有一个PyStringObject对象，这样能够节省内存空间。此外，在进行两个字符串的比较时，如果它们都被intern了，那么只需要检查它们的PyObject*相同即可，这样也简化了字符串对象的比较，简直了。

接下来我们来瞅瞅这个叫做PyString_internInplace的函数做了哪些骚操作。

stringobject.c
void PyString_InternInplace(PyObject **p){
    register PyStringObject *s = (PyStringObject *)(*p);
    PyObject *t;
    // 检查PyStringObject对象的类型和状态
    if (!PyString_CheckExtract(s)) return;
    if (PyString_CHECK_INTERNED(s)) return;
     
    //创建记录经过intern机制处理后的字符串对象的dict
    if (interned == NULL) interned = PyDict_New();
    // 检查PyStringObject对象s是否存在对应的intern后的PyStringObject对象
    t = PyDict_GetItem(interned, (PyObject *)s)
    if (t){
        //引用计数的调整
        Py_INCREF(t);
        Py_DECREF(*p);
        *p = t;
        return;
}
    // 在interned中记录检查PyStringObject对象 s
    PyDict_SetItem(interned, (PyObject *)s, (PyObject *)s );
    // 调整引用计数
    s -> ob_refcnt -= 2;
    //调整s中的intern状态标志
    PyString_CHECK_INTERNED(s) = SSTATE_INTERNED_MORTAL;
}

首先检查传入的对象是否是一个PyStringObject对象，因为intern机制只处理PyStringObject类型的对象；然后检查传入的对象是否已经经过了intern机制处理，如果是则直接返回，不再进行intern机制。接下来我们看见对interned变量进行了大量操作，这是个什么玩意儿？其实从定义中完全不知道是个什么鬼，定义中它是一个指向PyObject对象的静态指针变量。what？还是不求懂。但是在这里可以知道它实际上指向的是一个PyDictObject的对象，也就是Python中封装起来的dict。

OK，敲黑板重点来了。也就是说实际上Python通过维护一个键值对映射的关系集合来实现intern机制，也就是interned变量啦。interned所指向的对象中，记录了被intern机制处理过的PyStringObject对象。当intern一个PyStringObject对象a时，会先在interned变量所指向的关系集合中去search是否存在这样一个对象b—它所维护的字符数组中的字符串与需要intern的对象相同。如果在这个关系集合中存在这样一个对象b，就做如下操作：1、将指向a的PyObject指针指向b, 2、将a的引用计数减1，对应代码中的Py_INCREF, Py_DECREF操作。所以实际上a只是一个临时的对象。

如果不存在这样的对象b，就将a记录到interned所维护的关系集合中。有一点可能很奇怪，为什么最后引用计数会减2呢？因为在经过intern机制处理的PyStringObject对象中，采用了特殊的引用计数，在将对象添加到interned中时，PyDictObject会将这个对象进行两次引用计数加1的操作，一个是外部变量a对这个PyStringObject对象的引用，另一个是interned中key对对象的引用。因此规定interned中的a的指针不能作为有效引用，因为如果作为有效引用知道Python结束，此对象的应用最少也还有两个，这样的话这个对象就无法被销毁了，所以在最后才会有引用计数减2的操作。

如果你听到有人说Python在创建一个字符串时，会首先在interned中去检查是否已经有该字符串所对应的对象，如果有则不用创建新的，以达到节省空间的目的（虽然一开始我也是这么说的）。那么现在你知道这种说法是错误的了，至少是不准确的。因为在创建PyStringObject对象时，并非一开始就节省了空间，在代码中可以看见无论如何一个临时的PyStringObject对象是会被创建的，也就是说不管怎么Python一定会为一个字符串创建一个PyStringObject的对象，即使字符串与interned中的某个对象字符串内容相同。那为什么必须要创建这样一个临时的对象呢，其实代码中已经给出了答案。原因就是interned所维护的关系集合中的key必须是一个PyObject类型的指针。

1.4 字符串缓冲池

在intern机制的讲解中的第一个代码中，我避开了一个问题就是当创建的字符串长度为1的时候，会有一个 “characters[*str & UCHAR_MAX] = op” 的执行语句，那么这是个什么呢？它就是一个字符缓冲池，我们来看看它的定义

static PyStringObject *characters[UCHAR_MAX + 1];

UCHAR_MAX是一个系统头文件中定义的变量。我们在讲解整数对象的时候知道，小整数的缓冲池是在Python初始化的时候创建的，但是字符缓冲池是以静态变量的形式存在，Python初始化完成后，缓冲池中所有的PyStringObject指针均为NULL。

当创建字符串对象时，如果字符串是一个字符，则先对字符对象进行intern操作，再将intern的结果缓存到字符缓冲池characters中，我们用一个图来说明

因此在创建PyStringObject对象是，会检查此对象是否是一个字符对象，如果是则检查缓冲池中是否已经存在此字符对象的缓冲，如果有则直接返回缓冲对象即可。代码实际上在创建对象的时候已经有所体现了，不过那时还处于懵逼状态罢了，现在一切都清晰了，世界真好！

1.5 PyStringObject的某些操作效率

As we know, 在Java中对于字符串可以使用连接符 ’+‘ 来连接字符串从而得到一个新的字符串。在Python中也提供了这样一个 + 连接符。but，其效率之低下啊。其原因通过上面分析你应该也略知一二了，没错Python中的字符串对象是一个不可变的对象，这就意味着进行字符串连接时，必须要创建一个新的PyStringObject对象，连接多少个对象则需要多少次的内存分配和搬运的操作，无疑增加了大量的开销。我们来看看底层的源码是如何实现的

stringobject.c
static PyObject* string_concat(register PyStringObject *a, register PyObject *bb){
    register unsigned int size;
    register PyStringObject * op;
    #define b ((PyStringObject *)bb)
    // ....
    //计算连接后的长度
    size = a->ob_size + b->ob_size;
    // 创建新的PyStringObject对象
    op = (PyStringObject *)PyObject_MALLOC(sizeof(PyStringObject)+size);
    PyObject_INIT_VAR(op, &PyString_Type, size);
    op->ob_shash = -1;
    op->ob_sstate = SSTATE_NOT_INTERNED;
    //将a和b中的字符拷贝到新创建的PyStringObject中
    memcpy(op->ob_sval, a->ob_sval, (int)a->ob_size);
    memcpy(op->ob_sval + a->ob_size, a->ob_sval, (int)a->ob_size);
    op->ob_sval[size] = '\0';
    return (PyObject *) op;
    #undef b
}

实际上 ’+‘ 连接符是通过string_concat函数调用来实现的，在对n个对象进行连接时，每进行一次 ’+‘ 连接都会调用一次此函数，并且进行一次内存申请动作。并将原来两个字符串对象中所维护的字符数组中的实际字符串拷贝到新创建的对象中，并在末尾添加 ’\0‘ 结束字符。可以看到效率是非常低下的

在此建议将需要连接的字符串放入一个tuple或list中，使用join来完成拼接，这种做法只需要分配一次内存，所以效率非常高，特别是需要大量字符串连接的时候。此招非常有用，至于它的实现原理，大家可以去看看源码，里面有详细的实现，这里就不展开了。

2、Python3中的PyUnicodeObject

在Python3中情况开始变得有点不同了，在Python内部使用了Unicode编码，而表示一个字符串对象的时候被定义为一个PyUnicodeObject

typedef struct {
    PyCompactUnicodeObject _base;
    union {
        void *any;
        Py_UCS1 *latin1;
        Py_UCS2 *ucs2;
        Py_UCS4 *ucs4;
    } data;                     /* Canonical, smallest-form Unicode buffer */
} PyUnicodeObject;

typedef struct {
    PyASCIIObject _base;
    Py_ssize_t utf8_length;     /* Number of bytes in utf8, excluding the
                                 * terminating \0. */
    char *utf8;                 /* UTF-8 representation (null-terminated) */
    Py_ssize_t wstr_length;     /* Number of code points in wstr, possible
                                 * surrogates count as two code points. */
} PyCompactUnicodeObject;

typedef struct {
    PyObject_HEAD
    Py_ssize_t length;          /* Number of code points in the string */
    Py_hash_t hash;             /* Hash value; -1 if not set */
    struct {
        unsigned int compact:1;
        unsigned int ascii:1;
        unsigned int ready:1;
        unsigned int :24;
    } state;
    wchar_t *wstr;              /* wchar_t representation (null-terminated) */
} PyASCIIObject;

可以看到PyUnicodeObject的实现是非常复杂的，这也是我为什么先讲述Python2的实现原因，因为Python3中虽然内部使用了Unicode，但是在一些核心的处理上还是依然大致采用了Python2中的方式。我们可以看到在内部，依然是由一个指针来维护一段内存，这段内存里维护了真正存储的字符串，而字符串的长度不再由ob_size这个变量来维护而是通过一个wstr_length变量。在字符串内部同样也有和Python2中缓存字符串哈希值，Intern标志等变量，因此即使是一个空串，也要占一定的空间的原因。为了减少内存消耗，Python使用了三种方式表示Unicode：如果每个字符1个字节就用Latin-1编码；如果每个字符2个字节就用USC-2编码；如果每个字符4个字节据用USC-4编码。由此可知，当字符串中所有的字符都在ASCII的范围内的话，就会使用Latin-1来编码，对于大部分字符都可以使用USC-2来编码，但对于表情符号或者生僻字符就不得不使用4个字节的USC-4来编码。可以试想如下代码

# -*- coding:utf-8 -*-
# @Author: LessenPaul
# @Date: 2020/05/19
import sys
str1 = 'hello'
str2 = '你'
# 5
print(sys.getsizeof(str1) - sys.getsizeof(''))
# 10
print(sys.getsizeof(str1+str2) - sys.getsizeof(str2))

可以看到对于str1用一个字节就可以存储，因此它只占用5个字节，对于str2一个字节是没办法存储的，一旦str1和str2结合，就会采用2个字节来存储，就比原来多出5个字节。对于对象的创建和维护和Python2中大致类似但也有不同，有兴趣的可以自行去看源码，这里我就不讲述了。

Python 装饰器使用详解
文章目录0.引言1.什么是装饰器？2.装饰器的基本语法3.装饰器的工作原理4.常见装饰器应用场景4.1.日志记录4.2.权限校验4.3.缓存5.多重装饰器的执行顺序6.装饰器的高级用法6.1.带参数的装饰器6.2.使用`functools.wraps`6.3.类装饰器7.图示说明7.1.单一装饰器的执行流程2.多重装饰器的执行流程3.带参数装饰器的执行流程总结8参考资料0.引言Python装饰器(
豆包教你如何用Python向女生表白 51reboot
一年一度的考试大会又拉开了帷幕其中的一个重头戏就是python了不知道正处于手机前的你为python又掉了多少头发呢but！！！python绝不只是你脱发的工具善于使用你将收获多多比如你知道如何利用python向女生表白吗如果不知道少年，你可要当心啦考试很危险的呢后记：某年月日，某许愿池推文：震惊！某旦python考试题新鲜出炉，考题震惊十几亿中国人！原因竟是。。。待豆包点开推文：一看考试题，嘿哈
python ffmpeg pipe_如何使用python从ffmpeg输出管道？ weixin_39611725 python ffmpeg pipe
我正在尝试将FFmpeg的输出用管道输送到Python中。我正在从一个视频采集卡读取图像，我成功地使用dshow从命令行将其读入输出文件。我正在尝试从卡抓取图像到我的OpenCv代码，以便能够进一步处理数据。不幸的是，当我通过管道输出图像时，我只得到视频的显示，如链接所示：link:s000.tinyupload.com/?file_id=15940665795196022618.我使用的代码如下
python ffmpeg pipe,管道的ffmpeg的输入和输出在python 呼呼啦啦就瘸了 python ffmpeg pipe
I'musingffmpegtocreateavideo,fromalistofbase64encodedimagesthatIpipeintoffmpeg.Outputtingtoafile(usingtheattachedcodebelow)worksperfectly,butwhatIwouldliketoachieveistogettheoutputtoaPythonvariableins
Linux+Python实战课堂：笔记、练习与应用
本文还有配套的精品资源，点击获取简介：本压缩包提供全面的Linux学习资源和Python编程练习，旨在帮助初学者和IT从业者深入理解Linux系统及其技能，并通过Python编程练习巩固相关技能。涵盖Linux基础概念、文件系统、命令行操作、文本编辑器使用、用户和组管理、软件管理、进程监控、网络配置以及系统性能监控等多个方面。同时，包含Python基础语法、函数与模块、面向对象编程、文件操作、异常
Python脚本批量修复文件时间戳，根据文件名或拍摄日期 3D_DLW 储存服务器 python 图片整理修改时间批处理脚本拍摄时间
实现以下功能更正文件的修改时间批量修改指定文件夹中的特定后缀的文件根据文件名中的日期修改（优先）根据jpg文件属性中的拍摄日期修改根据mp4文件属性中的创建媒体日期修改模拟运行（DryRun）模式依赖若需要基于jpg文件属性中的拍摄日期修改，需要python的piexif包pipinstallpiexif若需要基于mp4文件属性中的创建媒体日期修改，需要ffmpegsudoaptinstallff
深入Python闭包内存泄漏：从原理到实战修复指南清水白石008 Python题库 python python 开发语言
深入Python闭包内存泄漏：从原理到实战修复指南引言：闭包与内存管理的双重挑战在Python编程中，闭包（Closure）作为函数式编程的重要特性，被广泛应用于装饰器、回调函数等场景。然而，当闭包与类实例结合使用时，若处理不当极易引发内存泄漏问题。本文将通过一个典型案例，深入剖析闭包导致内存泄漏的机理，并演示从检测到修复的完整流程，最终提炼出防御性编程的最佳实践。一、内存泄漏闭包案例实录1.1典
Python装饰器与闭包：实战应用与深入理解
背景简介本章深入探讨了Python装饰器与闭包的核心概念，展示了它们在实际编程中的灵活应用和强大功能。装饰器的魔力：保持元数据与链式应用在Python中，装饰器是一种修改或增强函数行为的强大工具，它能够让我们在不改变原始函数代码的情况下，为其添加新功能。保持函数的元数据是装饰器的一个重要特性，它确保了装饰后的函数保持其身份和文档字符串信息。这对于代码的可读性和维护性至关重要。当需要将多个装饰器应用
python闭包的应用场景_简单谈谈Python中的闭包 weixin_39587113 python闭包的应用场景
Python中的闭包前几天又有人留言，关于其中一个闭包和re.sub的使用不太清楚。我在脚本之家搜索了下，发现没有写过闭包相关的东西，所以决定总结一下，完善Python的内容。1.闭包的概念首先还得从基本概念说起，什么是闭包呢？来看下维基上的解释:在计算机科学中，闭包(Closure)是词法闭包(LexicalClosure)的简称，是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在
网络爬虫——python爬取豆瓣评论 SSeaflower 爬虫 python 开发语言
网络爬虫——python爬取豆瓣评论一、网络爬虫概述1.1网络爬虫定义网络爬虫，又被称为网络蜘蛛（WebSpider）、网络机器人等。它根据网页地址（URL）爬取网页内容，网页地址（URL）就是我们在浏览器中输入的网站链接。例如：https://www.baidu.com；https://movie.douban.com/。网络爬虫不仅能够复制网页信息和下载音视频，还可以做到网站的模拟登录和行为链
Python 中的深拷贝、浅拷贝与等号赋值：理解对象复制的本质小羊苏八 python 开发语言
目录1.等号赋值（=）2.浅拷贝（copy.copy()）3.深拷贝（copy.deepcopy()）4.不可变对象与可变对象5.性能对比6.实际应用场景7.总结前言在Python中，对象的复制是一个常见的操作，但很多人对深拷贝、浅拷贝和等号赋值之间的区别感到困惑。本文将通过详细的示例和解释，帮助你深入理解这三种操作的本质和应用场景。1.等号赋值（=）在Python中，等号赋值是最基本的对象操作之
Python中的分支结构小羊苏八 #python python 开发语言
文章目录前言一、Python分支结构概述二、if语句详解三、if-else语句详解四、if-elif-else语句详解五、嵌套分支结构六、分支结构的注意事项七、实际应用场景八、总结前言在Python编程的世界里，分支结构如同现实中的道路岔口，根据不同的条件引导程序流向不同的执行路径。它是构建复杂逻辑、实现智能决策的关键所在。本文将带你全面了解Python的分支结构，从基础语法到实际应用，让你轻松掌
标题 “Python 网络爬虫 —— selenium库驱动浏览器 WeiJingYu. python 爬虫 selenium
一、Selenium库核心认知Selenium库是Web应用程序测试与自动化操作的利器，能驱动浏览器（如Edge、Firefox等）执行点击、输入、打开、验证等操作。与Requests库差异显著：Requests库仅能获取网页原始代码，而Selenium基于浏览器驱动程序工作，浏览器可渲染网页源代码，借此能轻松拿到渲染后的数据信息（如JS动态加载内容），完美解决Requests库无法处理的动态页面
Python网络爬虫实现selenium对百度识图二次开发以及批量保存Excel WeiJingYu. python 爬虫 selenium
一.百度识图自动上传图片fromseleniumimportwebdriverfromselenium.webdriver.edge.optionsimportOptionsfromselenium.webdriver.common.byimportByedge_options=Options()edge_options.binary_location=r"C:\ProgramFiles(x86)
Python关于操作文件夹的讲解——Python 操作文件和文件夹 WeiJingYu. python 开发语言
借助os库，可完成文件大小查询、文件/文件夹删除、重命名等操作，满足多样化文件管理需求。（一）查询文件大小os库path模块的getsize(path)方法，能获取指定路径文件占用内存大小，单位为字节。字节是计算机存储基本单位，常见存储单位换算关系如下：单位换算关系说明字节（Byte）1字节=8位（bit）存储基本单元千字节（KB）1KB=1024Byte日常文件大小常用表述兆字节（MB）1MB=
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统 2401_89605681 嗖微miui52086 java 小程序开发语言微信小程序 uni-app
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统源码_V_saaskw 嗖微miui52086 java 小程序开发语言 uni-app 微信小程序微信公众平台
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统狂团商城小师妹嗖微miui52086 java 小程序开发语言微信小程序 javascript
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA无人系统台球室源码自助开台约球交友系统源码小程序
全域无人化运营革命：JAVA无人系统台球室源码解析（支持茶室/棋牌/KTV多业态）在共享经济与无人化浪潮的推动下，全球自助娱乐市场规模突破千亿美元，传统台球室、棋牌室面临人力成本高、运营效率低、用户粘性弱等痛点。JAVA无人系统台球室源码以SpringBoot+MyBatisPlus+MySQL为核心技术栈，通过Uni-app跨端开发实现小程序/H5/APP全渠道覆盖，集成AI裁判、社交裂变、多支
Python 网络爬虫 —— 代理服务器 WeiJingYu. 爬虫服务器前端
一、会话（Session）（一）核心逻辑HTTP本身无记忆，每次请求独立。会话（Session）就是为解决这问题，让客户端（浏览器）和服务器“记住”交互状态（比如登录态），常用Cookie实现：服务器发Cookie给客户端存着，下次请求带着，服务器就知道“是同一用户”。（二）创建会话（requests实现）用requests库的Session类，自动维持会话、管理Cookie，代码形式：impor
Python 中的闭包：原理、应用与实践小羊苏八 python 开发语言
目录前言1.什么是闭包？2.闭包的基本结构3.闭包的应用场景4.闭包的高级特性5.闭包的性能与内存管理6.闭包的实践案例7.总结前言在Python编程中，闭包是一个非常强大且灵活的特性。闭包允许嵌套函数访问外部函数的变量，即使外部函数已经返回。这种特性使得闭包在函数式编程、装饰器、回调函数等场景中非常有用。本文将通过详细的示例和解释，深入探讨Python中的闭包。1.什么是闭包？闭包（Closur
python-第五课-绘线段、正方形布口袋_天晴了
1.绘制第一个海龟图形A.课程内容：通过绘制线段和正方形来学习导入海归模块、创建画笔、移动和旋转画笔。通过绘制图形来学习python编程的基本方法。B.知识点(1)导入海龟绘图模块(2)创建画笔(3)向前移动(4)画笔旋转C.用到的基本指令(1)import(2)turtle.Pen()(3)forward()(4)right()海龟绘图(turle)是python内置的一个比较有趣味的模块。使用
python爬虫技术——基础知识、实战南瓜AI python 爬虫 scrapy
参考文献：Python爬虫入门(一)（适合初学者）-CSDN博客一、常用爬虫工具包Scrapy语言:Python特点:高效、灵活的爬虫框架，适合大型爬虫项目。BeautifulSoup语言:Python特点:用于解析HTML和XML，简单易用。Selenium语言:Python/Java/C#特点:支持浏览器自动化，适合处理JavaScript渲染的网页。Requests语言:Python特点:简
分享两个爬虫练习网站高质量海王哦爬虫爬虫 python
Python爬虫案例|ScrapeCenterSpiderbuf|Python爬虫练习靶场
Python之print打印追捕的风 Python之数据处理 python 开发语言爬虫
python是一门脚本语言，少不了使用各种print打印调试，本文总结一下pythonprint打印的几种方法。1单独打印变量1.1只打印变量：方法：print(variable)示例：name="Mike"age=21print(name)print(age)输出：Mike211.2带其他信息：示例：name="Mike"age=21print('mynameis',name)print('my
python3——print使用 weixin_30404405
print的初步认识：对于科班出身的或有相关经验的人来说，学习python是相当有趣的事,因为可以做日常任务，比如自动备份你的MP3；可以做网站，如YouTube就是Python写的；可以做网络游戏的后台，很多在线游戏的后台都是Python开发的；可以爬数据，得到你想要的内容。总之就是能干很多很多事啦。而对于非科班的我来说，学习python是非常辛苦的，从一行行print打印,到一个个关键字，从思
DAY2——Python 基础变量类型之字符串和数字类型 .venn PYTHON学习 python 开发语言算法
字符串类型（str）字符串是Python中最常用的数据类型之一，用于表示文本信息。字符串可以用单引号（''）、双引号（""）或三引号（''''''或""""""）定义。三引号通常用于多行字符串。字符串是不可变序列，支持索引和切片操作。以下是一些常见操作：#定义字符串s1='hello's2="world"s3='''Thisisamulti-linestring'''#字符串拼接combined=
DAY4——Python 推导式及常见语句和内置函数个人总结
Python推导式Python推导式是一种简洁的语法结构，用于快速生成列表、字典、集合或生成器。推导式通常比传统的循环更高效且更易读。常见的推导式包括列表推导式、字典推导式、集合推导式和生成器推导式。列表推导式语法：[expressionforiteminiterableifcondition]示例：#生成平方数列表squares=[x**2forxinrange(10)]print(square
对象的本质：OOP编程核心揭秘止观止计算机科学 OOP 面对对象编程
引言面向对象编程（OOP）革命性地重塑了软件开发，其核心在于“对象”——一种模拟现实实体的计算模型。对象不仅是数据容器，更是封装了状态和行为的自治单元，使程序从指令序列转变为交互网络。通过本解析，我们将层层递进，揭示对象在OOP中的根本角色：从定义延伸到设计实践，帮助读者跨越语言差异（如Java、Python或C++），掌握这一范式的精髓。章节构建遵循技术演进：先解剖对象本质，再关联OOP支柱，最
python怎么打印 _python大神_ python python
python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？python怎么打印？py
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

Python中源码之字符串底层解析

文章目录

1、Python2中的PystringObject

1.2 PyStringObject的创建

1.3 intern机制

1.4 字符串缓冲池

1.5 PyStringObject的某些操作效率

2、Python3中的PyUnicodeObject

你可能感兴趣的:(Python源码解析)