在Python中存储字符串

unicode 的三种编码

从Python3开始，字符串使用的是Unicode。而根据编码的不同，Unicode的每个字符最大可以占到4字节，从内存的角度来说，这种编码有时会比较昂贵。

为了减少内存消耗并且提高性能，Python的内部使用了三种编码方式来表示Unicode：

Latin-1 编码：每个字符一字节;
UCS2 编码：每个字符两字节；
UCS4 编码：每个字符四字节；

在Python编程中，所有字符串的行为都是一致的，而且大多数时间我们都没有注意到差异。然而在处理大文本的时候，这种差异就会变得异常显著、甚至有些让人出乎意料。

为了看到内部表示的差异，我们使用sys.getsizeof函数，查看一个对象所占的字节数。

import sys
print(sys.getsizeof("a"))  # 50
print(sys.getsizeof("憨"))  # 76
print(sys.getsizeof(""))  # 80

我们看到都是一个字符，但是它们占用的内存却是不一样的。因为Python面对不同的字符会采用不同的编码，进而导致大小不同。

但需要注意的是：Python的每一个字符串都需要额外占用49-80字节，因为要存储一些额外的信息，比如：公共的头部、哈希、长度、字节长度、编码类型等等。

import sys
# 对于ASCII字符，一个占1字节，显然此时编码是Latin-1编码
print(sys.getsizeof("ab") - sys.getsizeof("a"))  # 1
# 对于汉字，日文等等，一个占用2字节，此时是UCS2编码
print(sys.getsizeof("憨憨") - sys.getsizeof("憨"))  # 2
print(sys.getsizeof("です") - sys.getsizeof("で"))  # 2
# 像emoji，则是一个占4字节 ，此时是UCS4编码
print(sys.getsizeof("") - sys.getsizeof(""))  # 4

而采用不同的编码，那么底层结构体实例的额外部分也会占用不同大小的内存。
如果编码是Latin-1，那么这个结构体实例额外的部分会占49个字节；编码是UCS2，占74个字节；编码是UCS4，占76个字节。然后字符串所占的字节数就等于：额外的部分 + 字符个数 * 单个字符所占的字节。

import sys
# 所以一个空字符串占用49个字节
# 此时会采用占用内存最小的Latin-1编码
print(sys.getsizeof(""))  # 49
# 此时使用UCS2
print(sys.getsizeof("憨") - 2)  # 74
# UCS4
print(sys.getsizeof("") - 4)  # 76

为什么不使用utf-8编码

上面提到的三种编码，是Python在底层所使用的，但我们知道unicode还有一个utf-8编码，那Python为啥不用呢？

先来抛出一个问题：首先我们知道Python支持通过索引查找一个字符串指定位置的字符，而且Python默认是以字符为单位的，不是字节(我们后面还会提)，比如s[2]搜索的就是字符串s中的第3个字符。

s = "古明地觉"
print(s[2]) # 地

那么问题来了，我们知道通过索引查找字符串的某个字符，时间复杂度为O(1)，那么Python是怎么通过索引瞬间定位到指定字符的呢？

显然是通过指针的偏移，用索引乘上每个字符占的字节数，得到偏移量，然后从头部向后偏移指定数量的字节即可，这样就能在定位到指定字符的同时还保证时间复杂度为O(1)。

但是这需要一个前提：字符串中每个字符所占的大小必须是相同的，如果字符占的大小不同，比如有的占1字节、有的占3字节，显然就无法通过指针偏移的方式了。这个时候若还想准确定位的话，只能按顺序对所有字符都逐个扫描，但这样的话时间复杂度肯定不是O(1)，而是O(n)

我们以Go为例，Go的字符串默认就是使用的utf-8编码：

package main
import (
    "fmt"
)
func main() {
    s := "古明地觉"
    fmt.Println(s[2])  // 164
    fmt.Println(string(s[2]))  // ¤
}

惊了，我们看到打印的并不是我们希望的结果。因为Go底层使用的是utf-8编码，不同的字符可能会占用不同的字节。但是Go通过索引定位的时候，时间复杂度也是O(1)，所以定位的时候是以字节为单位、而不是字符。在获取的时候也只会获取一个字节，而不是一个字符。

所以s[2]在Go里面指的是第3个字节，而不是第3个字符，而汉字在utf-8编码下占3个字节，所以s[2]指的就是汉字古的第三个字节。我们看到打印的时候，该字节存的值为164。

s = "古明地觉"
print(s.encode("utf-8")[2])  # 164

这就是采用utf-8编码带来的弊端，它无法让我们以O(1)的时间复杂度去准确地定位字符，尽管它在存储的时候更加的省内存。

Latin-1、UCS2、UCS4该使用哪一种？

我们说Python会使用3种编码来表示unicode，所占字节大小分别是1、2、4字节。

因此Python在创建字符串的时候，会先扫描，尝试使用占字节数最少的Latin-1编码存储，但是范围肯定有限。如果发现了存储不下的字符，只能改变编码，使用UCS2，继续扫描。但是又发现了新的字符，这个字符UCS2也无法存储，因为两个字节最多存储65535个不同的字符，所以会再次改变编码，使用UCS4。UCS4占四个字节，肯定能存下了。

一旦改变编码，字符串中的所有字符都会使用同样的编码，因为它们不具备可变长功能。比如这个字符串："hello古明地觉"，肯定都会使用UCS2，不存在说hello使用Latin1，古明地觉使用UCS2，因为一个字符串只能有一个编码。

当通过索引获取的时候，会将索引乘上每个字符占的字节数，这样就能跳到准确位置上，因为字符串里面的所有字符占用的字节都是一样的，然后获取的时候也会获取指定的字节数。比如：使用UCS2编码，那么定位到某个字符的时候，会取两个字节，这样才能表示一个完整的字符。

import sys 
# 此时全部是ascii字符，那么Latin-1编码可以存储
# 所以结构体实例额外的部分占49个字节
s1 = "hello"
# 有5个字符，一个字符一个字节，所以加一起是54个字节
print(sys.getsizeof(s1))  # 54
# 出现了汉字，那么Latin-1肯定存不下，于是使用UCS2
# 所以此时结构体实例额外的部分占74个字节
# 但是别忘了此时的英文字符也是ucs2，所以也是一个字符两字节
s2 = "hello憨"
# 6个字符，74 + 6 * 2 = 86
print(sys.getsizeof(s2))  # 86
# 这个牛逼了，ucs2也存不下，只能ucs4存储了
# 所以结构体实例额外的部分占76个字节
s3 = "hello憨"
# 此时所有字符一个占4字节，7个字符
# 76 + 7 * 4 = 104
print(sys.getsizeof(s3))  # 104

除此之外，我们再举一个例子更形象地证明这个现象。

import sys
s1 = "a" * 1000
s2 = "a" * 1000 + ""
# 我们看到s2只比s1多了一个字符
# 但是两者占的内存，s2却将近是s1的四倍。
print(sys.getsizeof(s1), sys.getsizeof(s2))  # 1049 4080

我们知道s2和s1的差别只是s2比s1多了一个字符，但就是这么一个字符导致s2比s1多占了3031个字节。然而这3031个字节不可能是多出来的字符所占的大小，什么字符一个会占到三千多个字节，这是不可能的。

尽管如此，但它也是罪魁祸首，不过前面的1000个字符也是共犯。我们说Python会根据字符串选择不同的编码，s1全部是ascii字符，所以Latin1能存下，因此一个字符只占一个字节。所以大小就是49 + 1000 = 1049。

但是对于s2，Python发现前1000个字符Latin1能存下，不幸的是最后一个字符存不下，于是只能使用UCS4。而字符串的所有字符只能有一个编码，为了保证索引查找的时间复杂度为O(1)，前面一个字节就能存下的字符，也需要用4字节来存储。这是Python的设计策略。

而我们说使用UCS4，结构体额外的部分会占76个字节，因此s2的大小就是：76 + 1001 * 4 = 4080

print(sys.getsizeof("爷的青春回来了"))  # 88
print(sys.getsizeof("的青春回来了"))  # 104

字符数量相同但是占用内存大小不同，相信原因你肯定能分析出来。

所以如果字符串中的所有字符都是ASCII字符，则使用1字节Latin1对其进行编码。基本上，Latin1能表示前256个Unicode字符，它支持多种拉丁语，如英语、瑞典语、意大利语、挪威语。但是它们不能存储非拉丁语言，比如汉语、日语、希伯来语、西里尔语。这是因为它们的代码点(数字索引)定义在1字节(0-255)范围之外。

大多数流行的自然语言都可以采用2字节(UCS2)编码，但当字符串包含特殊符号、emoji或稀有语言时，则使用4字节(UCS4)编码。Unicode标准有将近300个块(范围)，你可以在0XFFFF块之后找到4字节块。

假设我们有一个10G的ASCII文本，我们想把它加载到内存中，但如果我们在文本中插入一个表情符号，那么字符串的大小将增加4倍。这是一个巨大的差异，你可能会在实践当中遇到，比如处理NLP问题。

print(ord("a"))  # 97
print(ord("憨"))  # 25000
print(ord(""))  # 128187

所以最著名和最流行的Unicode编码都是utf-8，但是Python不在内部使用它，而是使用Latin1、UCS2、UCS4。至于原因我们上面已经解释的很清楚了，主要是Python的索引是基于字符，而不是字节。

当一个字符串使用utf-8编码存储时，每个字符会根据自身选择一个合适的大小。这是一种存储效率很高的编码，但是它有一个明显的缺点。由于每个字符的字节长度可能不同，就导致无法按照索引瞬间定位到单个字符，即便能定位，也无法定位准确。如果想准，那么只能逐个扫描所有字符。

假设要对使用utf-8编码的字符串执行一个简单的操作，比如s[5]，就意味着Python需要扫描每一个字符，直到找到需要的字符，这样效率是很低的。

但如果是固定长度的编码就没有这样的问题，所以当Latin 1存储的hello，在和UCS2存储的古明地觉组合之后，整体每一个字符都会向大的方向扩展、变成了2字节。

这样定位字符的时候，只需要将索引 * 2便可计算出偏移的字节数、然后跳转该字节数即可。但如果原来的hello还是一个字节、而汉字是2字节，那么只通过索引是不可能定位到准确字符的，因为不同类型字符的大小不同，必须要扫描整个字符串才可以。但是扫描字符串，效率又比较低，所以Python内部才会使用这个方法，而不是使用utf-8。

所以对于Go来讲，如果想像Python一样，那么需要这么做：

package main
import (
    "fmt"
)

func main() {
    s := "hello古明地觉"
    //我们看到长度为17, 因为它使用utf-8编码
    fmt.Println(s, len(s)) // hello古明地觉 17

    //如果想像Python一样
    //那么Go提供了一个rune，相当于int32
    //此时每个字符均使用4个字节，所以长度变成了9
    r := []rune(s)
    fmt.Println(string(r), len(r)) // hello古明地觉 9
    //虽然打印的内容是一样的，但是此时每个字符都使用4字节存储

    //此时跳转会和Python一样偏移 5 * 4 个字节
    //然后获取也会获取4个字节，因为一个字符占4个字节
    fmt.Println(string(r[5])) //古
}

所以utf-8编码的unicode字符串里面的字符可能占用不同的字节，显然没办法实现当前Python字符串的索引查找效果，因此Python没有使用utf-8编码。

Python的做法是让字符串的所有字符都占用相同的字节，先使用占用内存最小的Latin1，不行的话再使用UCS2、UCS4，总之会确保每个字符占用的字节是一样的。至于原因的话我们上面分析的很透彻了，因为无论是索引还是切片、还是计算长度等等，都是基于字符来的，显然这也符合人类的思维习惯。

小结

Python字符串的存储策略，它并没有使用最为流行的utf-8，归根结底就在于这种编码不适合Python的字符串。当然，我们在将字符串转成字节序列的时候，一般使用的都是utf-8编码。

到此这篇关于在Python中存储字符串的文章就介绍到这了,更多相关Python存储字符串内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

数组刃神太酷啦蓝桥杯C++组
数组栈区的空间很有限，静态区的空间大些，一般在静态区去申请较大的空间考虑特例能不能归并到一起也很重要在二维数组中，基于范围的for循环直接遍历的是行，而不是单个元素对于一个intarr[3][4]的二维数组，memset会首先填充arr[0][0]到arr[0][3]如果将数组定义为全局变量，其元素会被默认初始化为0小数四舍五入成整数的方法假设a是四舍五入之后的，b是四舍五入之前的有a=(int)
【docker了解】如何将x86镜像转换为适用于Jetson的ARM镜像 Eternal-Student Docker docker arm开发容器
将x86架构的Docker镜像转换为适用于ARM架构的Jetson设备的镜像是一个复杂的过程，因为这两种架构的指令集完全不同。不过，有一些方法可以尝试实现这一转换。使用QEMU进行仿真在x86机器上，你可以使用QEMU来模拟ARM环境，从而运行ARM镜像。但是，这种方法主要用于测试和开发，而不是生产环境。以下是基本步骤：安装QEMU：在x86机器上安装QEMU，它是一个开源的机器模拟器和虚拟化器。
Java多线程与高并发专题——JMM 黄雪超大数据面试 java 开发语言 JMM
引入上一篇我们讲到在并发场景中，存在结果问题和性能问题，其中结果问题主要是因为没有保障可见性、原子性、有序性等导致的。这三者在编程领域属于共性问题，所有的编程语言都会遇到，Java在诞生之初就支持多线程，所以肯定有保障它们的技术方案。理解Java解决并发问题的方案，对于了解其他语言的解决方案有触类旁通的效果。在Java中，对应的解决方案就是JMM（Java内存模型）。什么是JMM？为了更准确的理解
AHK的相似取色睡不醒的小泽 #AHK 自动化 Autohotkey
简介PixelGetColor通常用于在特定像素处获取单一颜色值，这对于大多数应用程序来说是足够的。然而，一些带有反作弊机制的软件，例如《英雄联盟》的外服版本，会对图像进行模糊处理（Fuzz处理）。在这种情况下，我们需要采用一种能够识别颜色相似性的取色方法，以确保逻辑的正确执行。绝对取色先给出绝对取色的代码：;取色组GetColor(x,y){PixelGetColor,color,x,y,RGB
如何优化Python开发：PIP和Anaconda的作用及国内源设置指南 Chaiio Dain python python pip 开发语言 conda
前言在现代数据科学和软件开发的世界中，Python已经成为了最受欢迎的编程语言之一。其强大的生态系统和丰富的第三方库使得开发者可以快速构建各种应用程序和解决方案。然而，随着项目规模的扩大和复杂性的增加，管理Python包和依赖项变得尤为重要。PIP（Python包管理工具）和Anaconda（一个开源的Python发行版）就是在这种背景下应运而生的重要工具。PIP和Anaconda不仅简化了包的安
细节增强注意力模型DEAB详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能神经网络 python 计算机视觉机器学习 conda
基本原理DEAB模型的基本原理是通过细节增强卷积（DEConv）和内容引导注意力（CGA）机制的协同工作来实现细节增强注意力功能。这种设计使得模型能够在处理图像时更好地保留细节信息，同时关注图像中的重要内容。DEAB模型的核心组件包括：细节增强卷积（DEConv）：DEConv是一种创新的卷积层设计，通过并行部署普通卷积和差分卷积来增强特征提取能力。差分卷积包括中心差分卷积（CDC）、角差分卷积（
自动驾驶面临的挑战与应对策略自动驾驶
尽管自动驾驶技术取得了显著的进展，但在实现全面商业化和广泛应用之前，仍面临着诸多挑战。这些挑战不仅涉及技术层面，还包括法规、社会接受度等多个方面。技术挑战是自动驾驶面临的首要问题。虽然目前的传感器和算法能够在大多数情况下实现车辆的自动驾驶，但在一些复杂的交通场景下，如恶劣天气、道路施工、突发事件等，自动驾驶系统的性能仍然受到很大的限制。例如，在暴雨、大雪等恶劣天气条件下，传感器的精度和可靠性会下降
ubuntu server连接wifi教程 HermanYe996 Ubuntu linux ubuntu linux 运维
ConfigUbuntuServerconfig_ubuntu_server脚本允许在RaspberryPi系统上快速轻松地配置Ubuntu服务器。它包括root权限设置和SSH配置，无需手动获取IP。使用“config_ubuntu_server”项目在您的RaspberryPi系统上配置Ubuntu服务器的麻烦。这个方便的工具通过一步配置简化了过程，包括root权限设置和SSH配置，无需手动获
配置pip安装源勤劳的搬砖工。 pip python linux
在Linux下配置pip的安装源折磨人的下载速度用过pip的人都知道，pip的下载速度简直令人窒息，有时候好有时候坏，简直全靠运气，甚至施加魔法也不行，所以选择配置一个下载源，从国内下载python包就显得很快，说实话百度网盘都比pip快。Linux下配置python2的安装源总所周知，python2和python3不一样，所以他们pip也不一样，配置也不一样修改工作目录下的.pip/pip.co
华为云云原生王者之路集训营（黄金-第五章) ※网络笨猪※ 云厂商-公有云华为云云原生
华为云云原生王者之路集训营（黄金-第五章)1.11.1Kubernetes工作负载(Workload)介绍工作负载是在Kubernetes上运行的应用程序。无论你的负载是单一组件还是由多个一同工作的组件构成，在Kubernetes中你可以在一组Pods中运行它。在Kubernetes中，Pod代表的是集群上处于运行状态的一组容器。四种负载：无状态工作负载：管理的Pod集合是相互等价的，需要的时候可
nvm--npm ERR! Unexpected token '.' node.js
背景在windows电脑上安装了nvm后，通过nvm安装了两个版本的node.js。大部分项目用的是v14版本，而另一个项目用的是v16版本。当切换到v16版本的node.js后，然后想通过npm安装pnpm，结果报错了。npmERR!Unexpectedtoken'.'解决过程在大部分项目下，也就是node.js的版本是v14的时候，npm安装是没问题的。为啥切换到v16版本后，npm安装就报错
Ubuntu Server 连接WiFi RyanKONG wifi ubuntu
文章目录前言配置参考链接:前言最近又在把树莓派3B拿出来玩折腾，原本的PiOS不原生支持64x系统，而CentOS就不说了，目前是安装的UbuntuServer。PiOS是基于Debian系统，配置WiFi就直接在wpa_supplican进行配置即可。UbuntuServer舍弃了wpa_supplican做为网络配置工具，常规配置方法在wpa_supplicant是找不到配置文件的，取而代之的
Nginx部署前端Vue项目的深度解析 egekm_sefg 前端 vue.js nginx
目录一、准备工作1.1开发环境1.2服务器环境1.3Nginx安装二、构建Vue项目三、上传静态文件到服务器四、配置Nginx五、测试并重新加载Nginx六、访问Vue应用七、高级配置7.1启用HTTPS7.2启用Gzip压缩7.3缓存控制八、常见问题与解决方案8.1404错误8.2权限问题8.3跨域问题九、总结在现代Web开发中，Vue.js因其组件化、响应式数据绑定和易于上手的特点，成为了前端
mysql 设置某一字段的默认值 egekm_sefg mysql 数据库
情景：为表的字段设置默认值，以确保在插入新记录时，如果没有为该字段指定值，将使用默认值。一：创建表时设置默认值创建表时，使用DEFAULT关键字为字段设置默认值：比如下表，年龄没有数据插入时，默认18CREATETABLEmy_table(idINTPRIMARYKEY,nameVARCHAR(50)NOTNULL,ageINTDEFAULT18);二：使用ALTERTABLE语句修改默认值表已经
【例51.3】平移数据 c++初学者ABC C++c++数组
题目描述将a数组中第一个元素移到数组末尾,其余数据依次往前平移一个位置。输入第一行为数组a的元素个数；第二行为n个小于1000的正整数。输出平移后的数组元素，每个数用一个空格隔开。样例输入复制1012345678910样例输出复制23456789101思路：无代码：#includeusingnamespacestd;intmain(){intn;cin>>n;intx[n+1];for(inti=
模拟法练习C++ 1 c++初学者ABC C++c++开发语言算法
有错请指出！对于模拟法，百度定义是其实，没有这么麻烦，也就是题目是什么，我们就怎么写，也可以说它是不是算法的算法，最好把代码模块化特点：1.题目简单，代码量很大2.不好找错误3.在比赛中经常考4.代码灵活下面是几道例题1.扑克游戏题目描述三张扑克牌比大小，每个人从扑克牌中抽取三张牌，然后进行比较，规则如下：点数规则：A为最小，K为最大。A记为1点，JQK分别记为11点、12点、13点。比较规则：最
FastAPI介绍 -zZR fastapi python
1.fastapi介绍一个用于构建API的现代、快速（高性能）的web框架。特点快速：可与NodeJS和Go并肩的极高性能（归功于Starlette和Pydantic）。最快的Pythonweb框架之一。高效编码：提高功能开发速度约200％至300％。更少bug：减少约40％的人为（开发者）导致错误。智能：极佳的编辑器支持。处处皆可自动补全，减少调试时间。简单：设计的易于使用和学习，阅读文档的时
EXCEL&WPS工作表批量重命名（按照sheet1中A列内容）歌颂平凡 excel wps
将工作表名称批量重命名（按照sheet1中A列内容）打开WPSOffice的Excel文件。按Alt+F11打开VBA编辑器。在VBA编辑器中，插入一个新模块：点击插入->模块。将以下代码粘贴到模块中：运行→运行宏SubRenameSheetsBasedOnSheet1()DimwsAsWorksheetDimsheet1AsWorksheetDimiAsLong,lastRowAsLongDim
Python 潮流周刊#87：媲美 OpenAI-o1 的开源模型（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。本期分享了12篇文章，12个开源项目。下周因春节假期停更一周，提前恭祝大家蛇年吉祥，万事顺意！（PS.我在Python猫公众号给大家准备了一些红包封面，免费领取哟～）以下是本期摘要：文章&教程①优
云电脑账号共享，云电脑账号共享的作用
在科技的浪潮中，云电脑正以一种不可阻挡的趋势向前发展。它将不断突破传统电脑的局限，为用户带来更加便捷、高效、智能的数字体验。相信在不久的将来，云电脑将走进千家万户，成为人们生活中不可或缺的一部分，开启一个全新的数字时代。今天小编给大家带来分析云电脑账号共享的作用。云电脑账号共享的作用主要体现在以下几个方面：1.提高资源利用率：通过共享云电脑账号，多个用户可以共同使用同一台云主机的计算资源，从而提高
Alibaba Spring Cloud 十七 Sentinel熔断降级空灵宫（Ethereal Palace） Alibaba Spring Cloud spring cloud sentinel spring
概述在微服务架构中，熔断与降级是保证系统稳定性的重要机制，能有效防止故障蔓延或雪崩效应。当某个服务出现异常、延迟过高或错误率过高时，触发熔断保护，将该服务“隔离”一段时间，避免影响整体系统的吞吐和可用性。SpringCloudAlibabaSentinel提供了灵活的熔断降级（Degrade）机制，可以根据响应时间（RT）、异常比例或异常数等指标，自动触发熔断并执行相应的降级策略，为业务提供及时的
[C++技能提升]类注册 Hunter_pcx 工程技能人工智能 c++
最近在做AI信息在各个平台流转的框架设计，想要设计一种可以灵活扩展、不改变原有代码的框架，了解到了类注册。具体需求是这样的：AI算法在客户本地电脑和云端都有部署，原先AI在这两个平台下的输出格式并不统一，且每个AI功能都有自己的输出格式，导致两个平台下的AI信息无法共享，带来了计算资源的浪费，管理起来也比较混乱，因此需要一种模式将所有AI输出规范起来。我的解决思路大概就是将所有AI信息都规范输出到
一、新手学习爬虫第一课对网站发起请求（基于python语言） [木子加贝] python自学爬虫学习爬虫 python 开发语言后端
目录前言一、安装并引用请求模块requests1.安装请求模块2.引用requests请求模块3.引用requests请求模块并使用别名二、发起请求1.对网站发起get请求（最常用的请求）：（1）第一种方法（字符串）（2）第二种方法（变量）（3）第三种方法（关键字传参）2.对网站发起带参数的get请求：3.对网站发起post请求：4.对网站发JSON数据的post请求：4.注意事项总结前言爬虫的本
【Python Web开发】Python Web开发知识全解析萧鼎 python基础到进阶教程 python 前端开发语言
PythonWeb开发知识全解析Python是一种强大的编程语言，以其简洁和高效而闻名，尤其在Web开发领域，它有着广泛的应用。Python提供了许多功能强大且灵活的Web框架，如Flask、Django、FastAPI等，使得构建现代Web应用变得简单而高效。本文将从PythonWeb开发的基本知识入手，逐步介绍开发流程、核心技术以及如何使用Python框架构建高效、可扩展的Web应用。1.什么
x86 Docker镜像转换为 ARM 架构镜像好运- docker arm开发架构
Docker是一种流行的容器化技术，可以帮助开发人员在不同的操作系统和硬件平台上运行应用程序。然而，由于不同的硬件架构，例如x86和ARM，Docker镜像在不同的平台上不能直接运行。本文将介绍如何将x86Docker镜像转换为ARM架构，并提供代码示例。目录1.环境配置2.注意事项3.镜像拉取4.x86系统打包镜像1.环境配置docker运行其他平台容器，需要使用--platform参数来指定平
【Pip】配置和优化 `pip` 安装源：提升 Python 包管理体验的全面指南丶2136 #pip pip python 开发语言
目录引言一、什么是`pip`配置文件？1.1配置文件的类型与位置二、配置文件的结构与配置项2.1中英文注释配置文件示例三、详细解析配置项3.1镜像源设置（`index-url`和`extra-index-url`）3.2代理设置（`proxy`）3.3安装选项（`no-deps`和`user`）3.4缓存控制（`no-cache-dir`和`cache-dir`）3.5日志和调试（`verbose
【学习笔记】手把手教你使用Autoware标定SICK-2D激光雷达和相机 Masec 学习笔记 Autoware标定二维雷达
2019/06/21更新说明：很多小伙伴反应从github上下载的Autoware没有CalibrationToolkit，是作者在github的新源码和我用的版本不一样了。该教程仅针对2018年11月7日的发布版本。网上Autoware的教程不多，而且都是关于多线的威力登雷达和相机的联合标定。自己摸索使用Autoware标定SICKTIM561单线激光雷达和相机的方法，写一个详细的教程，希望可以
Android FFmpeg 实现带滤镜的微信小视频录制功能攻城狮百里音视频 C/C++C++音视频 Android FFmpeg
本文将实现对采集的预览帧（添加滤镜）和PCM音频同时编码复用生成一个mp4文件，即实现一个仿微信小视频录制功能。音视频录制编码流程本文采用的是软件编码（CPU）实现，所以针对高分辨率的预览帧时，就需要考虑CPU能不能吃得消，在骁龙8250上使用软件编码分辨率超过1080P的图像就会导致CPU比较吃力，这个时候帧率就跟不上了。音视频录制代码实现Java层视频帧来自AndroidCamera2API回
奥比中光Geminipro相机使用一傲 python 开发语言
相机使用入门，使用python获取深度图和颜色图并显示。#安装依赖importcv2importnumpyasnpfrommatplotlibimportpyplotasplt#奥比中光OrbbecPythonSDKfromObTypesimport*fromPropertyimport*importPipelineimportStreamProfilefromErrorimportObExcep
H3C-交换机telnet远程配置案例仓鼠OO 网络配置(H3C)H3C 网络运维
目录1.telnet简述2.网络拓扑3.实验需求4.配置步骤4.1网络基本配置4.2telnet配置5.telnet测试远程6.小结1.telnet简述Telnet是远程登录服务的一个协议，该协议定义了远程登录用户与服务器交互的方式。它允许用户在一台联网的计算机上登录到一个远程分时系统中，然后像使用自己的计算机一样使用该远程系统。Telnet使用客户-服务器模式进行工作。在用户端，需要启动一个Te
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

在Python中存储字符串

目录

unicode 的三种编码

为什么不使用utf-8编码

Latin-1、UCS2、UCS4该使用哪一种？

小结

你可能感兴趣的:(在Python中存储字符串)