Amo Xiang

详解 Python 字符串（一）：字符串基础

文章目录

1. 字符串基础
- 1.1 定义字符串
- 1.2 转义字符
- 1.3 原始字符串
- 1.4 Unicode 字符串
- 1.5 字符编码类型
- 1.6 字节串
- 1.7 字符编码和解码
- 1.8 字符串的长度
- 1.9 访问字符串
- 1.10 遍历字符串
- - 1.10.1 使用 for 语句
  - 1.10.2 使用 range()
  - 1.10.3 使用 enumerate()
  - 1.10.4 使用 iter()
  - 1.10.5 逆序遍历
- 1.11 案例：判断两个字符串是否为变形词
- 1.12 案例：字节串的应用
- - 1.12.1 计算md5
  - 1.12.2 二进制读写文件
  - 1.12.3 socket编程

在 Python 中，字符串就是一串字符的组合，它是不可变的、有限字符序列，包括可见字符、不可见字符（如空格符等）和转义字符。Python 通过 str 类型提供大量方法来操作字符串，如字符串的替换、删除、截取、复制、连接、比较、查找、分隔等。本篇博文将详细介绍操作字符串的一般方法。因为字符串在开发过程中，是非常常见的一种数据类型，在爬虫中经常都是对字符串进行操作，包括 URL 拼接、格式化、数据处理(替换、去除空白、截取等)，所以读者需要对其常规操作进行熟练掌握，读者将本文收藏当作文档查阅工具使用也可。学习重点如下：

1. 如何定义字符串。
2. 字符串长度的计算和编码。
3. 字符串连接和截取。
4. 字符串查找和替换。
5. 熟悉字符串的其他常规操作。

1. 字符串基础

1.1 定义字符串

在 Python 中，可以使用很多种方式来进行字符串的定义。下面对各种定义方式进行详细地介绍与说明。注意：Python 不支持字符类型，单个字符也算是一个字符串。

(1) 单行字符串
在 Python 中，使用单引号（'）和双引号（"）可以定义字符串，注意是成对出现。语法格式如下：

'单行字符串'
"单行字符串"

单引号和双引号常用于表示单行字符串，也可以在字符串中添加换行符（\n）间接定义多行字符串。在使用单引号定义的字符串中，可以直接包含双引号，而不必进行转义，而在使用双引号定义的字符串中，可以直接包含单引号，而不必进行转义。一句话讲：外双内单、外单内双。

示例：定义两个字符串，分别包含单引号和双引号，为了避免使用转义字符，则分别使用单引号和双引号定义字符串。

(2) 多行字符串
单引号、双引号定义多行字符串时，需要添加换行符 \n，而三引号不需要添加换行符，语法格式如下：

'''多行
字符串'''
"""多行
字符串"""

同时字符串中可以包含单引号、双引号、换行符、制表符，以及其他特殊字符，对于这些特殊字符不需要使用反斜杠（\）进行转义。另外，三引号中还可以包含注释信息。

三引号可以帮助开发人员从引号和转义字符的泥潭里面解脱出来，确保字符串的原始格式。但是平时我们使用得最多的还是单行字符串，三引号一般用于函数注释、类注释、定义 SQL 语句等，读者可以在源码中看到大量三引号的应用，如下：

本示例使用三引号定义一个 SQL 字符串。如下：

str3 = """
CREATE TABLE users(  # 表名
name VARCHAR(8),  # 姓名字段
id INTEGER,  # 编号字段
password INTEGER)  # 密码字段
"""
print(str3)

(3) 使用 str() 函数
使用 str() 函数可以创建空字符串，也可以将任意类型的对象转换为字符串。下面示例演示使用 str() 函数创建字符串的不同形式。

注意：str() 函数的返回值由类型的 __str__ 魔法方法决定。 下面示例自定义一个 list 类型，定义 __str__ 魔法方法的返回值为 list 字符串表示，同时去掉左右两侧的中括号分隔符。

class MyList(list):  # 自定义 list类型，继承于list
    def __init__(self, value):  # 类型初始化函数
        self.value = list(value)  # 把接收的参数转换为列表并存储起来

    def __str__(self):  # 类型字符串表示函数
        # 把传入的值转换为字符串，并去掉左右两侧的中括号分隔符
        return str(self.value).replace("[", "").replace("]", "")


s = str(MyList([1, 2, 3]))  # 把自定义类型实例对象转换为字符串
print(s)  # 默认为"[1, 2, 3]" 实际输出结果为："1, 2, 3"

1.2 转义字符

在 Python 字符串中如果显示特殊字符，必须经过转义才能够显示。例如，换行符需要使用 \n 表示，制表符需要使用 \t 表示，单引号需要使用 \' ，双引号需要使用 \" 表示，等等。Python 可用的字符转义序列说明如下表所示：

转义序列	含义
\newline（下一行）	忽略反斜杠和换行
\\	反斜杠（\）
\’	单引号（’）
\"	双引号（"）
\a	ASCII 响铃（BEL）
\b	ASCII 退格（BS）
\f	ASCII 换页（FF）
\n	ASCII 换行（LF）
\r	ASCII 回车（CR）
\t	ASCII 水平制表（TAB）
\v	ASCII 垂直制表（VT）
\ooo	八进制的 ooo 的字符。与标准C中一样，最多可接收3个八进制数字
\xhh	十六进制值 hh 的字符。与标准C不同，只需要2个十六进制数字
\N{name}	Unicode 数据库中名称为 name 的字符。【提示】：只在字符串字面值中识别的转义序列
\uxxxx	16 位的十六进制值为 xxxx 的字符。4个十六进制数字是必需的。【提示】：只在字符串字面值中识别的转义序列
\Uxxxxxxxx	32 位的十六进制值为 xxxxxxxx 的字符，任何 Unicode 字符可以这种方式被编码。8个十六进制数字是必需的。【提示】：只在字符串字面值中识别的转义序列

【示例1】本示例分别使用转义字符、八进制数字、十六进制数字表示换行符。

【示例2】如果八进制数字不满3位，则首位自动补充0。如果八进制数字超出3位，十六进制数字超出2位，超出数字将视为普通字符显示。

1.3 原始字符串

在 Python3 中，字符串常见有 3 种形式：普通字符串（str）、Unicode 字符串（unicode）和原始字符串（也称为原义字符串）。

原始字符串的出现目的：解决字符串中显示特殊字符。在原始字符串里，所有的字符都直接按照字面的意思来使用，不支持转义序列和非打印的字符。

原始字符串的这个特性让一些工作变得非常方便。例如，在使用正则表达式的过程中，正则表达式字符串，通常是由代表字符、分组、匹配信息、变量名和字符类等特殊符号组成。当使用特殊字符时，\字符 格式的特殊字符容易被歧义，这时使用原始字符串就会派上用场。可以使用 r 或 R 来定义原始字符串，这个操作符必须紧靠在第一个引号前面。语法格式如下：

r"原始字符串"
R"原始字符串"

【示例】定义文件路径的字符串时，会使用很多反斜杠，如果每个反斜杠都用歧义字符串来表示会很麻烦，可以采用下面代码来表示。

1.4 Unicode 字符串

从 Python 1.6 开始支持 Unicode 字符串，用来表示双字节、多字节字符、实现与其他字符编码的格式转换。在 Python 中，定义 Unicode 字符串与定义普通字符串一样简单，语法格式如下：

u'Unicode 字符串'
U"Unicode 字符串"

引号前面的操作符 u 或 U 表示创建的是一个 Unicode 字符串。如果想加入特殊字符，可以使用 Unicode 编码。例如：

str1 = u"Hello\u0020World"
print(str1)  # 输出：Hello World

被替换的 \u0020 标识符表示在给定位置插入编码值为 0x0020 的 Unicode 字符（空格符）。Unicode 字符串的作用：u 操作符后面字符串将以 Unicode 格式进行编码，防止因为源码存储格式问题，导致再次使用时出现乱码。

unicode() 和 unichr() 函数可以作为 Unicode 版本的 str()和chr()。unicode()函数可以把任何 Python 的数据类型转换成一个 Unicode 字符串，如果对象定义了 __unicode__() 魔术方法，它还可以把该对象转换成相应的 Unicode 字符串。unichr() 函数和chr()函数功能基本一样，只不过返回 Unicode 的字符。

1.5 字符编码类型

字符编码就是把字符集中的字符编码为指定集合中某一对象，以便文本在计算机中存储和传递。常用字符编码类型如下。

ASCII：全称为美国国家信息交换标准码，是最早的标准编码，使用 7 个或8个二进制位进行编码，最多可以给 256 个字符分配数值，包括 26 个大写与小写字母、10 个数字、标点符号、控制字符以及其他符号。
GB2312：一个简体中文字符集，由 6763 个常用汉字和 682 个全角的非汉字字符组成。GB2312 编码使用两个字节表示一个汉字，所以理论上最多可以表示 256×256 =65536 个汉字。这种编码方式仅在中国通行。
GBK：该编码标准兼容 GB2312，并对其进行扩展，也采用双字节表示。其共收录汉字 21003个、符号 883 个，提供 1894 个造字码位，简、繁体字融于一库。
Unicode：是为了解决传统字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。Unicode 通常用两个字节表示一个字符，原有的英文编码从单字节变成双字节，只需要把高字节全部填为 0 即可。
UTF-8：为了提高 Unicode 的编码效率，于是就出现了 UTF-8 编码。UTF-8 可以根据不同的符号自动选择编码的长短。比如英文字母可以只用1个字节就够了。

读者想要详细了解可以点击编码百度百科进行学习。

1.6 字节串

在 Python 中，有两种常用的字符串类型，分别为 str 和 bytes。其中， str 表示 Unicode 字符（ASCII或者其他），bytes 表示二进制数据（包括编码的文本）。这两种类型的字符串不能拼接在一起使用。通常情况下，str 在内存中以 Unicode 表示，一个字符对应若干个字节。但是如果在网络上传输，或者存到磁盘上，就需要把 str 转换为字节类型，即 bytes 类型。

字节串（bytes）也称字节序列，是不可变的序列，存储以字节为单位的数据。提示：bytes 类型是 Python3 新增的一种数据类型。字节串与字符串的比较：

字符串是由多个字符构成，以字符为单位进行操作。默认为 Unicode 字符，字符范围为 0~65535。字符串是字符序列，它是一种抽象的概念，不能直接存储在硬盘，用以显示供人阅读或操作。
字节串是由多个字节构成，以字节为单位进行操作。字节是整型值，取值范围 0~255。字节串是字节序列，因此可以直接存储在硬盘。

除了操作单元不同外，字节串与字符串的用法基本相同。它们之间的映射被称为解码或编码。定义字节串的方法如下：
(1) 使用字面值
以 b 操作符为前缀的 ASCII 字符串。语法格式如下：

b"ASCII 字符串"
b"转义序列"

字节是 0~255 之间的整数，而 ASCII 字符集范围为 0~255，因此它们之间可以直接映射。通过转义序列可以映射更大规模的字符集。

【示例1】下面示例使用字面值直接定义字符串。

(2) 使用 bytes() 函数
使用 bytes() 函数可以创建一个字节串对象，简明语法格式如下：

bytes()  # 生成一个空的字节串，等同于b''
bytes(整型可迭代对象)  # 用可迭代对象初始化一个字节串，元素必须为[0,255]中的整数
bytes(整数n)  # 生成n个值为零的字节串
bytes('字符串', encoding='编码类型')  # 使用字符串的转换编码生成一个字节串

【示例2】下面示例使用 bytes()函数创建多个字节串对象。

字节串是不可变序列，使用 bytearray() 可以创建可变的字节序列，也称为字节数组（bytearray）。数组是每个元素类型完全相同的一组列表，因此可以使用操作列表的方法来操作数组。
bytearray() 函数的简明语法格式如下：

bytearray()  # 生成一个空的可变字节串，等同于 bytearray(b'')
bytearray(整型可迭代对象)  # 用可迭代对象初始化一个可变字节串,元素必须为 [0, 255] 中的整数
bytearray(整数n)  # 生成 n 个值为零的可变字节串
bytearray(字符串, encoding='utf-8')  # 用字符串的转换编码生成一个可变字节串

1.7 字符编码和解码

在编码转换时，通常以 Unicode 作为中间码，即先将一种类型的字符串解码（decode）成 Unicode，再从 Unicode 编码（encode）成另一种类型的字符串。

(1) 使用 encode()
使用字符串对象的 encode()方法可以根据参数 encoding 指定的编码格式将字符串编码为二进制数据的字节串，语法格式如下：

str.encode(encoding='UTF-8', errors='strict')

str 表示字符串对象：参数 encoding 表示要使用得编码类型，默认为 UTF-8 ，参数 errors 设置不同错误的处理方案，默认为 strict，表示遇到非法字符就会抛出异常，其他取值包括 ignore（忽略非法字符）、replace（用 ? 替换非法字符）、xmlcharrefreplace （使用 XML 的字符引用）、backslashreplace ，以及通过 codecs.register_error() 注册的任何值。
【示例1】本例使用 encode()方法对 中文 字符串进行编码。

u = "中文"
str1 = u.encode("gb2312")
print(str1)
str2 = u.encode("gbk")
print(str2)
str3 = u.encode("utf-8")
print(str3)

(2) 使用 decode()
与 encode() 方法操作相反，使用 decode()方法可以解码字符串，即根据参数 encoding 指定的编码格式将二进制数据的字节串解码为字符串。语法格式如下：

str.decode(encoding='UTF-8', errors='strict')

str 表示被 decode()解码的字节串，该方法的参数与 encode()方法的参数用法相同。最后返回解码后的字符串。
【示例2】针对示例1，可以使用下面代码对编码字符串进行解码。

u = "中文"
str1 = u.encode("gb2312")
u1 = str1.decode("gb2312")
print(u1)  # 输出：中文
u2 = str1.decode("utf-8")  # 报错，因为str1是gb2312编码的
"""
报错如下：
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte
"""

encode()和decode()方法的参数编码格式必须一致，否则将抛出上面代码所示的异常。

1.8 字符串的长度

计算字符串的长度可以使用 len()函数。例如：

s1 = "中国China"  # 定义字符串
print(len(s1))  # 输出为7

从上面结果可以看出，在默认情况下，len()函数计算字符串的长度是区分字母、数字和汉字的，每个汉字视为一个字符。

但是，在实际开发中，有时候需要获取字符串的字节长度。在 UTF-8 编码中，每个汉字占用3个字节，而在 GBK 或 GB2312中，每个汉字占用 2 个字符。例如：

s1 = "中国China"  # 定义字符串
print(len(s1.encode()))  # 输出为11
print(len(s1.encode("gbk")))  # 输出为9

从上面代码可以看出，两行输出代码的结果并不相同，第 2 行 print(len(s1.encode())) 使用默认的 UTF-8 编码，则字节长度为11，即每个汉字占用 3 个字节，而第 3 行print(len(s1.encode(“gbk”))) 使用 GBK 编码，则字节长度为 9，即每个汉字占用 2 个字节。

因此，由于不同字符占用字节数不同，当计算字符串的字节长度时，需要考虑使用编码进行计算。在 Python 中，字母、数字、特殊字符一般占用 1 个字节，汉字一般占用 2~4 个字节。

1.9 访问字符串

Python 不支持单字符类型，单字符在 Python 中也是作为一个字符串使用。Python 访问字符串中的字符有两种方式。

(1) 索引访问
在 Python 中，字符串是一种有序序列，字符串里的每一个字符都有一个数字编号标识其在字符串中的位置，从左至右依次是：0、1、2、…、n-1，从右至左依次是 -1、-2、-3、…、-n（其中 n 是字符串的长度）。
【示例1】通过索引来访问字符串中的某个字符。

(2) 切片访问
使用切片可以获取字符中某个范围的子字符串。语法格式如下：

str[start:end:step]

参数 start 为起点，end 为终点，step 为步长，返回字符串由从 start 到 end-1 的字符组成。
【示例2】下面示例演示一些字符串切片操作。

提示：当切片的第 3 个参数为负数时，表示逆序输出，即输出顺序为从右到左，而不是从左到右。

1.10 遍历字符串

在字符串过滤、筛选和编码时，经常需要遍历字符串。遍历字符串的方法有多种，具体说明如下。

1.10.1 使用 for 语句

【示例1】使用 for 语句循环遍历字符串，然后把每个字符都转换为大写形式并输出。

s1 = "python"  # 定义字符串
L = []  # 定义临时备用列表
for i in s1:  # 迭代字符串
    L.append(i.upper())  # 把每个字符转换为大写形式
print("".join(L))  # 输出大写字符串 PYTHON

1.10.2 使用 range()

使用 range() 函数，然后把字符串长度作为参数传入。
【示例2】针对示例1，也可以按照以下方式遍历字符串。

s1 = "python"  # 定义字符串
L = []  # 定义临时备用列表
for i in range(len(s1)):  # 根据字符串长度遍历字符串下标数字，
    # 从0开始，直到字符串长度
    L.append(s1[i].upper())  # 把每个字符转换为大写形式
print("".join(L))  # 输出大写字符串 PYTHON

1.10.3 使用 enumerate()

enumerate()函数将一个可迭代的对象组合为一个索引序列。
【示例3】针对示例1，使用 enumerate() 函数将字符串转换为索引序列，然后再迭代操作。

s1 = "python"  # 定义字符串
L = []  # 定义临时备用列表
for i, char in enumerate(s1):  # 把字符串转换为索引序列，然后再遍历
    L.append(char.upper())  # 把每个字符转换为大写形式
print("".join(L))  # 输出大写字符串 PYTHON

1.10.4 使用 iter()

使用 iter()函数可以生成迭代器。语法格式如下：

iter(object[, sentinel])

参数 object 表示支持迭代的集合对象，sentinel 是一个可选参数，如果传递了第 2 个参数，则参数 object 必须是一个可调用的对象（如函数），此时，iter() 函数将创建一个迭代器对象，每次调用这个迭代器对象的 __next__() 方法时，都会调用 object。
【示例4】针对示例1，使用 iter() 函数将字符串生成迭代器，然后再遍历操作。

s1 = "python"  # 定义字符串
L = []  # 定义临时备用列表
for item in iter(s1):  # 把字符串生成迭代器，然后再遍历
    L.append(item.upper())  # 把每个字符转换为大写形式
print("".join(L))  # 输出大写字符串 PYTHON

1.10.5 逆序遍历

逆序遍历就是从右到左反向迭代对象。
【示例5】本示例演示了 3 种逆序遍历字符串的方法。

s1 = "Python"
print("1. 通过下标逆序遍历:")
for i in s1[::-1]:
    print(i, end="")

print("\n2. 通过下标逆序遍历:")
for i in range(len(s1) - 1, -1, -1):
    print(s1[i], end="")

print("\n3. 通过reversed()逆序遍历:")
for i in reversed(s1):
    print(i, end="")

1.11 案例：判断两个字符串是否为变形词

假设给定两个字符串 str1、str2，判断这两个字符串中出现的字符是否一致，字符数量是否一致，当两个字符串的字符和数量一致时，则称这两个字符串为变形词。例如：

str1 = "python", str2="thpyon", 返回True
str2 = "python", str2="thonp", 返回False

示例代码如下：

# -*- coding: UTF-8 -*-
"""
@author:AmoXiang
@file:2.判断两个字符串是否为变形词.py
@time:2021/01/16
"""


def is_deformation(str1, str2):  # 定义变形词函数
    if str1 is None or str2 is None or len(str1) != len(str2):  # 当条件不符合时
        return False  # 返回False
    if len(str1) == 0 and len(str2) == 0:  # 当两个字符串长度都为0时
        return True  # 返回True
    dic = dict()  # 定义一个空字典
    for char in str1:  # 循环遍历字符串str1
        if char not in dic:  # 判断字符是否在字典中
            dic[char] = 1  # 不存在时，赋值为1
        else:
            dic[char] = dic[char] + 1  # 存在时字符的值累加
    for char in str2:  # 循环遍历字符串str2
        if char not in dic:  # 当str2的字符不在字典中时 返回False
            return False
        else:
            dic[char] = dic[char] - 1  # 当str2和str1的字符种类一致时，字典中的字符值自减1
            # 字符的值小于0，即字符串的字符数量不一致 返回False 否则返回True
            if dic[char] < 0:
                return False
    return True


str1 = "python"
str2 = "thpyon"
str3 = "hello"
str4 = "helo"
# 输出：python thpyon is deformation: True
print(str1, str2, "is deformation:", is_deformation(str1, str2))
# 输出：hello helo is deformation: False
print(str3, str4, "is deformation:", is_deformation(str3, str4))

1.12 案例：字节串的应用

1.12.1 计算md5

在计算 md5 值的过程中，有一步要使用 update 方法，而该方法只接受 bytes 类型数据。

import hashlib

string = "123456"

m = hashlib.md5()  # 创建md5对象
str_bytes = string.encode(encoding='utf-8')
print(type(str_bytes))  # 
m.update(str_bytes)  # update方法只接收bytes类型数据作为参数
str_md5 = m.hexdigest()  # 得到散列后的字符串

print('MD5散列前为 ：' + string)  # MD5散列前为 ：123456
print('MD5散列后为 ：' + str_md5)  # MD5散列后为 ：e10adc3949ba59abbe56e057f20f883e

1.12.2 二进制读写文件

使用二进制方式读写文件时，均要用到 bytes 类型，二进制写文件时，write()方法只接受 bytes 类型数据，因此需要先将字符串转成 bytes 类型数据；读取二进制文件时，read()方法返回的是 bytes 类型数据，使用 decode()方法可将 bytes 类型转成字符串。

f = open('data.txt', 'wb')
text = '二进制写文件'
text_bytes = text.encode('utf-8')
f.write(text_bytes)
f.close()

f = open('data.txt', 'rb')
data = f.read()
print(data, type(data))
str_data = data.decode('utf-8')
print(str_data)
f.close()

1.12.3 socket编程

使用 socket 时，不论是发送还是接收数据，都需要使用 bytes 类型数据。关于网络编程，请点击 Python网络编程进行学习。

至此今天的案例就到此结束了，笔者在这里声明，笔者写文章只是为了学习交流，以及让更多学习 Python 基础的读者少走一些弯路，节省时间，并不用做其他用途，如有侵权，联系博主删除即可。感谢您阅读本篇博文，希望本文能成为您编程路上的领航者。祝您阅读愉快！

好书不厌读百回，熟读课思子自知。而我想要成为全场最靓的仔，就必须坚持通过学习来获取更多知识，用知识改变命运，用博客见证成长，用行动证明我在努力。
如果我的博客对你有帮助、如果你喜欢我的博客内容，请 点赞、评论、收藏 一键三连哦！听说点赞的人运气不会太差，每一天都会元气满满呦！如果实在要白嫖的话，那祝你开心每一天，欢迎常来我博客看看。
编码不易，大家的支持就是我坚持下去的动力。点赞后不要忘了 关注 我哦！

你可能感兴趣的:(Python,字符串,python)

Python csv库 xiaoming0018 python python 开发语言
CSV文件又称为逗号分隔值文件，是一种通用的、相对简单的文件格式，用以存储表格数据，包括数字或者字符。CSV是电子表格和数据库中最常见的输入、输出文件格式，可参考《CSV介绍》。通过爬虫将数据抓取的下来，然后把数据保存在文件，或者数据库中，这个过程称为数据的持久化存储。本节介绍Python内置模块CSV的读写操作。CSV库Python中集成了专用于处理csv文件的库，名为：csv。csv库中有4个
iOS OC使用正则表达式去除特殊符号并加粗文本，适用于接入AI大模型的流模式数据的文字处理 MrZWCui iOS ios xcode objective-c 正则表达式学习
1、编写逻辑使用分类(Category)的方法拓展NSString，本文使用NSString(Markdown)，NSString的分类来编写一个通用方法，使用正则表达式匹配字符串实现去除特殊字符，并自定义文字属性。在接入AI大模型后，返回的字符串会带有特殊字符用于做文字处理，下面代码简单进行了文字处理展示。2、代码实现1、NSString+Markdown.h#importNS_ASSUME_N
Python 爬虫：一文掌握 SVG 映射反爬虫数据知道 2025年爬虫和逆向教程 python 爬虫 microsoft 爬虫逆向数据采集
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.SVG概述1.1SVG的优点1.1映射反爬虫的原理2.SVG映射反爬虫的示例3.应对SVG映射反爬虫的方法3.1解析SVG图像3.2处理自定义字体3.3使用OCR技术3.4动态生成SVG的处理4.实战案例4.1使用SVG映射显示价格4.2解析SVG文件并提取其中的内容和属性4.3模拟交互行为4.4使用无头浏览器4.5某网站使用SVG实现动态验
Python处理CSV文件的12个高效技巧宇宙大豹发 python 开发语言
今天，我们的Python之旅，目标是那片由逗号分隔的宝藏——CSV文件。别看它简单，掌握这些技巧，你的数据处理能力将直线上升，轻松驾驭千行万列的数据海洋。让我们一起，用Python的魔力，让CSV舞动起来吧！1.初次见面，你好，CSV！安装pandas，是这场冒险的起点。它，是Python数据分析的瑞士军刀。pipinstallpandas导入我们的英雄——pandas，并亲切地叫它pd。impo
Python初学者第一天小熊h python初学者 python编译 python语言 python python基础 python初学者
目录一、问答题（1）什么是硬件？什么是软件？（2）比特是什么？字节是什么？（3）内存和存储设备最主要的区别是什么？（4）解释语言和编译语言之间的区别是什么？（5）操作系统的主要任务是什么？（6）可以使用两种模式运行Python。解释这两种模式。（7）找出下面代码中的错误（8）列举代码当中四种异常错误，说明错误原因（9）下面哪些标识符是有效的？哪些是Python关键字？（10）如何使用Python编
Python 潮流周刊#93：为什么“if not list”比len()快2倍？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目以下是本期摘要：文章&教程①为什么Python中'ifnotlist'比len()快2倍？②掌握Python单体代码库③Python3.14尾调用解释器的性能④Py
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
python笔记1 lu_32 python
1.计算面积与周长：r=8s=r*rprint("面积是")print(s)z=r+r+r+rprint("周长是")print(z)#面积是#64#周长是#322.输入圆的半径，计算出圆的面积和周长：r=input("请输入半径：")r=float(r)s=3.14*r*rprint("圆的面积：",s)r=input("请输入圆的半径")r=int(r)s=3.14*r*rprint("圆的半
String类型为什么不可变 27xixi java高频 java
在大多数编程语言（如Java、Python、C#等）中，String类型被设计为不可变（Immutable），这意味着一旦一个字符串对象被创建，它的值就不能被修改。以下是这一设计的原因及具体表现：一、不可变性的表现直接修改字符串会创建新对象Stringstr="Hello";str=str+"World";//实际是创建了一个新字符串对象，而非修改原对象原字符串“Hello”未被修改，而是生成了新
Flet 项目常见问题解决方案龙香令Beatrice
Flet项目常见问题解决方案fletFletenablesdeveloperstoeasilybuildrealtimeweb,mobileanddesktopappsinPython.Nofrontendexperiencerequired.项目地址:https://gitcode.com/gh_mirrors/fl/flet1.项目基础介绍和主要编程语言Flet是一个开源框架，允许开发者在Py
Flet 框架教程樊贝路Strawberry
Flet框架教程fletFletenablesdeveloperstoeasilybuildrealtimeweb,mobileanddesktopappsinPython.Nofrontendexperiencerequired.项目地址:https://gitcode.com/gh_mirrors/fl/flet1.项目介绍Flet是一个框架，它允许开发者使用Python轻松构建实时的Web、
数值类型自学引导 Ssaty. python 前端数据库
第1关：计算边长为整数的正方形面积任务描述本关任务：编写一个能计算正方形面积的小程序。相关知识为了完成本关任务，你需要掌握：1.输入函数2.字符串转整数3.数值运算4.输出函数#输入一个正整数，以其数值为正方形的边长，计算并输出正方形的面积width=int(input())print(width**2
Python字符串 DDD小小小宇宙 python 开发语言
字符串1.程序中需要加上双引号或者双引号来表示字符串2.字符串可以存放任意数量的字符，无法修改的数据容器字符串运算：加法：多个字符串按照次序合并为一个字符串在实际使用的时候，数字和字符串的加法通常需要将数字的类型转换成str乘法：1个字符串乘以n，可以得到n个复制的字符串例子：输入一个字符，使用该字符打印一个3层的金字塔x=input(':')print(""+x)print(""+x+x+x)p
Python入门指南：从简介到安装小团团0 开发语言 python
Python简介Python是一种高级编程语言，由荷兰程序员GuidovanRossum于1989年圣诞节期间开始设计，并于1991年发布了第一个公开发行版。Python的命名源于英国喜剧团体MontyPython，Guido以此表达对该喜剧团体的喜爱。Python的特点主要体现在以下几个方面：解释型语言：Python是一种解释型语言，这意味着在开发过程中无需编译，可以直接运行源代码。交互式语言：
正则问题-DFS 艾菲尔上的铁塔梦xx 深度优先算法
题目描述考虑一种简单的正则表达式：只由x()|组成的正则表达式。小明想求出这个正则表达式能接受的最长字符串的长度。例如((xx|xxx)x|(x|xx))xx能接受的最长字符串是：xxxxxx，长度是6。输入描述一个由x()|组成的正则表达式。输入长度不超过100，保证合法。输出描述这个正则表达式能接受的最长字符串的长度。输入输出样例示例输入((xx|xxx)x|(x|xx))xx输出6运行限制最
【JAVA进阶系列】进阶知识 -- Class类 getName()、getCanonicalName()、getSimpleName()、getTypeName() m0_74823658 面试学习路线阿里巴巴 java 开发语言
【JAVA进阶系列】进阶知识--Class类getName()、getCanonicalName()、getSimpleName()、getTypeName()方法的异同【1】getName()返回该类对象作为字符串表示的实体(类、接口、数组类、基本数据类型或void)的名称可以理解为返回的是虚拟机中Class对象的表示当动态加载类的时候，会用到该方法的返回值，如:使用Class.forName(
Python扑克牌小游戏 Small踢倒coffee_氕氘氚笔记经验分享
1.游戏规则概述玩家人数：3人牌数：一副扑克牌，共54张（包括大小王）发牌：每人17张牌，剩余3张作为底牌出牌规则：玩家依次出牌，必须出比上家更大的牌型，或者选择不出胜利条件：先出完手中牌的玩家获胜2.游戏框架设计2.1牌型定义classCard:def__init__(self,suit,rank):self.suit=suit#花色：♠,♥,♣,♦self.rank=rank#牌面：3,4,5
探索Pydoll：基于Python的无驱动浏览器自动化新星几道之旅人工智能智能体及数字员工 python 自动化人工智能
在当今Web自动化与数据抓取领域，基于Chromium的工具层出不穷，但大多数方案依赖WebDriver或额外的浏览器插件。Pydoll作为一款新兴的Python库，以无驱动架构和原生异步支持迅速成为开发者关注的焦点。本文将从技术原理、核心功能、应用场景及实战案例多角度解析这一工具。一、Pydoll项目概览Pydoll由开发者thalissonvs等团队维护，旨在通过Python实现对Chromi
python opencv轮廓检测_python opencv中的不规则形状检测和测量 weixin_39584529 python opencv轮廓检测
正如我在评论中提到的那样,对于这个问题,分水岭似乎是一个很好的方法.但是当你回答时,定义标记的前景和背景是困难的部分！我的想法是使用形态梯度沿着冰晶获得良好的边缘并从那里开始工作;形态梯度似乎很有效.importnumpyasnpimportcv2img=cv2.imread('image.png')blur=cv2.GaussianBlur(img,(7,7),2)h,w=img.shape[:
【DuodooTEKr】基于Python+OCR+DeepSeek的英国购物小票识别系统开发实战邹工拆解甲方需求风吟九宵 Odoo18开源 Duodoo开源人工智能物联网制造开源 python
作者：Odoo技术开发/资深信息化负责人日期：2025年3月11日本方案从甲方信息化负责人视角，分析梳理现状，并给出代码开发案例。一、行业现状与痛点分析1.英国零售业数字化现状根据英国零售协会（BRC）2023年度报告显示：英国年均纸质小票签发量达78亿张87%的企业仍采用人工录入方式处理小票数据零售业每年因小票管理产生的直接成本超12亿英镑2.传统小票管理痛点数据孤岛问题：门店POS系统、财务系
用Python打造AI玩家：挑战2048，谁与争锋穿梭的编织者人工智能 python
文章目录一、创作背景二、效果图三、准备工作1.安装Chrome和ChromeDriver2.安装Python库四、代码说明‌1.init_driver函数‌2.play_2048函数‌五、完整代码六、改进版本七、主要模块八、核心算法分析1.棋盘状态获取2.位置权重系统3.连续性评估4.单调性评估5.移动模拟系统九、评估系统1.评估标准2.决策机制十、性能优化1.延迟控制2.错误处理十一、完整代码编
Python爬虫相关内容猫猫头有亿点炸 python 爬虫开发语言
一、打开源代码的方式鉴于时间过很久后我们可能会忘记的源代码位置所以写下以下文章便于实时查看:一般有两种方法打开源代码:第一是f12第二右键查看网页源代码二、特殊情况第三种情况当你用爬虫爬取内容的时候可能用xpath还是匹配不到任何结果因为页面可能会自动刷新所以使用xpath的时候匹配不到任何内容查找源代码的示例图片三、解决办法这个时候你可以先->f12(笔记本电脑fn+f12)再->ctrl+sh
ArkTs进阶万事顺心开发语言鸿蒙 typescript
字符串加号两边只要有字符串，就是拼接的作用。模版字符串（`xxx`）主要用于拼接多个变量的字符串拼接letname:string='Tom'console.log(`姓名：${name}`)类型转换1.字符串转数字Number():字符串直接转数字，转换失败返回NaN(字符串中包含非数字)（常用）parseInt():去掉小数部分转数字（取整），转换失败返回NaNparseFloat():保留小数
CESM1.2.1移植使用说明 ༊.枕星＇听光.ঌ 人工智能 linux
文章目录概述环境配置cesm1_2_1配置部分环境软件压缩包改变CLM陆面模式结果文件的输出变量、特征值及频率小结概述记录用户如何在Linux系统上移植CESM1.2.1模型，并且使用CLM4.5模式创建并单点模拟算例I_2000_CLM45。环境配置1.更新系统软件源2.更新系统安装软件安装git、make、python等。3.安装MPI(openmpi4.1.5)//下载并解压进入文件夹wge
vs2019 Qt C++中调用python代码路奇怪 Visual Studio qt c++
目录1.添加依赖库，.lib，include2.修改python.h文件3.环境搭建好了下面是测试代码部分4.如果按照面上走可能会出现的问题：5.Qt+vs+python6.说一下这里调py的主要步骤借鉴几位大佬（吐槽一下各种坑啊）混合编程之——C++调用python2.7&python3.5-CSDN博客c++调用python(复杂版)_c++调用python复杂库-CSDN博客环境配置：1.添
python 基于混合式推荐算法的学术论文投稿系统 mosquito_lover1 python 知识图谱
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术（如基于内容的推荐、协同过滤、知识图谱等）来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。系统设计思路1.数据收集与预处理：-收集论文数据（标题、摘要、关键词、作者信息等）。-收集期刊/会议数据（领域、主题、影响因子、投稿要求等）。-对文本数据进行预处理（分词、去停用词、向量化等）。2.推荐算法设计
html字段最大长度限制,html input 限制输入的长度并提示的方法朱佳顺 html字段最大长度限制
html中input标签的value值的长度理论上应该是2^32(数据来源于资料，没有测试过)，但为了防止一些input的输入数据过长来做一些限制，该如何实现呢？这篇文章就来介绍一下，如何限制input输入数据的长度并且输入的数据超过规定的长度该如何去提示？htmlinput限制输入字符串长度的方法input标签中的maxlength属性，可以用来规定输入字符串的最大长度。示例代码：htmlinp
python hack库_这里有123个黑客必备的Python工具！ weixin_39637571 python hack库
123个Python渗透测试工具，当然不仅于渗透~如果你想参与漏洞研究、逆向工程和渗透，我建议你时候用Python语言。Python已经有很多完善可用的库，我将在这里把他们列出来。这个清单里的工具大部分都是Python写成的，一部分是现有C库的Python绑定，这些库在Python中都可以简单使用。一些强力工具(pentestframeworks、bluetoothsmashers、webappl
如何用爬虫根据关键词获取商品列表：一份简单易懂的代码示例 API小爬虫爬虫
在当今数字化时代，网络爬虫已经成为数据收集和分析的强大工具。无论是市场调研、价格监控还是产品分析，爬虫都能帮助我们快速获取大量有价值的信息。今天，我们就来探讨如何通过编写一个简单的爬虫程序，根据关键词获取商品列表。以下是一个基于Python语言的代码示例，适合初学者学习和实践。一、准备工作在开始编写爬虫之前，我们需要准备以下工具和库：Python环境：确保你的电脑上安装了Python。推荐使用Py
【Python】构建Web应用的首选：Flask框架基础与实战萧鼎 python基础到进阶教程 python 前端 flask
构建Web应用的首选：Flask框架基础与实战在Python的Web开发生态中，Flask框架以其轻量、灵活和易用的特性成为构建Web应用的首选之一。无论是快速搭建一个小型应用原型，还是构建复杂的后端服务，Flask都提供了便捷的接口和丰富的扩展支持。本博客将介绍Flask的基础知识和核心概念，并通过一个简单的实例展示如何用Flask构建Web应用。一、Flask框架简介Flask是由ArminR
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$