liuchunming033

测试开发之Python核心笔记（2）：字符串

2.1 字符串表示

表示一个字符串就是用引号将一连串字符包裹起来，或者使用str()构造器。

单引号’’
双引号 “”
三引号之中（’’’ ‘’'或""" “”"，两者一样）
构造器str()

打开Pycharm集成开发环境，输入下面的代码：

a = 'This is a string'  # 用单引号
b = "Selenium automates browsers. That's it!"  # 如果字符串内容包含单引号，那么最好用双引号将其括起来
c = """  # 用三个引号，定义多行字符串
This is a multiple lines string
This is the second line
"""
d = str('hah')  # str构造器
e = '*'*10  # 连续10个星号
print(a)
print(b)
print(c)
print(d)
print(e)

在Pycharm的编辑器窗口上，点击右键，点击Run，可以看到下面的输出：

This is a string
This is another string

This is a multiple lines string
This is the second line

hah
**********

下面这几个字符串来自string.py源码：

whitespace = ' \t\n\r\v\f'
ascii_lowercase = 'abcdefghijklmnopqrstuvwxyz'
ascii_uppercase = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
ascii_letters = ascii_lowercase + ascii_uppercase
digits = '0123456789'
hexdigits = digits + 'abcdef' + 'ABCDEF'
octdigits = '01234567'
punctuation = r"""!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~"""
printable = digits + ascii_letters + punctuation + whitespace

想使用这些字符串，可以通过下面的方式：

import string
print(string.printable)

2.2 字符串操作

查询一下Python内置的字符串操作方法都有哪些。在Python交互式界面上，输入下面的代码：

>>> dir('')

按回车键，你会看到下面的这样的输出信息：

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

这些都是Python为字符串类型的数据提供的内置方法。这些方法的命名让我们非常直观的猜测的其用途，我们自己命名变量和函数时，也最好起有意义的名字。

从上面的输出中看到lower这个函数，猜测可能用来将一个字符串中的大写字母转成小写字母用的。为了验证这一点，可以输入下面的命令具体查看一下：

>>> help(''.lower)

按回车键，将看到这个函数的用法信息：

Help on built-in function lower:

lower() method of builtins.str instance
    Return a copy of the string converted to lowercase.

从描述中看到，lower函数可以将一个字符串转换成小写字母。实际编写一段代码验证一下：
从描述中看到，lower函数可以将一个字符串转换成小写字母。实际编写一段代码验证一下：

>>> 'HADFADFA'.lower()
'hadfadfa'

哈哈，符合我们的猜测。接下来，介绍几种在工作中对字符串的几种常见操作。

2.2.1 读取字符或子串

通过索引和切片的方式读取字符串中的字符或者子串。

name = 'jason'
print(name[0])  # 输出j
print(name[1:3])  # 输出as，下标从1到3，但不包含3

2.2.2 反转

利用切片操作，或者reversed函数，将字符串反转：

name = 'Python'
print(name[::-1])
print(''.join(reversed(name)))  # reversed返回的是一个reversed object，要join一下

2.2.3 替换

name = 'jmeter'
name = name.replace('j', 'J')
print(name)  # Jmeter

2.2.4 拼接

两种拼接方法，一种是加号，一种是join方法。

加号拼接，就是直接将两个字符串连接在一起：

name = 'automation'
gender = 'testing'
print(name+gender)  # 输出automationtesting

另一种join方法，可以将多个独立的字符或者字符串，或者一个列表里面的数据，用特定的字符拼接起来。

print(' '.join([name, gender]))  # 输出automation testing ，中间一个空格
print('&'.join([name, gender]))  # 输出automation&testing ，中间一个&

2.2.5 分割

通过内置的split方法，可以将做一个字符串切分成一段一段的，放到一个列表中。实际工作中，再通过索引操作取得想要的数据。比如将Python单元测试框架Pytest的slogan用空格分割成列表：

string="pytest: helps you write better programs"  # 每个单词之间用一个空格隔开
print(string.split(' '))  # 输出 ['pytest:', 'helps', 'you', 'write', 'better', 'programs']

再来看一个例子，从web自动化测试工具selenium下载网址中提取域名：

path = 'https://www.selenium.dev/downloads/'
namespace = path.split('//')[1].split('/')[0] 
print(namespace))  # 返回'www.selenium.dev'

如果单词之间用多个空格，或者其他空白符隔开时，那么不给split方法传参就可以了：

pytest="pytest:   helps you write \t better \n programs" # helps前面有多个空格
print(pytest.split()) # ['pytest:', 'helps', 'you', 'write', 'better', 'programs']

这是因为split方法默认是使用ASCII whitespace characters对字符串进行分割的。具体描述可以参考split函数的官方文档（在Pycharm中通过command+点击split方式进入）。

2.2.6 去掉字符串两边的内容

在接收用户输入时，避免用户在输入数据两边意外加入空格或者其他空白符，可以对收到数据两边的空白（空格和制表符）进行去除，例如：

s = ' The Selenium Server is needed in order to run Remote Selenium WebDriver.\t'
print(s.strip())  # 输出'The Selenium Server is needed in order to run Remote Selenium WebDriver.'
print(s.rstrip())  # 输出 ' The Selenium Server is needed in order to run Remote Selenium WebDriver'
print(s.lstrip())  # 输出 'The Selenium Server is needed in order to run Remote Selenium WebDriver. '

还可以删除其他字符，将待删除的字符作为参数，比如：

s = '[Locust is an easy-to-use, distributed, user load testing tool.]'
print(s.rstrip(']'))  # 输出 '[Locust is an easy-to-use, distributed, user load testing tool.'
print(s.lstrip('['))  # 输出 'Locust is an easy-to-use, distributed, user load testing tool.]'

2.2.7 子串判断

判断 a 串是否为 b 串的子串。

selenium = "Selenium automates browsers. That's it!"
b = 'browsers'
r = True if b in selenium else False

2.2.8 子串查找

在主串中查找子串，返回主串中匹配子串的最小索引。

a = 'co'
b = 'Locust is completely event-based, and therefore it’s possible to support thousands of concurrent users on a single machine.'

print(b.find(a))  # 默认从下标0开始查找，返回10
print(b.find(a, 20))  # 从下标20开始查找，返回86

2.2.8 统计个数

'Locust supports running load tests distributed over multiple machines.'.count('o')  # 4

2.2.9 首字母大写

"split the argument into words using split".capitalize()  # 'Split the argument into words using split'

2.3 格式化

两种方式，一种是使用%，另外一种是使用format函数。

2.3.1 %格式化

%s表示字符串，%d表示十进制数，%%表示百分号。

print("The %s application is open source software, a %d%% pure Java application designed to load test functional behavior and measure performance. " % ("Apache JMeter™", 100))

2.3.2 format格式化

format格式化，需要在字符串模板中用{}占位，如果有多个{}，format函数中的参数将按顺序传递给{}。例如：

print('{} is compatible with Java {} or higher.'.format('JMeter', 8))

Jmeter传递个第一个{}，8传递给第二个{}。

字符串模板中{}里面还可以指定变量名，然后通过传入字典或者变量值给format函数，例如：

welcome_str = '{tool} is a tool that aims to bring the best of all packaging worlds (bundler, composer, npm, cargo, yarn, etc.) to the {language} world.'
welcome_dic = {'tool': 'Pipenv', 'language': 'Python'}
print(welcome_str.format(**welcome_dic))   # 传入字典
print(welcome_str.format(tool='Pipenv', language='Python'))  # 传入变量值

2.3.3 f字符串

f字符串是一种更加容易的、简便的格式化方法，在Python 3.6开始加入标准库。在一个字符串开头有一个大写的F或者小写的f，大括号中的变量被值替换。注意：！，：{} ；不能出现在{}里面否则会报错。

startwith = True
otherwise = False
print(f"str.startswith Return {startwith} if string starts with the prefix, otherwise return {otherwise}.")

更加强大的是，大括号{}可以对表达式求值，或者执行函数。

print(f"{ 2 * 3 + 1}")
name='pytest'
print(f"{name.title()} is a mature full-featured Python testing tool that helps you write better programs.")

2.4 不可改变性

Python字符串是不可改变的，Python的不可改变性体现在：

不能按索引修改字符串的值，比如name[0]=‘J’
通过加号修改字符串，并不是修改了源字符串而是新建了新的字符串。

下面这段代码，开始时通过id()查看变量str1的身份是4314674880，与str2拼接之后，str1指向了新的字符串，而不是在原来的str1上修改的。再次查看str1的身份，已经是4316047728了，与最开始身份已经不同了，说明不是原来的对象了。

str1="Selenium is not just one tool or API "
str2="but it composes many tools."
print(id(str1))   # 输出4314674880
str1+=str2
print(str1)  # 输出Selenium is not just one tool or API but it composes many tools.
print(id(str1))  # 输出 4316047728，可见str1的身份已经变了

2.5 转义字符

如果想在字符串中输入一些特殊字符，需要借助转义字符。比如：

'\n’表示换行符；

print("Hello\nWorld")  # Hello 和World会放在两行

'\"'表示双引号

print("Hello\"World\"")  # 输出 Hello"World"

原始字符串

如果要取消转义字符的效果，可以在字符串前面添加一个r

print(r"Hello\"World\"")  # 原样输出Hello\"World\"

2.6 字符串加密

对字符串进行加密，可以使用hashlib库。

import hashlib
print(hashlib.md5("Nobody inspects".encode('utf-8')).hexdigest()) # md5加密
print(hashlib.sha224("Nobody inspects the spammish repetition".encode('utf-8')).hexdigest()) # sha224加密

2.7 正则表达式

字符串封装的方法，处理一般的字符串操作，还能应付。但是，稍微复杂点的字符串处理任务，需要靠正则表达式，简洁且强大。

Python中的正则，是通过模块re来支持的，因此使用正则表达式时，要先import re导入re模块。

首先，认识常用的元字符

. 匹配除 “\n” 和 “\r” 之外的任何单个字符。
^ 匹配字符串开始位置
$ 匹配字符串中结束的位置
* 前面的原子重复 0 次、1 次、多次
? 前面的原子重复 0 次或者 1 次
+ 前面的原子重复 1 次或多次
{n} 前面的原子出现了 n 次
{n,} 前面的原子至少出现 n 次
{n,m} 前面的原子出现次数介于 n-m 之间
( ) 分组，输出需要的部分

再认识常用的通用字符：

\s 匹配空白字符
\w 匹配任意字母/数字/下划线
\W 和小写 w 相反，匹配任意字母/数字/下划线以外的字符
\d 匹配十进制数字
\D 匹配除了十进制数以外的值
[0-9] 匹配一个 0~9 之间的数字
[a-z] 匹配小写英文字母
[A-Z] 匹配大写英文字母

正则表达式，常会涉及到以上这些元字符或通用字符。

2.7.1 匹配

使用正则模块，search 方法，返回最早匹配的位置

import re

s = 'Life is short, I use Python'
pattern = 'Python'
r = re.search(pattern, s)
print(r.span())  # (21, 27)

其实，正则模块中还有一个match方法，不过它只会从主串的第一个字符开始匹配。第一个字符不匹配就返回None。

recom = re.compile('Python')
print(recom.match(s))  # 返回 None，找不到匹配，match只能匹配Python开头的字符串

findall查找出子串的所有匹配

import re

s = "当月最后一天:2019-12-31"
pattern = r"\d+"
r = re.findall(pattern, s)
print(r)

finditer返回匹配的迭代器

findall如果匹配的数据太多，可能导致内存问题。可以使用finditer方法，返回一个迭代器，通过迭代器里面的对象 re.Match的 span 找出匹配位置。

import re

s = "当月最后一天:2019-12-31"
pattern = r"\d+"
r = re.finditer(pattern, s)
for i in r:
    print(i.span())

如果打算一个模式可以被多次使用，那么可以提前将模式pattern编译成对象，另外，优先编译成正则对象，然后再进行匹配，这样程序的效率更高。例如下面这样：

import re

s = "当月最后一天:2019-12-31"
pattern = re.compile(r"\d+")  # 编译成模式对象，以后可以多次使用
r = pattern.findall(s)
print(r)

s2 = "我的生日是：1990-12"
print(pattern.findall(s2))

匹配浮点数和整数

? 表示前一个字符匹配 0 或 1 次
\.? 表示匹配小数点（.）0 次或 1 次。注意要叫一个反斜杠，表示后面的是小数点，而不是正则中的.。

import re

s = "The most popular tools for Python development are PyCharm and VScode. The combined share of the PyCharm Community and Professional editions is 33%. And VS Code has experienced rapid growth. It started with 7.1% in 2017 and achieved 24% in 2019."
pattern = re.compile(r"\d+\.?\d*")  # \d+表示至少一个数字，\d*表示0个、1个或多个数字
r = pattern.findall(s)
print(r)

写出匹配所有正整数正则表达式。

import re

s = [-16, 1.5, 11.43, 10, 5, 0]

pattern_1 = r"^\d*$"  # 匹配到[10, 5, 0]，多了0
print([i for i in s if re.match(pattern_1, str(i))])

pattern_2 = r"^[1-9]\d*"  # 匹配到 [1.5, 11.43, 10, 5]，多了小数点，理解$，完全匹配的作用
print([i for i in s if re.match(pattern_2, str(i))])

pattern_2 = r"^[1-9]\d*$"  # 正确
print([i for i in s if re.match(pattern_2, str(i))])   # 正则只能用到字符串上，所以str()

找出字符串中所有字符 t 或 T 的位置，不区分大小写。

import re

s = "Selenium automates browsers. That's it!"
pattern = re.compile(r't')
print([i.span() for i in pattern.finditer(s, re.I)])  # [(11, 12), (15, 16), (32, 33), (37, 38)]

2.7.2 分割

如果一个规则简单的字符串，直接使用字符串，split 函数。

如下requests入门文档网址字符串，可以很方便通过split方法根据分割符 / 进行分割：

s = 'https://requests.readthedocs.io/en/master/user/quickstart/'
s.split('/')  # ['https:', '', 'requests.readthedocs.io', 'en', 'master', 'user', 'quickstart', '']

对于分隔符很复杂的字符串，split 函数就无能为力。这时就要用正则分割了。通过包含多个空格的句子中，单词个数，就用这个方法。

import re

s = 'This,,,   module ; \t   provides|| regular ; '  # 这里的分割符有, 空白(空格和制表符\t)，|
pattern = r'[,\s;|]+'  #多个分割符放到[]括号中，+表示1个或多个前面的那些分割符，\s表示空白字符
words = re.split(pattern, s)
print(words)

2.7.3 替换

正则模块，sub 方法，替换匹配到的子串：

import re

content = "Life is short, I love Python, Python is the best programming language!"
pattern = re.compile('Python')  # 编译模式串
substitution = pattern.sub('PHP', content)  # 替换
print(substitution)

2.7.4 compile 预编译

如果要用同一匹配模式，做很多次匹配，可以使用 compile 预先编译串。

案例：从一系列字符串中，挑选出所有正浮点数。

import re

s = [-16, 'good', 1.5, 0.2, -0.1, '11.43', 10, '5e10']
rec = re.compile(r'^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$')
print([i for i in s if rec.match(str(i))])  # 直接使用 rec，匹配列表中的每个元素，不用每次都预编译正则表达式，效率更高。

2.7.5 贪婪模式与非贪婪模式

现在想要在网页中提取 div 标签中的内容，需要用到括号()。

import re

content = """正则表达式谈贪婪模式与非贪婪模式贪婪模式
非贪婪模式
"""
pattern_1 = r"(.*)
"  # 贪婪模式，尽量多吃
r = re.findall(pattern_1, content)  # ['贪婪模式

非贪婪模式']
print(r)
pattern_2 = r"(.*?)
"  # 非贪婪模式，少吃多餐
r = re.findall(pattern_2, content)   # ['贪婪模式', '非贪婪模式']
print(r)

使用一对 () 去获取我们想要的部分。

(.*) 表示捕获任意多个字符，尽可能一次性地匹配更多字符，也被称为贪婪模式。尽量匹配更长的结果。
(.*?)被称为非贪婪模式。尽量匹配更多的结果。

2.8 面试题

从字符串 "https://httpbin.org/get?key1=value1 &key2=value2& key2=value3"中，提取出所有的参数键值对。

import re
s = "https://httpbin.org/get?key1=value1 &key2=value2& key2=value3"
pattern = re.compile(r"[?&\s]+")
print(pattern.split(s)[1:])

如何判断一个URI是一个图片的地址，我们假设以http或者https开头，以合法的图片后缀名结尾的URI就是合法的图片地址。

比如https://requests.readthedocs.io/zh_CN/latest/_static/requests-sidebar.png就是合法的图片地址，因为是以png图片格式结尾的。https://farm5.staticflickr.com/4259/35163667010_8bfcaef274_k_d.jpg也是。

def is_network_picture(uri):
    if uri.endswith((".png", ".jpg", ".svg")) and uri.startswith(("http", "https")):
        return True
    else:
        return False

提取字符串"urllib3 [required: <1.23,>=1.21, installed: 1.22]"中所有的版本号。

import re

s = "urllib3 [required: <1.23,>=1.21, installed: 1.22]"
pattern = re.compile(r'(\d+.\d+)')

print(pattern.findall(s))

将字符串"pipenv is released at 5/28/2020" 中的日志改成2020-5-28这种格式。

import re

s = "pipenv is released at 5/28/2020"
pattern = re.compile(r'(\d+)/(\d+)/(\d+)')  # 三个匹配组，第一个是月，第二个是日子，第三个是年份

print(pattern.sub(r'\3-\1-2', s))  # 反斜杠加数字形式，表示匹配组的第一个，例如\3表示匹配组的第三个

删除文本文件中每一行文本前后的空白字符。

with open(filename) as f:
    for line in f:
        line.strip()

将一个句子中的所有单词位置反转。例如"Requests is an elegant and simple HTTP library for Python" 句子反转后是"Python for library HTTP simple and elegant an is Requests"。

s = "Requests is an elegant and simple HTTP library for Python"
print(" ".join(s.split(' ')[::-1]))

求字符串中最后一个单词的长度，单词之间用空格隔开。

len(s.split(' ')[-1])

有两个字符串，请从第一个字符串中删除第二个字符串中的字符。例如第一个字符串是"What you do with that power is entirely up to you."，第二个字符串是"aeio"。

first_str = "What you do with that power is entirely up to you."
second_str = "aeio"

for s in second_str:
    for f in first_str:
        if s == f:
            first_str = first_str.replace(s, "")

print(first_str)

定义一个函数 f(s)，其中传入参数 s 是一个非空字符串；该函数的功能是统计 s 中（按字典序比较）最小字母的出现频次。

def count_smallest_char(s: str) -> int:
    s = sorted(s)
    return s.count(s[0])

将一个字符串中每个单词的首字母大写，其他字目小写。例如：" aBc dEf " -> “Abc Def”.

' '.join(x.capitalize() for x in s.split())

可以参考Python内置的string.py模块中的capwords函数的实现。

你可能感兴趣的:(Python,python)

第一章Pandas快速入门 Hajo_ 深入浅出Pandas学习代码 python pandas
《深入浅出Pandas》第一章代码数据来源：https://www.gairuo.com/file/data/dataset/team.xlsximportnumpyasnpimportpandasaspdfile_path='E:\\Data_python\\anconda_code\\Dive_into_Pandas\\data_files\\'team_path='team.xlsx'tea
Python实例题：基于 Python 的简单文件管理器狐凄实例 python 开发语言前端
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于Python的简单文件管理器要求：使用Python构建一个简单的文件管理器，支持以下功能：浏览文件和目录创建、删除、重命名文件和目录复制、移动文件和目录查看文件属性和内容搜索文件和目录使用tkinter构建图形用户界面。支持基本的文件操作权限检查。解题思路：使用os和shutil模块进行文件操作。通过tkinter构建用
c++ python 共享内存 qianbo_insist 音视频和c++java 物联网 c++c++python 开发语言
一、目的是为了c++来读取并解码传递给python，Python做测试非常方便，c++和python之间必须定好协议，整体使用c++来解码，共享内存传递给python二、主类主类，串联decoder，注意decoder并没有直接在显存里面穿透，是解码以后传递给内存，从内存传给python#pragmaonce#define__STDC_CONSTANT_MACROS#defineSDL_MAIN_
Python 数据分析与可视化 Day 14 - 建模复盘 + 多模型评估对比（逻辑回归 vs 决策树）蓝婷儿 python python 数据分析逻辑回归
✅今日目标回顾整个本周数据分析&建模流程学会训练第二种模型：决策树（DecisionTree）掌握多模型对比评估的方法与实践输出综合对比报告：准确率、精确率、召回率、F1等指标为后续模型调优与扩展打下基础一、本周流程快速回顾步骤内容第1天高级数据操作（索引、透视、变形）第2天缺失值和异常值处理第3天多表合并与连接第4天特征工程（编码、归一化、时间）第5天数据集拆分（训练集/测试集）第6天逻辑回归模
Django5.1（91）—— 如何删除一个 Django 应用小天的铁蛋儿 django Python django python 后端
如何删除一个Django应用Django提供了将一组功能组织成名为应用程序的Python包的能力。当需求发生变化时，应用程序可能会变得过时或不再需要。以下步骤将帮助你安全地删除一个应用程序。删除所有与该应用程序相关的引用（导入、外键等）。从相应的models.py文件中删除所有模型。通过运行makemigrations来创建相关的迁移。这一步会生成一个迁移，用于删除已删除模型的表，以及与这些模型相
【python实用小脚本-125】基于 Python 的 Gmail 邮件发送工具：实现高效邮件自动化 Kyln.Wu Python python 自动化网络
引言在现代办公和开发环境中，邮件通信是一种重要的沟通方式。自动化发送邮件可以大大提高工作效率，例如发送通知、报告或文件。本文将介绍一个基于Python的Gmail邮件发送工具，它能够通过Gmail的SMTP服务器发送邮件，并支持附件功能。该工具主要利用了Python的smtplib库和email库，结合了邮件构建和网络通信技术，为用户提供了一个简单易用的邮件发送解决方案。总体功能概述Gmail邮件
Python之聚合函数 _AndyLau 手把手学python python
Python聚合函数文章目录Python聚合函数聚合函数使用多个聚合函数结合`annotate`和`values`进行分组聚合注意事项F表达式和Q表达式F表达式Q表达式注意事项视图HTML中的表单概述Django中表单概述ModelForm关键点使用示例创建ModelForm在视图中使用ModelForm模板总结Cookie和SessionDjango中的Cookie操作Django中的Sessi
Python报错信息归类以及处理
ʕᵔᴥᵔʔPython的错误和异常可以分为多个类别，了解这些类别有助于更好地调试和处理错误。以下是Python中常见报错信息的归类和分析。1.语法错误(SyntaxError)在代码执行前被解析器捕获的错误，通常是由于代码不符合Python语法规则。常见子类：IndentationError：缩进错误TabError：Tab和空格混用示例：#缺少冒号ifTrueprint("Hello")#Syn
python 获取mac地址 Take_a_chestnut python 小工具 python 开发语言
python获取mac地址方法一：使用socket库使用了socket库中的ioctl函数和fcntl模块来获取MAC地址importsocketimportfcntlimportstructdefget_mac_address():interface='eth0'#替换为你的网络接口名称，例如eth0或en0sock=socket.socket(socket.AF_INET,socket.SOC
LRU缓存算法在搜索引擎中的应用数据结构与算法学习缓存算法搜索引擎 ai
LRU缓存算法在搜索引擎中的应用关键词：LRU算法、缓存淘汰、搜索引擎、哈希表、双向链表、性能优化、访问频率摘要：本文深入探讨了LRU(最近最少使用)缓存算法在搜索引擎中的关键应用。我们将从基本概念出发，通过生活化的比喻解释LRU的工作原理，分析其在搜索引擎架构中的具体实现方式，并通过Python代码示例展示如何构建一个高效的LRU缓存系统。文章还将讨论LRU算法的数学建模、实际应用场景以及未来发
60天python训练计划----day59
在之前的学习中，我们层层递进的介绍了时序模型的发展，从AR到MA到ARMA，再到ARIMA。本质就是把数据处理的操作和模型结合在一起了，实际上昨天提到的季节性差分也可以合并到模型中，让流程变得更加统一。季节性差分用S来表示，所以这个模型叫做SARIMA模型一、SARIMA模型SARIMA(SeasonalAutoRegressiveIntegratedMovingAverage)是标准ARIMA模
【python实用小脚本-128】基于 Python 的 Hacker News 爬虫工具：自动化抓取新闻数据 Kyln.Wu Python python 爬虫自动化
引言在技术社区中，HackerNews是一个汇聚最新技术文章和讨论的热门平台。许多开发者和技术爱好者依赖它来获取行业动态和前沿资讯。然而，手动浏览和筛选这些文章可能耗时且低效。本文将介绍一个基于Python的HackerNews爬虫工具，它能够自动化地从HackerNews网站抓取最新文章，并将结果保存为CSV文件。该工具主要利用了Python的requests、BeautifulSoup和csv
python系列之：使用md5和sha256完成签名认证，调用接口快乐骑行^_^ 前端和后端开发 python系列使用md5和sha256 完成签名认证调用接口
python系列之：使用md5和sha256完成签名认证，调用接口MD5签名和sha256签名认证md5认证代码sha256认证代码拼接签名生成签名拼接url调用接口MD5签名和sha256签名认证MD5签名认证算法特性：生成128位(16字节)的哈希值计算速度快已被证明存在碰撞漏洞(不同输入可能产生相同输出)签名认证流程：发送方对原始数据计算MD5哈希值将哈希值附加到数据中发送接收方重新计算接收
Kafka系列之：不删除Kafka Topic，清理Kafka Topic中的数据快乐骑行^_^ Kafka Kafka系列不删除Kafka Topic 清理Kafka Topic数据
Kafka系列之：不删除KafkaTopic，清理KafkaTopic中的数据一、需求二、Java删除Topic中数据三、python删除Topic中数据一、需求需要清理topic中的数据但是不能通过删除topic删除数据，则采取基于topic的offset删除topic中的数据二、Java删除Topic中数据HashMapdeleteRecords=newHashMap<>();这一行创建了一个
python模拟行星运动_动态模拟运行太阳系的行星运转
在地理学科中，都要学习认识太阳系的知识，对于天体的运动，没有动态演示的话，学生们只能凭空想象，无法观看到九大行星之间到底是如何运转的。几何画板作为人教版指定教育软件，被老师们广泛用于教学中，不仅仅可以用来演示几何图形，还可以应用在地理学科中演示天体运动情况，下面就给大家介绍利用几何画板制作的动态模拟运行太阳系的九大行星课件。几何画板动态模拟运行太阳系的九大行星课件样图：几何画板课件模板——动态模拟
如何用 Python 实现模拟木星的运行轨道、自转、公转 wh3933 python 开发语言
用Python来模拟木星的轨道运行、自转和公转是一个非常有趣且富有挑战性的项目。这需要结合天文学知识和编程技巧。我们将使用VPython这个库来实现这个模拟。VPython非常适合创建简单的3D物理场景和动画，它的语法直观，能够让我们快速地将物理概念转化为可视化的三维模型。在开始之前，请确保您已经安装了VPython。如果尚未安装，可以通过pip进行安装：pipinstallvpython模拟思路
python输出小郭爱吃糖 python 开发语言
Python基础1.1基本的输出函数内置的函数print语法：print(输出内容)print()函数完整的语法格式print(value,……,sep="",end="\n",file=None)示例：a=50b=100print(90)print(a)print(a*b)print('HelloWorld')print("HelloWorld")print("""HelloWorld""")1
Python 中 Pendulum 库的详细使用：更精确的日期时间处理数据知道 python3案例和总结 python 开发语言 Pendulum库
文章目录一、Pendulum概述1.1Pendulum介绍1.2安装Pendulum1.3注意事项二、基本使用2.1创建Pendulum对象2.2格式化输出2.3时间运算三、高级使用3.1时区处理3.2时间间隔3.3日期比较四、实际应用案例4.1日志时间处理4.2会议时间提醒4.3工作日计算4.4Pendulum与datetime互操作一、Pendulum概述1.1Pendulum介绍Pendul
python库 arrow 库的各种案例的使用详解（更人性化的日期时间处理）数据知道 python3案例和总结 python 开发语言时间处理
文章目录一、arrow概述1.1arrow介绍1.2安装arrow1.3注意事项二、基本使用2.1创建Arrow对象2.2格式化输出2.3时间运算三、高级功能3.1时区处理3.2时间范围3.3时间间隔四、实际应用案例4.1日志时间处理4.2会议时间提醒4.3国际化时间显示5.Arrow与datetime互操作一、arrow概述1.1arrow介绍Arrow是一个Python库，提供了比标准库dat
python 魔法方法常用_Python魔法方法指南 weixin_39603505 python 魔法方法常用
有很多人说学习Python基础之后不知道干什么，不管你是从w3c还是从廖雪峰的教程学习的，这些教程都有一个特点：只能引你快速入门，但是有关于Python的很多基础内容这些教程中都没介绍，而这些你没学习的内容会让你在后期做项目的时候非常困惑。就比如下面这篇我要给大家推荐的文章所涉及的内容，不妨你用一天时间耐心看完，把代码都敲上一遍。--11：33更新--很多人想要我的一份学习笔记，所以在魔法指南之前
Python 基础入门第十三讲魔法方法补充、单例模式、reflect反射（getattr、hasattr、__import__()）
第十三讲一、特殊成员和魔法方法在之前的课程中已经学习过如__init__、__str__、__dir__等魔法方法，现补充一些常用的魔法方法：1.__doc__魔法方法该魔法方法的作用为打印类的说明文档，举个例子：print(str().__doc__)###输出结果为：str(object='')->strstr(bytes_or_buffer[,encoding[,errors]])->str
python魔法方法长文详解千翻娃儿 python原生基础 python
python魔法方法详解1.什么是魔法方法魔法方式（Magicmethods）是python的内置函数，一般以双下划线开头和结尾，比如__add__,__new__等。每个魔法方法都有对应的一个内置函数或者运算符。当我们个对象使用这些方法时，相当于对这个对象的这类方法进行重写（如运算符重载）。魔法方法的存在是对类或函数进行了提炼，供python解释器直接调用。当使用len(obj)时，实际上调用的
微信聊天记录监听与转发工具明天过后0122 高效办公微信
以下是基于您需求撰写的《微信聊天记录监听与转发工具需求分析开发文档》：微信聊天记录监听与转发工具需求分析开发文档一、项目概述1.1目标开发基于wxauto的自动化工具，实现：实时监听指定微信聊天窗口（群组/个人）捕获并处理新消息按指定策略转发至目标用户"元宝"确保操作间隔符合10秒限制1.2技术栈核心框架：Python3.8+微信自动化：wxauto_custom(基于wxauto的定制版本)并发
Python built-in types - Numeric Types LorgSher Python笔录 python
Python内建类型之数值类型-整数、浮点数和复数ManualTherearethreedistinctnumerictypes:integers,floatingpointnumbers,andcomplexnumbers.Inaddition,Booleansareasubtypeofintegers.Integershaveunlimitedprecision.Floatingpointnu
深入理解 Python 中的异步操作：async 和 await | python小知识
一、深入理解Python中的异步操作：async和await引言在现代编程中，异步操作是一个非常重要的概念，尤其是在处理I/O密集型任务时。使用异步操作可以显著提高程序的性能和响应速度。Python提供了async和await关键字，使得编写异步代码变得更加直观和简洁。在这篇文章中，我们将深入探讨Python的异步操作，并通过实际代码示例来说明其使用方法。目录什么是异步操作？Python中的异步编
python :built-in functions angry_grina python
今天研究下python的内建函数：Built-inFunctionsabs()divmod()input()open()staticmethod()all()enumerate()int()ord()str()any()eval()isinstance()pow()sum()basestring()execfile()issubclass()print()super()bin()file()ite
Python标准库The Python Standard Library GarfieldEr007 Python Python 标准库 Standard Library
WhileThePythonLanguageReferencedescribestheexactsyntaxandsemanticsofthePythonlanguage,thislibraryreferencemanualdescribesthestandardlibrarythatisdistributedwithPython.Italsodescribessomeoftheoptionalc
Python operator - Standard operators as functions Yongqiang Cheng Python 3 -Python 2 -Cython Python operator operators functions
Pythonoperator-Standardoperatorsasfunctions1.MappingOperatorstoFunctions2.In-placeOperatorsReferenceshttps://docs.python.org/3/library/operator.htmlTheoperatormoduleexportsasetofefficientfunctionscorr
使用 Python 在 Word 文档中插入数学公式 - 详解 nuclear2011 Python Word python 插入数学公式到Word文档添加数学表达式到Word文档给Word文档添加数学公式 MathML数学公式 LaTeX数学公式
目录为什么在Word文档中插入数学公式？环境准备如何使用Python在Word文档中插入数学公式方法一：使用EQ域插入数学公式方法二：通过LaTeX和MathML插入复杂数学公式总结在金融、工程、教育和科研等专业领域的文档中常常需要包含复杂且精确的数学公式。将数学公式直接嵌入文档中，不仅能够提升文档的专业水准，还能实现公式的自动更新和动态计算，从而有效提升工作效率和内容的准确性。本文将介绍如何使用
【雕爷学编程】MicroPython手册之 ESP32-CAM 机器人目标跟踪驴友花雕机器人目标跟踪人工智能嵌入式硬件 python MicroPython ESP32-CAM
MicroPython是为了在嵌入式系统中运行Python3编程语言而设计的轻量级版本解释器。与常规Python相比，MicroPython解释器体积小(仅100KB左右)，通过编译成二进制Executable文件运行，执行效率较高。它使用了轻量级的垃圾回收机制并移除了大部分Python标准库，以适应资源限制的微控制器。MicroPython主要特点包括:1、语法和功能与标准Python兼容,易学
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不