garnetreds7

Python爬虫基础-5（正则表达式）

正则表达式基础

Python支持的正则表达式元字符和语法：

语法

语法	说明	表达式实例	完整匹配的字符串
	字符
一般字符	匹配自身	abc	abc
.	匹配除换行符”\n”之外的任意字符	a.c	abc
\	转义字符，使后一个字符改变原来的意思	a\\c	a\c
[…]	1、字符集。对应的位置可以是字符集中的任意字符。	a[bcd]e	abe
	2、字符集中的字符可以逐个列出，也可以给出范围，如[abc]或[a-c]。		ace
	3、第一个字符如果是^表示取反，如[^abc]表示不是abc的其他字符。		ade
	4、所有特殊字符在字符集中都失去原有的特殊含义
	5、在字符集中如果使用]、-、^时，可以在前面加上反斜杠
	或把 ]、-放在第一个字符，把^放在非第一个字符
	预定义字符集（可写在字符集[…]中）
\d	数字：[0-9]	a\dc	a1c
\D	非数字：[^\d]	a\Dc	abc
\s	空白字符：[<空格>\t\r\n\f\v]	a\sc	a c
\S	非空白字符：[^\s]	a\Sc	abc
\w	单词字符：[A-Za-Z0-9_]	a\wc	a_c
\W	非单词字符：[^\w]	a\Wc	a c
	数量词（用在字符或(…)之后）
*	匹配前一个字符0次或无限次	abc*	ab or abccc
+	匹配前一个字符1次或无限次	abc+	abc or abccc
?	匹配前一个字符0次或1次	abc?	ab or abc
{m}	匹配前一个字符m次	a{3}bc	aaabc
{m,n}	匹配前一个字符m至n次.省略m即{,n},匹配0到n次,省略n即{m,},匹配m到无限次	a{1,2}bc	abc or aabc
*? +? ?? {m,n}?	使*、+、?、{m,n}变成非贪婪模式
	边界匹配（不消耗待匹配字符串中的字符）
^	匹配字符串的开头，在多行模式中匹配每一行的开头	^abc	abc
$	匹配字符串的末尾，在多行模式中匹配每一行的末尾	$abc	abc
\A	仅匹配字符串开头	\Aabc	abc
\Z	仅匹配字符串末尾	abc\Z	abc
\b	匹配\w和\W之间,即单词字符和非单词字符之间,例如单词和空格间的位置	a\b!bc	a!bc
\B	[^\b]	a\Bbc	abc
	逻辑、分组
\|	\|代表左右表达式任意匹配一个。先尝试匹配左边的表达式，成功则跳过匹配。	abc\|def	abc
	如果\|没有被包含在()中,则它的范围是整个正则表达式		def
(…)	1、被括起来的表达式将作为分组，从表达式左边开始每遇到一个	(abc){2}	abcabc
	分组的左括号’(‘，编号+1。	a(123\|456)c	a123c
	2、分组作为一个整体，可以后接数量词。
	3、表达式中的\|仅在该分组中有效
(?P< name>…)	分组，除了原有的编号外再指定一个额外的别名	(?P< id>abc){2}	abcabc
\< number>	引用编号为< number>的分组匹配到的字符串	(\d)abc\1	1abc1 or 7abc7
(?P=name)	引用别名为< name>的分组匹配到的字符串	(?P< id>\d)abc(?P=id)	1abc1 or 7abc7
	特殊构造（不作为分组）
(?:…)	(…)的不分组版本，用于使用\|或后接数量词	(?:abc){2}	abcabc
(?:iLmsux)	iLmsux的每个字符代表一个匹配模式，只能用在正则表达式的开头	(?i)abc	AbC
	可选多个
(?#…)	后的内容将作为注释被忽略	abc(?#comment)123	abc123
(?=…)	之后的字符串内容需要匹配表达式才能成功匹配,不消耗字符串内容	a(?=\d)	后面是数字的a
(?!…)	之后的字符串内容需要不匹配表达式才能成功匹配,不消耗字符串内容	a(?!\d)	后面不是数字的a
(?<=…)	之前的字符串内容需要匹配表达式才能成功匹配,不消耗字符串内容	(?<=\d)a	前面是数字的a
(?	之前的字符串内容需要不匹配表达式才能成功匹配,不消耗字符串内容	(?	前面不是数字的a
(?(id/name)yes-pattern\|no-pattern)	如果编号为id或者别名为name的分组匹配到字符，则需要匹配yes-pattern，	(\d)abc(?(1)\d\|abc)	1abc2
	否则需要匹配no-pattern。no-pattern可以省略。		abcabc

数量词的贪婪与非贪婪模式

贪婪模式总是尝试匹配尽可能多的字符，非贪婪模式总是尝试匹配尽肯能少的字符，在Python中，数量词默认是贪婪的。
如：”ab*”用于查找abbbc，将找到abbb，”ab*?”将找到a。

re模块

python通过re模块支持正则表达式
使用re一般步骤为：

1.先将正则表达式的字符串形式编译为Pattern实例
2.然后使用Pattern实例处理文本并获取匹配的结果（一个Match实例）
3.最后使用Match实例获得信息，进行其他的操作

# -*- coding: utf-8 -*-
#一个简单的re实例，匹配字符串中的hello字符串  

import re #导入re模块 

# 将正则表达式编译成Pattern对象，注意hello前面的r的意思是“原生字符串” 
pattern = re.compile(r'hello')  

# 使用Pattern匹配文本，获得匹配结果，无法匹配时将返回None 
match1 = pattern.match('hello world!') 
match2 = pattern.match('helloo world!') 
match3 = pattern.match('helllo world!')  

#如果match1匹配成功  
if match1:
    # 使用Match获得分组信息  
    print match1.group()  
else:  
    print 'match1匹配失败！'  

#如果match2匹配成功  
if match2:  
    # 使用Match获得分组信息  
    print match2.group()  
else:  
    print 'match2匹配失败！'  

#如果match3匹配成功  
if match3:  
    # 使用Match获得分组信息  
    print match3.group()  
else:  
    print 'match3匹配失败！'

compile

re.compile(strPattern[, flag]):
这个方法是Pattern类的工厂方法，用于将字符串形式的正则表达式编译为Pattern对象。第二个参数flag是匹配模式，取值可以使用按位或运算符’|’表示同时生效，比如re.I | re.M。另外，也可以在regex字符串中指定模式，比如re.compile(‘pattern’, re.I | re.M)与re.compile(‘(?im)pattern’)是等价的。
可选值有：

re.I(全拼：IGNORECASE): 忽略大小写（括号内是完整写法，下同）
re.M(全拼：MULTILINE): 多行模式，改变’^’和’$’的行为（参见上表）
re.S(全拼：DOTALL): 点任意匹配模式，改变’.’的行为
re.L(全拼：LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
re.U(全拼：UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
re.X(全拼：VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释。

以下两个正则表达式是等价的：

# -*- coding: utf-8 -*-  
#两个等价的re匹配,匹配一个小数  
import re  

a = re.compile(r"""\d +  # the integral part 
                   \.    # the decimal point 
                   \d *  # some fractional digits""", re.X)  

b = re.compile(r"\d+\.\d*")

re模块还提供了一个方法escape(string)，用于将string中的正则表达式元字符如*/+/?等之前加上转义符再返回

Match

Match对象是一次匹配的结果，包含了很多关于此次匹配的信息，可以使用Match提供的可读属性或方法来获取这些信息。
属性：

1.string: 匹配时使用的文本
2.re: 匹配时使用的Pattern对象。
3.pos: 文本中正则表达式开始搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
4.endpos: 文本中正则表达式结束搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
5.lastindex: 最后一个被捕获的分组在文本中的索引。如果没有被捕获的分组，将为None。
6.lastgroup: 最后一个被捕获的分组的别名。如果这个分组没有别名或者没有被捕获的分组，将为None。

方法：

1.group([group1, …])：获得一个或多个分组截获的字符串；指定多个参数时将以元组形式返回。group1可以使用编号也可以使用别名；编号0代表整个匹配的子串；不填写参数时，返回group(0)；没有截获字符串的组返回None；截获了多次的组返回最后一次截获的子串。
2.groups([default])：以元组形式返回全部分组截获的字符串。相当于调用group(1,2,…last)。default表示没有截获字符串的组以这个值替代，默认为None。
3.groupdict([default])：返回已有别名的组的别名为键、以该组截获的子串为值的字典，没有别名的组不包含在内。default含义同上。
4.start([group])：返回指定的组截获的子串在string中的起始索引（子串第一个字符的索引）。group默认值为0。
5.end([group])：返回指定的组截获的子串在string中的结束索引（子串最后一个字符的索引+1）。group默认值为0。
6.span([group])：返回(start(group), end(group))。
7.expand(template)：将匹配到的分组代入template中然后返回。template中可以使用\id或\g< id>、\g< name>引用分组，但不能使用编号0。\id与\g< id>是等价的；但\10将被认为是第10个分组，如果你想表达\1之后是字符’0’，只能使用\g<1>0。

# -*- coding: utf-8 -*-  
#一个简单的match实例  

import re  
# 匹配如下内容：单词+空格+单词+任意字符  
m = re.match(r'(\w+) (\w+)(?P.*)', 'hello world!')  

print "m.string:", m.string  
print "m.re:", m.re  
print "m.pos:", m.pos  
print "m.endpos:", m.endpos  
print "m.lastindex:", m.lastindex  
print "m.lastgroup:", m.lastgroup  

print "m.group():", m.group()  
print "m.group(1,2):", m.group(1, 2)  
print "m.groups():", m.groups()  
print "m.groupdict():", m.groupdict()  
print "m.start(2):", m.start(2)  
print "m.end(2):", m.end(2)  
print "m.span(2):", m.span(2)  
print r"m.expand(r'\g<2> \g<1>\g<3>'):", m.expand(r'\2 \1\3')  

### output ###  
# m.string: hello world!  
# m.re: <_sre.SRE_Pattern object at 0x016E1A38>  
# m.pos: 0  
# m.endpos: 12  
# m.lastindex: 3  
# m.lastgroup: sign  
# m.group(1,2): ('hello', 'world')  
# m.groups(): ('hello', 'world', '!')  
# m.groupdict(): {'sign': '!'}  
# m.start(2): 6  
# m.end(2): 11  
# m.span(2): (6, 11)  
# m.expand(r'\2 \1\3'): world hello!

Pattern

Pattern对象是一个编译好的正则表达式，通过Pattern提供的一系列方法可以对文本进行匹配查找。Pattern不能直接实例化，必须使用re.compile()进行构造，也就是re.compile()返回的对象。Pattern提供了几个可读属性用于获取表达式的相关信息：

1.pattern: 编译时用的表达式字符串。
2.flags: 编译时用的匹配模式。数字形式。
3.groups: 表达式中分组的数量。
4.groupindex: 以表达式中有别名的组的别名为键、以该组对应的编号为值的字典，没有别名的组不包含在内。

# -*- coding: utf-8 -*-  
#一个简单的pattern实例  

import re  
p = re.compile(r'(\w+) (\w+)(?P.*)', re.DOTALL)  

print "p.pattern:", p.pattern  
print "p.flags:", p.flags  
print "p.groups:", p.groups  
print "p.groupindex:", p.groupindex  

### output ###  
# p.pattern: (\w+) (\w+)(?P.*)  
# p.flags: 16  
# p.groups: 3  
# p.groupindex: {'sign': 3}

pattern的实例方法及其使用：

match

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags])：

这个方法将从string的pos下标处起尝试匹配pattern,如果pattern结束时仍可匹配，则返回一个Match对象；如果匹配过程中pattern无法匹配，或者匹配未结束就已到达endpos，则返回None。

pos和endpos的默认值分别为0和len(string)；

注意：这个方法并不是完全匹配。当pattern结束时若string还有剩余字符，仍然视为成功。想要完全匹配，可以在表达式末尾加上边界匹配符’$’。

# encoding: UTF-8  
import re  

# 将正则表达式编译成Pattern对象  
pattern = re.compile(r'hello')  

# 使用Pattern匹配文本，获得匹配结果，无法匹配时将返回None  
match = pattern.match('hello world!')  

if match:  
    # 使用Match获得分组信息  
    print match.group()  

### 输出 ###  
# hello

search

search(string[, pos[, endpos]]) | re.search(pattern, string[, flags]):

这个方法用于查找字符串中可以匹配成功的子串。从string的pos下标处起尝试匹配pattern，如果pattern结束时仍可匹配，则返回一个Match对象；若无法匹配，则将pos加1后重新尝试匹配；直到pos=endpos时仍无法匹配则返回None。pos和endpos的默认值分别为0和len(string))。

和match的区别:

match()函数只检测re是不是在string的开始位置匹配；
search()会扫描整个string查找匹配。

match()只有在0位置匹配成功的话才有返回，如果不是开始位置匹配成功的话，match()就返回none
例如：
print(re.match(‘super’, ‘superstition’).span())
会返回(0, 5)
print(re.match(‘super’, ‘insuperable’))
则返回None

search()会扫描整个字符串并返回第一个成功的匹配
例如：
print(re.search(‘super’, ‘superstition’).span())
返回(0, 5)
print(re.search(‘super’, ‘insuperable’).span())
返回(2, 7)

split

split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]):

按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数，不指定将全部分割。

import re  

p = re.compile(r'\d+')  
print p.split('one1two2three3four4')  

### output ###  
# ['one', 'two', 'three', 'four', '']

findall

findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]):

搜索string，以列表形式返回全部能匹配的子串。

import re  

p = re.compile(r'\d+')  
print p.findall('one1two2three3four4')  

### output ###  
# ['1', '2', '3', '4']

finditer

finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags]):

搜索string，返回一个顺序访问每一个匹配结果（Match对象）的迭代器。

import re  

p = re.compile(r'\d+')  
for m in p.finditer('one1two2three3four4'):  
    print m.group(),  

### output ###  
# 1 2 3 4

sub

sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]):

使用repl替换string中每一个匹配的子串后返回替换后的字符串。
当repl是一个字符串时，可以使用\id或\g< id>、\g< name>引用分组，但不能使用编号0。当repl是一个方法时，这个方法应当只接受一个参数（Match对象），并返回一个字符串用于替换（返回的字符串中不能再引用分组）。count用于指定最多替换次数，不指定时全部替换。

import re  

p = re.compile(r'(\w+) (\w+)')  
s = 'i say, hello world!'  

print p.sub(r'\2 \1', s)  

def func(m):  
    return m.group(1).title() + ' ' + m.group(2).title()  

print p.sub(func, s)  

### output ###  
# say i, world hello!  
# I Say, Hello World!

subn

subn(repl, string[, count]) |re.sub(pattern, repl, string[, count]):

返回 (sub(repl, string[, count]), 替换次数)。

import re  

p = re.compile(r'(\w+) (\w+)')  
s = 'i say, hello world!'  

print p.subn(r'\2 \1', s)  

def func(m):  
    return m.group(1).title() + ' ' + m.group(2).title()  

print p.subn(func, s)  

### output ###  
# ('say i, world hello!', 2)  
# ('I Say, Hello World!', 2)

python做个游戏辅助_8个用于辅助项目的出色Python库 cumj63710 数据库 python java 大数据编程语言
python做个游戏辅助在Python/Django世界中我们有一句俗语：我们是为语言而来的，而是为社区而留下的。对我们大多数人来说都是如此，但是让我们留在Python世界中的另一件事是，有了一个想法并在午餐或晚上几个小时内快速地解决它是多么容易。本月，我们将深入研究我们喜欢用来快速擦除那些附带项目或午餐时间痒的Python库。即时将数据保存在数据库中：数据集当我们快速想要收集数据并将其保存到数据
用Python做一个绝地求生压枪版程序媛了了 python 开发语言
一、概述1.1效果总的来说，这种方式是通过图像识别来完成的，不侵入游戏，不读取内存，安全不被检测。1.2前置知识游戏中有各种不同的枪械，不同的枪械后坐力不一样，射速也不同。相同的枪械，装上不同的配件后，后坐力也会发生变化。枪械的y轴上移是固定的，x轴是随机的，因此我们程序只移动鼠标y轴。x轴游戏中手动操作。1.3实现原理简述通过python中的pynput模块监听键盘鼠标。监听鼠标左键按下，这个时
为AI聊天工具添加一个知识系统之76 详细设计之17 正则表达式之4 正则表达式模板一水鉴天人工智能机器学习算法
Q712、三“化”（使用三种不同的定义方法：规定定义法-线性回归/内涵定义法--一阶迭代/外延定义法--单调递归）整体形成一个双人零和的局面Method()规定式。给出问题“law是什么”的三种答案：1)符合（事实符合公式）内涵和外延的逆关系,2）遵循(逻辑符号)拓扑特征不变性，3)基于(信念坚持)时间不可逆公理根据你所描述的框架，三“化”（规定定义法-线性回归、内涵定义法-一阶迭代、外延定义法-
Python开发FastAPI从入门到精通赵梓宇 Python权威教程合集 fastapi python 前端
想用Python写API快到飞起？FastAPI就是你的“代码瑞士军刀”！这本书不讲玄学，只教真功夫——从零搭建高性能API，到微服务、分布式事务、熔断限流，连异步编程都能玩成魔法！小白也能变大神：路由、依赖注入、数据库集成手把手教学；老鸟直呼内行：服务网格、Saga模式、K8s部署实战全覆盖。附赠三个硬核项目：任务管理、在线商城、实时聊天系统，代码跑起来比老裁缝织毛衣还丝滑！别说我没提醒你：翻开
NLTK命名实体识别（NER） Mr数据杨 Python 自然语言技术 NLTK 自然语言处理 1024程序员节
命名实体识别（NamedEntityRecognition,NER）是自然语言处理（NLP）中的一项核心技术，旨在从文本中识别出具有特定意义的实体，如人名、地名、组织名等。通过对文本的自动化处理，NER能够帮助计算机理解和组织大量的非结构化数据，为信息抽取、搜索引擎优化、数据分析等领域提供强有力的技术支持。NLTK（NaturalLanguageToolkit）是一个广泛使用的Python库，提供
【算法】经典博弈论问题——威佐夫博弈 python 查理零世算法 python 开发语言
目录威佐夫博弈(WythoffGame)【模板】威佐夫博弈(WythoffGame)有两堆石子，数量任意，可以不同，游戏开始由两个人轮流取石子游戏规定，每次有两种不同的取法1)在任意的一堆中取走任意多的石子2)可以在两堆中同时取走相同数量的石子最后把石子全部取完者为胜者现在给出初始的两堆石子的数目，返回先手能不能获胜结论：小！=（大-小）*黄金分割比例，先手赢小=（大-小）*黄金分割比例，后手赢证
python 的sm2 生成密钥的方法，gmssl里没有提供密钥生成 CissSimkey python 算法机器学习
"""Author:tangleiDateTime:2024-11#importrandom#random不安全所以替换为secrets中的算法#选择素域，设置椭圆曲线参数"""importsecretsclassSM2_Key():default_ecc_table={'n':'FFFFFFFEFFFFFFFFFFFFFFFFFFFFFFFF7203DF6B21C6052B53BBF40939D
基于Python第三方模块fuzzywuzzy实现字符串匹配和相似度比较袁袁袁袁满 Python实用技巧大全 python 开发语言 fuzzywuzzy 符串匹配和相似度比较
文章目录一、引言二、安装三、核心模块与功能1.fuzz模块的主要函数2.process模块的主要函数四、应用场景五、性能与优化一、引言fuzzywuzzy是一个强大的Python库，专门用于执行模糊字符串匹配和相似度比较。由SeatGeek开发并开源，它基于Levenshtein距离（编辑距离）算法，能够处理字符串之间的拼写错误、格式差异以及部分匹配等问题。fuzzywuzzy在数据清洗、文本匹配
常见的反爬机制及应对策略极客点儿 #网络爬虫 Python 爬虫反爬
1.Headers:从用户的headers进行反爬是最常见的反爬策略,Headers是一种最常见的反爬机制Headers是一种区分浏览器行为和机器行为中最简单的方法，还有一些网站会对Referer（上级链接）进行检测从而实现爬虫。相应的解决措施：通过审查元素或者开发者工具获取相应的headers然后把相应的headers传输给python的requests，这样就能很好地绕过。2.IP限制一些网站
Python3 【函数】：见证算法的优雅与力量李智 - 重庆 Python 精讲精练 -从入门到实战算法 python 经验分享案例学习编程技巧学习方法
Python3【函数】：见证算法的优雅与力量一、问题描述使用3种不同的算法编写函数，实现如下功能：找出3个数中的最大数。二、算法实现使用if-elif-else语句实现defmax_of_three(a,b,c):ifa>=banda>=c:returnaelifb>=aandb>=c:returnbelse:returnc#示例调用print(max_of_three(10,20,15))#输出
【Python3爬虫】Scrapy入门教程 TM0831 Python3爬虫 Python3 网络爬虫
Python版本：3.5系统：Windows一、准备工作需要先安装几个库（pip，lxml，pywin32，Twisted，pyOpenSSL），这些都比较容易，如果使用的是Pycharm，就可以更方便的安装模块，在settings里可以选择版本进行下载。如果在命令行模式下输入pip-V出现'pip'不是内部或外部命令，也不是可运行的程序或批处理文件，先确保自己在环境变量中配置E:\Python3
Python 爬虫中的反爬策略及详细应对方法 winner8881 python 爬虫开发语言
在构建Python爬虫的过程中，网站为了保护自身资源和用户体验，常常会采取一系列反爬策略来限制或阻止自动化程序的访问。了解这些策略对于设计更智能、更合规的爬虫至关重要。以下是详细的反爬措施及其应对方法：1.User-Agent检测策略描述：许多网站会检查HTTP请求头中的User-Agent字段，以判断请求是否来自浏览器。如果发现是来自非标准用户代理（如Python默认的requests库），可能
1. Python Web 框架要点徐红珍 python django
PythonWeb框架要点1.Web应用程序处理流程2.Web程序框架的意义用于搭建Web应用程序免去不同Web应用相同代码部分的重复编写，只需关心Web应用核心的业务逻辑实现3.Web应用程序的本质接收并解析HTTP请求，获取具体的请求信息处理本次HTTP请求，即完成本次请求的业务逻辑处理构造并返回处理结果——HTTP响应百度ip地址：14.215.177.394.Web框架学习方法如何搭建工程
Miniforge详细安装教程（macOs和Windows）一直在学习的小白~ macos windows conda
(注：主要是解决商业应用anaconda收费问题，这是轻量级的代替，个人完全可以使用anaconda和miniconda)Miniforge是一个轻量级的包管理器，类似于Anaconda和Miniconda。它主要用于安装基于conda的Python环境，专注于兼容ARM架构的设备（如AppleM1/M2/M3芯片）和其它CPU架构。Miniforge使用conda-forge作为默认的包管理渠道
38个基于Python的Web 开发框架快乐星球没有乐 python 前端数据库
Web开发是Python应用中重要的一部分，下面总结了38个基于Python的Web开发框架！其中有的历史悠久，有的发展迅速，还有的已经停止维护，大家可以根据情况参考学习。1Django框架官网：https://github.com/django/django.gitDjango是一个开放源代码的Web应用框架，由纯Python写成，是目前Python语言中主流de三大Web框架之一(flask、
反爬技术详解：守护数据的网络之盾 MySheep. 爬虫文章爬虫 python
随着互联网的快速发展，网络爬虫技术在数据采集和分析领域的应用越来越广泛。然而，爬虫行为也对网站服务器的稳定性、数据隐私及商业利益造成了威胁。为了应对这些挑战，反爬技术应运而生。本篇文章将详细介绍反爬技术的概念、常用方法以及实际应用场景。一、反爬技术的意义反爬技术旨在保护网站数据免遭未经授权的访问，同时维护服务器的性能与正常用户体验。通过阻止恶意爬虫的访问，网站可以：保护敏感数据：防止数据被非法采集
Python 简单爬虫教程 ANTennaaa Python python
就是突然想玩一下这里是一个下载网页内图片的例子环境Python3.7需首先安装pipinstalllxml-ihttps://mirrors.aliyun.com/pypi/simple#fromurllib.requestimporturlretrieve#第一种方法importrequests#第二种方法frombs4importBeautifulSoup'''Ifthetargetdirec
华为OD机试 - 字符串摘要（Python/JS/C/C++ 2023 B卷 100分）哪吒搬砖工逆袭Java架构师华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述给定一个字符串的摘要算法，请输出给定字符串的摘要值：去除字符串中
华为OD机试 - 疫情扩散时间计算 - 广度优先搜索（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述在一个地图中（地图有N*N个区域组成），有部分区域被感染病菌。感
华为OD机试 - 字符串统计（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述给定两个字符集合，一个是全量字符集，一个是已占用字符集，已占用字
华为OD机试 - 服务器广播 - 并查集（Python/JS/C/C++ 2024 E卷 200分）哪吒华为od 服务器 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述服务器连接方式包括直接相连，间接连接。A和B直接连接，B和C直接
华为OD机试 - 单词搜索，找到它 - 回溯（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述找到它是一个小游戏，你需要在一个矩阵中找到给定的单词。假设给定单
华为OD机试 - 乘坐保密电梯 - 回溯（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述有一座保密大楼，你从0楼到达指定楼层m，必须这样的规则乘坐电梯：
华为OD机试 - 最长广播效应 - 广度优先搜索BFS（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述某通信网络中有N个网络结点，用1到N进行标识。网络中的结点互联互
华为OD机试 - 查找舆情热词（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述网上新闻越来越多，希望对新闻进行热词处理并归类，方便获取信息，现
华为OD机试 - 考古问题 - 回溯、全排列问题（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述考古问题，假设以前的石碑被打碎成了很多块，每块上面都有一个或若干
华为OD机试 - 机智的外卖员（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述外卖员每天在大厦中送外卖，大厦共有L层（0<L<=10^5），
华为OD机试 - 最大社交距离 - TreeSet（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述疫情期间需要大家保证一定的社交距离，公司组织开交流会议。座位一排
华为OD机试 - 机器人搬砖 - 二分查找（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od 机器人 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述机器人搬砖，一共有N堆砖存放在N个不同的仓库中，第i堆中有bri
华为OD机试 - API集群负载统计（Python/JS/C/C++ 2024 D卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述某个产品的RESTfulAPI集合部署在服务器集群的多个节点上，
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring