Python零基础速成班-第13讲-Python正则表达式Regex

学习目标

正则表达式
课后作业（4必做）

友情提示：将下文中代码拷贝到JupyterNotebook中直接执行即可，部分代码需要连续执行。

1、正则表达式Regex

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了 re 模块，re 模块使Python语言拥有全部的正则表达式功能。
正则表达式可以帮我们轻松验证电话号码、电子邮件、密码强度、输入长度等各种类型的格式是否正确，进而实现数据校验的功能。
下表为Python re 模块正则表达式常用规则：(后面将会使用)

正则表达式	描述	正则表达式	描述
.	匹配任意字符，除了换行符	{n,m}	重复n到m次
\w	匹配字母数字及下划线	\W	匹配非字母数字及下划线
\s	匹配任意空白字符	\S	匹配任意非空字符
\d	匹配任意数字，等价于 [0-9]	\D	匹配任意非数字
\b	匹配一个单词边界，也就是指单词和空格间的位置	\B	匹配非单词边界
^	匹配字符串的开头	[^...]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符
$	匹配字符串的末尾	[0-9]	匹配任何数字。类似于 [0123456789]
*	重复零次或更多次	[a-z]	匹配任何小写字母
+	重复一次或更多次	[A-Z]	匹配任何大写字母
?	重复零次或一次	[a-zA-Z0-9]	匹配任何字母及数字
{n}	重复n次	[^aeiou]	除了aeiou字母以外的所有字符
{n,}	重复n次或更多次	[^0-9]	匹配除了数字外的字符

1.1 re.match起始匹配函数

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match() 就返回 none。
函数语法：

re.match(pattern, string, flags=0)

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

flags正则表达式修饰符 - 可选标志
修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

匹配成功 re.match 方法返回一个匹配的对象，否则返回 None。

如下例，在起始位置匹配成功，返回匹配对象。

import re
result = re.match(r'www','www.baidu.com')
print(result)

不在起始位置匹配，匹配失败，返回None

import re
result = re.match(r'com','www.baidu.com')
print(result)

None

我们可以使用 group(num) 或 groups() 匹配对象函数来获取匹配表达式。

匹配对象方法	描述
group(默认num=0)	匹配的整个表达式的字符串，group() 可以一次输入多个组号，它将返回一个所对应值的元组
groups()	返回一个包含所有小组字符串的元组，从 1 到所含的小组号

import re
string='Cats are smarter than dogs'
result = re.match(r'(.*) are (.*?) .*',string)
print(result)
print(result.group())
print(result.group(1))
print(result.group(2))
print(result.groups())


Cats are smarter than dogs
Cats
smarter
('Cats', 'smarter')

1.2 re.search整体匹配函数

re.search 扫描整个字符串并返回第一个成功的匹配。函数语法：

re.search(pattern, string, flags=0)

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

匹配成功re.search方法返回一个匹配的对象，否则返回None。

如下例，匹配一次或更多次数字。

import re
result = re.search(r'\d+','阅读次数 9999次')
print(result)
print(result != None)


True

同样我们也可以使用 group(num) 或 groups() 匹配对象函数来获取匹配表达式。

匹配对象方法	描述
group(默认num=0)	匹配的整个表达式的字符串，group() 可以一次输入多个组号，它将返回一个所对应值的元组
groups()	返回一个包含所有小组字符串的元组，从 1 到所含的小组号

import re
mo = re.search(r'(\d\d\d)-(\d\d\d-\d\d\d\d)','My number is 415-555-4242.')
print(mo)
print(mo.group())
print(mo.group(1))
print(mo.group(2))
print(mo.groups())


415-555-4242
415
555-4242
('415', '555-4242')

1.3 re.match与re.search的区别

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；
而re.search匹配整个字符串，直到找到一个匹配。
如下例：

import re
string = "Cats are smarter than dogs"
#match
matchObj = re.match( r'dogs', string, re.M|re.I)
if matchObj:
    print("match --> matchObj.group() : ", matchObj.group())
else:
    print("No match!!")
#search
matchObj = re.search( r'dogs', string, re.M|re.I)
if matchObj:
    print("match --> matchObj.group() : ", matchObj.group())
else:
    print("No match!!")

No match!!
match --> matchObj.group() :  dogs

1.4 re.compile 预编译函数

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。函数语法：

re.compile(pattern[, flags])

pattern : 一个字符串形式的正则表达式
flags : 可选，表示匹配模式，比如忽略大小写，多行模式等，如re.I 忽略大小写、re.M 多行模式、re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境等，详见上述1.1《flags正则表达式修饰符 - 可选标志》表。

import re
Regex = re.compile(r'\baaa')
result = Regex.search('aaaaaabbb')
print(result)

import re
Regex = re.compile(r'\(\d\)')
test = Regex.search('sss (5) 2222')
print(test.group())

(5)

1.4.1 pipe 管道

"|"字符称为管道。您可以在任何需要匹配多个表达式之一的地方使用它。
第一次出现的匹配文本将作为匹配对象返回。

import re
heroRegex = re.compile (r'Batman|Tina Fey')
mo1 = heroRegex.search('Batman and Tina Fey')
print("1:"+mo1.group())# first occurrence is Batman

mo2 = heroRegex.search('Tina Fey and Batman')
print("2:"+mo2.group())# first occurrence is Tina Fey

1:Batman
2:Tina Fey

import re
batRegex = re.compile(r'Bat(man|mobile|copter|bat)')
mo = batRegex.search('Batmobile lost a wheel')
print(mo)
print("2:"+mo.group(0))#Bat(mobile...
print("3:"+mo.group(1))#(mobile...)


2:Batmobile
3:mobile

1.4.2 ? * + 的应用

“?” 表示重复0次或1次，即可有可无，满足最低条件
“*” 表示重复0次或更多次
“+” 表示重复1次或更多次

import re
batRegex = re.compile(r'Bat(wo)?man')
mo1 = batRegex.search('The Adventures of Batman')#无 wo
print(mo1.group())

mo2 = batRegex.search('The Adventures of Batwoman')#有 wo
print(mo2.group())

Batman
Batwoman

import re
batRegex = re.compile(r'Bat(wo)*man')
mo1 = batRegex.search('The Adventures of Batman')#无或者更多次
mo1.group()

'Batman'

import re
batRegex = re.compile(r'Bat(wo)+man')
mo1 = batRegex.search('The Adventures of Batwoman')#1次
print(mo1.group())

mo2 = batRegex.search('The Adventures of Batwowowowoman')#多次
print(mo2.group())

mo3 = batRegex.search('The Adventures of Batman')
print(mo3 == None)

Batwoman
Batwowowowoman
True

1.4.3 {m,n} 的应用

{m} 表示重复m次
{m,n} 表示重复m到n次，如果超过n次，则选择贪婪模式，即重复n次
{m,n}? 表示重复m到n次，且满足最低条件，即重复m次

import re
haRegex = re.compile(r'(Ha){3}')
mo1 = haRegex.search('HaHaHatttttt')
mo1.group()

'HaHaHa'

贪婪模式

import re
haRegex = re.compile(r'(Ha){3,6}')
mo1 = haRegex.search('HaHaHaHaHaHaHaHaHaHa')#贪婪模式，即选择6次
mo1.group()

'HaHaHaHaHaHa'

满足最低条件

import re
greedyHaRegex = re.compile(r'(Ha){3,5}')
mo1 = greedyHaRegex.search('HaHaHaHaHaHaHa')#贪婪模式，即选择5次
print(mo1.group())

nongreedyHaRegex = re.compile(r'(Ha){3,5}?')#满足最低条件，即选择3次
mo2 = nongreedyHaRegex.search('HaHaHaHaHa')
print(mo2.group())

HaHaHaHaHa
HaHaHa

1.5 findall 匹配所有字符串函数

在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果有多个匹配模式，则返回元组列表，如果没有找到匹配的，则返回空列表。
即match 和 search 是匹配一次而findall 匹配所有。findall函数语法为：

findall(string[, pos[, endpos]])
参数：

string : 待匹配的字符串。

pos : 可选参数，指定字符串的起始位置，默认为 0。

endpos : 可选参数，指定字符串的结束位置，默认为字符串的长度。

无分组情况

import re 
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d') #无分组情况
phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')

['415-555-9999', '212-555-0000']

有分组情况，返回tuple元组

import re 
phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)') #有分组情况
phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')#返回一个tuple

[('415', '555', '9999'), ('212', '555', '0000')]

指定开始位置和结束位置

import re
numRegex = re.compile(r'\d+')#查找数字
numRegex.findall("6baidu888google12345",0,17)#指定0到17的位置种查询

['6', '888', '12']

[ ]表示匹配中括号内相应内容，如[0-9]即匹配所有数字，[a-z]即匹配所有小写字母，[a-zA-Z0-9]即匹配所有数字字母，[^0-9]即匹配所有非数字

import re
vowelRegex = re.compile(r'ba|[aeiouAEIOU]')#匹配元音
vowelRegex.findall('RoboCop eats baby fOOd.')

['o', 'o', 'o', 'e', 'a', 'ba', 'O', 'O']

import re
vowelRegex = re.compile(r'[^aeiouAEIOU]')#匹配非元音
vowelRegex.findall('RoboCop eats baby fOOd.')

['R', 'b', 'C', 'p', ' ', 't', 's', ' ', 'b', 'b', 'y', ' ', 'f', 'd', '.']

import re
vowelRegex = re.compile(r'[0-5.]')#这里匹配的是"0-5以及."
vowelRegex.findall('123450. BABY FOOD.')

['1', '2', '3', '4', '5', '0', '.', '.']

import re
atRegex = re.compile(r'.at')#这里的"."代表匹配任意字符
atRegex.findall('The cat in the hat ssate on the flat mat.')

['cat', 'hat', 'sat', 'lat', 'mat']

1.6 re.sub 检索和替换函数

Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。函数语法：

re.sub(pattern, repl, string, count=0, flags=0)
参数：

pattern : 正则中的模式字符串。

repl : 替换的字符串，也可为一个函数。

string : 要被查找替换的原始字符串。

count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

如下例，移除电话号码中的 “-” 字符串，即用 “” 替换 “-”

import re
tel = re.sub(r"\D","","021-8678-0543")
print(tel)

02186780543

re.sub常用来作为某个单词或者姓名的替换，如下例，将Agent后面的姓名替换为新的姓名

import re
namesRegex = re.compile(r'Agent \w+')
namesRegex.sub('Lucifer', 'Agent Alice gave the secret documents to Agent Bob.')

'Lucifer gave the secret documents to Lucifer.'

1.7 一些额外用法的补充

满足最低条件与贪婪模式

import re
nongreedyRegex = re.compile(r'{.*?}')#这里的{}就代表大括号，有?则是满足最低条件即可
mo = nongreedyRegex.search('{To serve man} for dinner}')
print("满足最低条件：",mo.group())

greedyRegex = re.compile(r'<.*>')#没有?号，则是贪婪模式
mo = greedyRegex.search(' for dinner.>')
print("贪婪模式：",mo.group())

满足最低条件： {To serve man}
贪婪模式：  for dinner.>

"."表示任意字符，但不包括换行符\n

import re
noNewlineRegex = re.compile('.*')#这里的"."表示任意字符不包括换行符
noNewlineRegex.search('Serve the public trust.\nProtect the innocent.\nUphold the law.').group()

'Serve the public trust.'

通过修饰符re.S(等同于re.DOTALL)，使 . 匹配包括换行在内的所有字符

import re
newlineRegex = re.compile('.*', re.S)#re.S等同于re.DOTALL include all character
newlineRegex.search('Serve the public trust.\nProtect the innocent.\nUphold the law.').group()

'Serve the public trust.\nProtect the innocent.\nUphold the law.'

通过修饰符re.I使匹配大小写不敏感

import re
robocop = re.compile(r'robocop',re.I)
print(robocop.search('RoboCop is part man, part machine, all cop.').group())
print(robocop.search('ROBOCOP protects the innocent.').group())
print(robocop.search('Al, why does your programming book talk about robocop so much?').group())

RoboCop
ROBOCOP
robocop

1.8 先行断言、后行断言，在爬虫中非常有用

exp1是一个句子，exp2是一个句子

先行断言：

exp1(?=exp2) ：指查找后面是exp2的exp1
exp1(?!exp2) ：指查找后面不是exp2的exp1

后行断言

(?<=exp2)exp1 ：指查找前面是exp2的exp1
(?

如下例，查找后面是标签的任意字符串

import re
xianRegex = re.compile(r".+(?=)")
xian = fontRegex.search("阅读数：641")
print(xian.group())

阅读数：641

查找前面是是标签的任意字符串

import re
houRegex = re.compile(r"(?<=)
hou = houRegex.search("阅读数：641")
print(hou.group())

 class="read-count">阅读数：641

2、课后作业，答案在下一讲

1、输入一个IP地址，确认是否是合法的A类IP地址。(A类IP地址地址范围1.0.0.0到126.255.255.255)

您的代码：

2、写一个函数，它使用正则表达式，确保传入的口令字符串是强口令。强口令的定义是：由数字和字母组成，并且要同时含有数字和字母，且长度要在8-16位之间。

您的代码：

3、这是一个封群发邮件内容，请你用正则表达式将somebody替换成对应姓名，需要替换的姓名列表为 [‘Alice’,‘Tony’,‘Henry’,‘Jack’,‘Yilia’]，替换完成后请依次将内容打印出来，邮件内容为：

Hello somebody ,welcome to my home ,I’m waiting for you.

您的代码：

4、将下列不同格式的日期，转换成相同格式yyyy-mm-dd并依次打印出来

输入日期格式有可能如下：
20210601
2021-06-01
2021/06/01
2021/6/1
2021年6月1日
2021年06月01日

您的代码：

3、上一讲Python零基础速成班-第12讲-Python获取网络数据Socket，API接口，网络爬虫Crawler(制作弹幕词云) 课后作业及答案

1、编程实践项目：利用百度智能云API服务制作一个手机号码归属地查询API接口。

目标要求：输入手机号，查询手机号码归属地信息、包含省市区、运营商、区号等信息。
API接口地址：https://api.oioweb.cn/api/common/teladress
请求方式：GET/POST
请求示例GET：https://api.oioweb.cn/api/common/teladress?mobile=13988888888

import requests
import json
def mobilecity(mobile:"手机号")->"输出归属地等信息":
    url = 'https://api.oioweb.cn/api/common/teladress'#API接口地址
    params = {}
    params['mobile'] = mobile
    headers={'Content-Type':'application/json;charset=UTF-8'}
    response = requests.post(url=url,params=params,headers=headers)#使用POST请求
    mobileinfo = json.loads(response.text)
    return mobileinfo["result"]
mobilecity("13988888888")

{‘name’: ‘移动全球通卡’,
‘postCode’: ‘674100’,
‘prov’: ‘云南’,
‘city’: ‘丽江市’,
‘cityCode’: ‘530700’,
‘num’: 1398888,
‘provCode’: ‘530000’,
‘areaCode’: ‘0888’,
‘type’: 1}

2、编程实践项目：利用网络爬虫，爬取文件信息，生成文件的词云图片。

目标要求：从 http://www.gov.cn/zhengce/2021-02/21/content_5588098.htm 中获取《关于全面推进乡村振兴加快农业农村现代化的意见》网页源码，进行数据整理、分词、生成词云图片并展示。
提示：
1. 爬取文件网页源码，转化为utf-8格式。
2. 寻找文件规律，使用BeautifulSoup查询转化，输出数组，文件信息是以段落标签"p"开头的，不需要去除空格和重复。
3. 分词，去掉单字符和内容为"\r\n"的单词。
4. 生成词云图片并展示(图片长度1200，高度800，清晰度3，背景底色白色，字体"msyh.ttc")。
5. 需要使用requests、BeautifulSoup、jieba、wordcloud、matplotlib包，需要自行安装。

import requests
from bs4 import BeautifulSoup
import jieba
import wordcloud
from matplotlib import pyplot as plt
#爬取网页数据
reponse = requests.get("http://www.gov.cn/zhengce/2021-02/21/content_5588098.htm")
reponse.encoding='utf-8'
#整理
soup = BeautifulSoup(reponse.text,"xml")
result = soup.find_all("p")
text = [c.text for c in result]
#分词
ci = "".join(text)
fenci = list(jieba.cut(ci))
ciyun = [word for word in fenci if len(word)>1 and word not in ["\r\n"]]
#生成词云图片并输出
wc = wordcloud.WordCloud(width=1200, font_path='msyh.ttc',height=800,scale=3,background_color='white')
wc.generate(' '.join(ciyun))
plt.imshow(wc)

你可能感兴趣的:(Python,python,jupyter,正则表达式,大数据,中文分词)

大数据时代，我们都是透明人随心追梦人
随着科技的飞速发展，现在的吃穿住行变得愈发的便捷，各种新兴产业也顺应着时代的发展营运而生，许多跟不上时代的产业，技术也随之被淘汰，中国真正进入了新时代！新时代有几个特点，其中之一便是信息技术的发展让我们生活更便捷，与此同时，各行业获取客户的信息也更方便和完整，收集到的数据再加以运用又会助力其他产业的更新和进步，这就是大数据的作用。前两天，一个同事说他买的房今年10月接房，前两天就有好几个装修公司给
unicorn 部署 FastAPI 应用程序九品神元师 fastapi
本地部署本地开发调试过程中，我通常是这样启动Fastapi服务的在终端中运行：uvicornmain:app--host0.0.0.0--port80当然，也可以python脚本启动：importuvicornuvicorn.run(app="main:app",host="0.0.0.0",port=8088,reload=True)这样就好启动一个服务，reload=True支持热重载，方便
从零开始！Jupyter Notebook的安装教程 yunquantong jupyter ide python
以下是从零开始安装JupyterNotebook的教程，适用于Windows、macOS和Linux系统。1.安装PythonJupyterNotebook需要Python环境。你可以从Python官方网站下载并安装Python。Windows用户:运行安装程序时，请确保勾选“AddPythontoPATH”选项。macOS用户:使用安装程序或通过Homebrew安装(brewinstallpyt
python sanic orm_sanic中使用tortoise-orm Mr浪子相依 python sanic orm
#models.pyfromtortoise.modelsimportModelfromtortoiseimportfieldsclassUser(Model):id=fields.IntField(pk=True,,source_field="userID")name=fields.CharField(max_length=100)date_field=fields.DateTimeField(
盘点一个Python网络爬虫抓取股票代码问题（上篇）皮皮_f075
大家好，我是皮皮。一、前言前几天在Python白银群【厚德载物】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。image.png二、实现过程这个问题其实for循环就可以搞定了，看上去粉丝的代码没有带请求头那些，导致获取不到数据。后来【瑜亮老师】、【小王子】给了具体思路，代码如下图所示：image.png后来【小王子】也给了一个具体代码，如下：importrequestsimportt
Django 安装指南 lly202406 开发语言
Django安装指南Django是一个高级的PythonWeb框架，它鼓励快速开发和干净、实用的设计。本指南将详细介绍如何在不同的操作系统上安装Django，包括Windows、macOS和Linux。在Windows上安装Django先决条件Python:Django要求Python3.8或更高版本。可以从Python官网下载适用于Windows的Python安装程序。pip:Python的包管
从零开始!Jupyter Notebook的安装教程 109702008 人工智能编程 #python jupyter 人工智能
GPT-4o(OpenAI)安装JupyterNotebook是一个相对简单的过程，特别是在大多数现代操作系统（如Windows、macOS和Linux）上。以下是详细的步骤指南，从安装Python开始，到JupyterNotebook的使用。步骤1：安装PythonJupyterNotebook需要Python环境。你可以从[Python官网](https://www.python.org/do
python http error 401 解决方案: codeuniverse http 网络协议网络
fromrequests.authimportHTTPBasicAuthuser='myuserID'password="mypassword"ip=sys.argv[1]url="http://www.websites.com/"+ipres=requests.get(url,auth=HTTPBasicAuth(user,password))printres.text
Python 列表(list) sort() 方法编程爱好者9913
Python中是没有数组类型的，Python不具有对数组的内置支持，但是可以使用Python列表代替。Python中支持列表和元组。列表比元组好用，因为元组一旦定义就没法修改。而列表不仅可以和数组一样按索引访问，还有一些内置函数方法。本文主要介绍Python列表(list)sort()方法原文地址：Python列表(list)sort()方法
列表排序（Python） TCatTime #Python常见题目 Python Python 列表排序
目录描述解决方案代码代码走读传送门测试用例描述给定以下列表：[{'name':'a','age':20},{'name':'b','age':30},{'name':'c','age':25}]请按照age大小从大到小排序。解决方案使用sorted()函数对列表排序。代码alist=[{'name':'a','age':20},{'name':'b','age':30},{'name':'c','
Cuda 程序编译报错: fatal error: cusparse.h: No such file or directory 原野寻踪实践经验 cuda
编译cuda程序时发现下列报错：/mnt/xxx/miniconda3/envs/xxx/lib/python3.8/site-packages/torch/include/ATen/cuda/CUDAContext.h:6:10:fatalerror:cusparse.h:Nosuchfileordirectory#include^~~~~~~~~~~~检查发现是选择了错误的Cuda版本。ls/
Anaconda版本和Python版本对应关系纬领网络 python anaconda3
官网下载地址：https://repo.anaconda.com/archive/下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/anaconda3版本基础python版本Anaconda3-2024.06-1Python3.12.4Anaconda3-2024.02-1Python3.11.7Anaconda3-2023.09
Python 列表 sort()函数使用理解 Echo_3wdiankang python 爬虫开发语言
目录前言1、升序降序2、sort()和sorted()的区别3、切片排序4、指定排序规则4.1、按字符串长度排序4.2、按第二个字符排序4.3、查找第n大的元素5、其他类型排序总结前言在Python编程的广阔领域中，列表（List）是一种非常基础且强大的数据结构。它允许我们存储多个元素，并按需进行访问、修改和操作。在这些操作中，对列表进行排序是一个常见的需求，而Python的sort()函数正是为
虚拟现实智能家居实训系统实训解决方案武汉唯众智创智能家居实训系统智能家居实训室虚拟现实智能家居实训系统
随着科技的飞速发展，智能家居已成为现代生活的重要组成部分，它不仅极大地提升了居住的便捷性与舒适度，还推动了物联网、大数据、人工智能等前沿技术的融合应用。为了满足市场对智能家居专业人才日益增长的需求，虚拟现实智能家居实训系统实训解决方案旨在通过高度仿真的虚拟环境，为职业院校学生提供全面、高效、安全的智能家居系统学习与实践平台。一、解决方案概述该方案是一款深度融合教学理论、实践操作与效果评估的全方位解
命令行工具部署达梦数据库 DMDPC（BP 多副本架构）百代繁华一朝都-绮罗生数据库架构网络
解达梦数据库DPC集群的主要使用场景：DMDPC关注和解决的是大数据、计算与存储分离、高可用、支持全部的SQL标准、拥有完整的事务处理能力和集群规模能够动态伸缩的业务场景：大量的复杂查询操作要求优化器能够生成优良的执行计划，并且执行引擎能够充分利用多机器、多核的硬件资源某些行业对数据一致性和多副本备份容灾有较高要求，同时希望维护成本足够低和故障恢复时间足够短；用户的业务规模有峰值，要求所需的机器资
八十多种证件识别接口-JavaScript身份证识别API示例-护照识别-户口页识别翔云API api 人工智能 ocr 开发语言自动化小程序运维
证件识别API包含了身份证识别、护照识别、户口页识别、港澳台来往通行证识别等八十多种证件识别类型，提供了快速、精准的证件信息提取功能，广泛应用于实名认证、机场出入口等场景。仅需上传证件图片，便可快速、精准识别全证面文字信息。python调用身份证识别API：varform=newFormData();form.append("img","/9j");form.append("key","M****
python中的类class weixin_41950276 python python
classDog():def__init__(self,name,age):self.name=nameself.age=agedefsit(self):print(self.name.title()+'isnowsitting.')defroll_over(self):print(self.name.title()+'rolledover!')my_dog=Dog('willie',6)#此处的
从MVC到DDD的架构演进洛蕾计算机 mvc 架构
Python微信订餐小程序课程视频https://edu.csdn.net/course/detail/36074Python实战量化交易理财系统https://edu.csdn.net/course/detail/35475DDD这几年越来越火，资料也很多，大部分的资料都偏向于理论介绍，有给出的代码与传统MVC的三层架构差异较大，再加上大量的新概念很容易让初学者望而却步。本文从MVC架构角度来讲
python 中 Class（类）的详细说明炸膛坦客 python学习笔记 python 深度学习
Class类用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。一个人（身高：一米八）要吃饭、喝水、睡觉；一只老虎（体重：300斤）要奔跑、洗澡、捕猎。一、名词定义类(Class):用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。方法：类中定义的函数。类变量：类变量在整个实例化的对象中是公用的。
flask和fastapi和streamlit有什么区别小霖同学onism 小白的摸爬滚打 flask fastapi python
Flask、FastAPI和Streamlit都是用于构建Web应用程序的Python框架或工具，但它们的用途和特点各不相同。以下是它们之间的主要区别：1.Flask简介：Flask是一个轻量级的、易于使用的PythonWeb框架，非常适合构建简单的Web应用和API。特点：灵活性高：Flask仅提供最基础的功能，允许开发者根据需要引入第三方扩展和库。社区支持：拥有庞大的社区和丰富的第三方扩展，易
安卓将本地日志上传到服务器胡子洲 Android android 服务器
在安卓开发中，将本地日志上传到服务器是一个常见的需求，特别是在开发需要远程监控或调试的应用时。以下是一个基本的步骤和示例，说明如何实现这一功能：1本地日志上传到服务器1.1准备服务器首先，你需要在服务器上设置一个接口，用于接收上传的日志文件。这个接口可以是RESTfulAPI，使用HTTPPOST方法接收文件。你可以使用各种后端技术栈来实现这个接口，如Node.js、Python（Flask或Dj
面试 Python 基础八股文十问十答第一期程序员小白条面试八股文系列面试 python 职场和发展八股文项目实战 Python爬虫
面试Python基础八股文十问十答第一期作者：程序员小白条，个人博客相信看了本文后，对你的面试是有一定帮助的！关注专栏后就能收到持续更新！⭐点赞⭐收藏⭐不迷路！⭐1）Python的基本数据类型Python的基本数据类型包括：整数（int）：表示整数值，如1、2、-3等。浮点数（float）：表示带有小数点的数值，如1.5、3.14等。字符串（str）：表示文本数据，用单引号（‘）或双引号（"）括起
ansible入门打败404 运维 linux ansible
一、ansible简介1、ansible是什么？ansible是目前最受运维欢迎的自动化运维工具，基于Python开发，集合了众多运维工具（SaltStackpuppet、chef、func、fabric）的优点，实现了批量系统配置、批量程序部署、批量运行命令等功能。ansible是基于paramiko开发的,并且基于模块化工作，本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模
Windows下安装Scrapy出现的问题及其解决方法咸甜怪
Scrapy是Python开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。在安装Scrapy模块时，pipinstallScrapy出现了以下报错：error:MicrosoftVisualC++14.0isrequired.Getitwith"MicrosoftVisualC++BuildTools":http://landinghub.visua
python 程序设计 JungleChow Python Python
importsyss=sys.stdin.readline().split()forlineinsys.stdin:s=sys.stdin.read().strip().split()line1=input()line2=input().split()line3=input().strip().split()list=[]list=n*['1']data=list(range(n))列表中字符串转
Linux三剑客与管道使用许琳珊
一、管道1、什么是管道linux提供管道符“|”将两个命令隔开，管道符左边命令的输出就会作为管道符右边命令的输入2、例子echo"hello123"|grep"hello"二、正则1、什么是正则正则表达式就是记录文本规则的代码2、正则的用法常用元字符代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白符\d匹配数字\b匹配单词的开始或结束^匹配字符串的开始$匹配字
sphinx-apidoc longgb246
[toc]一、使用sphinx-apidoc[OPTIONS]-o[EXCLUDE_PATTERN,…]sphinx-apidoc是一个自动生成Sphinx源的工具，使用该autodoc扩展。MODULE_PATH：是python的源码的文件目录。OUTPUT_PATH：是包含conf.py和*.rst的source目录。注意在python源码的py文件中，应该使用if__name__=='__m
python的for语句有几种写法_Python中三元表达式的几种写法介绍 weixin_39835965
要介绍Python的三元表达式，可以先看看其他编程语言比如C，JAVA中应用:publicclassjava{publicstaticvoidmain(String[]args){intx=100;inty=101;intMAX=(x>y)?x:y;System.out.println("MAX:"+MAX);}}上面的例子可以很好的说明了其他语言的格式：判段的条件?条件为真时的结果:条件为假时的
python语言程序设计教程-Python语言程序设计（视频教程） weixin_37988176
——为什么要学习计算机编程？——因为编程是件很有趣的事儿，能启迪思维，还有诗和远方...Python语言，由GuidovanRossum大牛在1990年发明，它是当今世界最受欢迎的计算机编程语言，也是一门对大多数人“学了能用、学了有用、学会能久用”的计算生态语言。本课程是一门体现大学水平的Python语言入门课程，采用“理解和运用计算生态”为教学理念，面向Python零基础学习者，不要求学习者有任
python io密集型应用案例-Python中单线程、多线程和多进程的效率对比实验实例 weixin_39635648
python的多进程性能要明显优于多线程，因为cpython的GIL对性能做了约束。Python是运行在解释器中的语言，查找资料知道，python中有一个全局锁（GIL），在使用多进程(Thread)的情况下，不能发挥多核的优势。而使用多进程(Multiprocess)，则可以发挥多核的优势真正地提高效率。对比实验资料显示，如果多线程的进程是CPU密集型的，那多线程并不能有多少效率上的提升，相反还
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

Python零基础速成班-第13讲-Python正则表达式Regex