张峰π_π

正则表达式-简单爬虫的实例

文章目录

b站新番排行榜的爬取

1.构造请求
2. 正则表达式构造
3.数据处理

猫眼排行的爬取

1. 构造请求
2.正则提取
3.整合代码
4.分页爬取
5.完整代码

前面几篇博客主要介绍的是对于爬虫所需要的库以及相关知识点的介绍，这篇博客就是让我们练习一下真正的爬虫该怎么写。下面我主要讲两个实例，一个是b站新番的信息爬取，另一个是猫眼电影TOP100的相关信息爬取。

b站新番排行榜的爬取

首先我们需要request和re模块，我采用函数结构话来写爬虫，你们可以看看，首先我们找到我们需要爬取的详情页b站新番排行榜。

我们需要爬取得信息有上面的新番排名，动漫名称，播放量，弹幕量，追番数，以及最后的综合得分。首先我们看一下网页源代码，发现信息都在源代码中。怎么看源代码我就不讲解了。我就直接开始讲怎么开始爬虫吧。

1.构造请求

我采用函数的形式，设置相关参数，然后请求的时候就直接传递url这个参数就行啦。

import requests
from requests.exceptions import RequestException
import re
def get_page(url):
    try:
        response = requests.get(url)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None

由于这个网站比较简单，对于请求头等参数我们不需要配置，然后我们直接调用它。

url='https://www.bilibili.com/ranking/bangumi/13/0/3'
html =get_one_page(url)

2. 正则表达式构造

这里我就不显示返回的结果，我们发现返回的信息就是网页源代码了，现在我们需要分析了，因为每部新番在网页展示的时候，也是一种列表形式的呈现，所以我们只要找到相似的列表单元格式，就可以用正则表达式匹配。在我看了一会源代码发现：

<div class="num">1</div><div class="content"><div class="img"><a href="//bangumi.bilibili.com/anime/28006" target="_blank"><div class="lazy-img cover"><img alt="擅长捉弄的高木同学 第二季" src=""></div></a><!----></div><div class="info"><a href="//bangumi.bilibili.com/anime/28006" target="_blank" class="title">擅长捉弄的高木同学 第二季</a><div class="bangumi-info">全12话</div><div class="detail"><span class="data-box"><i class="b-icon play"></i>2890.3万</span><span class="data-box"><i class="b-icon view"></i>100.0万</span><span class="data-box"><i class="fav"></i>168.2万</span></div><div class="pts"><div>3604904</div>综合得分
          </div></div><!----></div></li><li class="rank-item">

每一条新番的信息都是这样呈现的，现在我们只需要将对应正则表达式写出来就可以了，结合上篇博客，我花了一两分写的一个比较简单的刚好匹配出来，你们可以看一下：

<div class="num">(\d+).*?href="(.*?)".*?<img alt="(.*?)" src.*?</i>(.*?)</span>.*?</i>(.*?)</span>.*?</i>(.*?)</span>.*?<div>(\d+)</div>

是不是也很简单，当我们请求之后匹配正则表达式，就能得到我们想要的信息了。

pattern = re.compile('(\d+).*?href="(.*?)".*?(.*?).*?(.*?).*?(.*?).*?(\d+)', re.S)
items = re.findall(pattern, html)
items

看一下我们的运行结果：

[('1',
  '//bangumi.bilibili.com/anime/28006',
  '擅长捉弄的高木同学 第二季',
  '2890.6万',
  '100.0万',
  '168.2万',
  '3604904'),
 ('2',
  '//bangumi.bilibili.com/anime/26801',
  '鬼灭之刃',
  '2.2亿',
  '357.5万',
  '496.0万',
  '3518535'),
 ('3',
  '//bangumi.bilibili.com/anime/28016',
  '女高中生的虚度日常',
  '3442.3万',
  '73.6万',
  '175.5万',
  '1253146'),
 ('4',
  '//bangumi.bilibili.com/anime/26363',
  '君主·埃尔梅罗二世事件簿 魔眼收集列车 Grace note',
  '3025.5万',
  '41.0万',
  '197.0万',
  '598908'),

我只显示前四条，你们想看详细的可以自己试着运行一下。但我们发现爬取的链接地址是不完整的，这个时候，就需要我们对数据进行处理，我们看了一下源代码，发现我们爬取是没问题，只是这个网站省去了前部分公共的。https://www.bilibili.com
这个时候就需要我们处理了。

3.数据处理

举一个例子，前缀url是这个https://www.bilibili.com，后缀url是这个//bangumi.bilibili.com/anime/26363，我们可以用正则表达式来处理

url1 ='//bangumi.bilibili.com/anime/28016'
url2 ='https://www.bilibili.com'
url2+re.sub('//','/',url1)

处理后的结果是：

'https://www.bilibili.com/bangumi.bilibili.com/anime/28016'

这样就达到我们的要求了。
我们可以看看最后的完整代码：

import requests
from requests.exceptions import RequestException
import re
def get_page(url):
    try:
        response = requests.get(url)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None
url='https://www.bilibili.com/ranking/bangumi/13/0/3'
html =get_page(url)
pattern = re.compile('(\d+).*?href="(.*?)".*?(.*?).*?(.*?).*?(.*?).*?(\d+)
', re.S)
items = re.findall(pattern, html)
url_1 ='https://www.bilibili.com'
for item in items:
    url=url_1+re.sub('//','/',item[1])
    print(item[1])
    print(url)
    print(item[2])
    print(item[3])
    print(item[4])
    print(item[5])
    print(item[6])

我们可以看看运行结果：

1
https://www.bilibili.com/bangumi.bilibili.com/anime/28006
擅长捉弄的高木同学 第二季
2891.4万
100.0万
168.2万
3604904
2
https://www.bilibili.com/bangumi.bilibili.com/anime/26801
鬼灭之刃
2.2亿
357.6万
496.0万
3518535
3
https://www.bilibili.com/bangumi.bilibili.com/anime/28016
女高中生的虚度日常
3443.0万
73.6万
175.5万
1253146
4
https://www.bilibili.com/bangumi.bilibili.com/anime/26363
君主·埃尔梅罗二世事件簿 魔眼收集列车 Grace note
3026.0万
41.0万
197.0万
598908
5
https://www.bilibili.com/bangumi.bilibili.com/anime/27993
Ｄｒ．ＳＴＯＮＥ 石纪元
3327.9万
45.1万
169.0万
550751

我发现达到我们的要求，一个基本爬虫就完成了，至于保存我后面会慢慢讲解，第一个案例就到这里了（最后小编发现自己贼傻，其实那个url不是番剧url，需要微调，后期我再修改一下）

猫眼排行的爬取

我们需要抓取的目标站点为http://maoyan.com/board/4，打开之后便可以查看到榜单信息，如图所示。

排名第一的电影是霸王别姬，页面中显示的有效信息有影片名称、主演、上映时间、上映地区、评分、图片等信息。

将网页滚动到最下方，可以发现有分页的列表，直接点击第2页，观察页面的URL和内容发生了怎样的变化，
可以发现页面的URL变成http://maoyan.com/board/4?offset=10，比之前的URL多了一个参数，那就是offset=10，而目前显示的结果是排行11-20名的电影，初步推断这是一个偏移量的参数。再点击下一页，发现页面的URL变成了http://maoyan.com/board/4?offset=20，参数offset变成了20，而显示的结果是排行21~30的电影。

由此可以总结出规律，offset代表偏移量值，如果偏移量为n，则显示的电影序号就是n+1到n+10，每页显示10个。所以，如果想获取TOP100电影，只需要分开请求10次，而10次的offset参数分别设置为0、10、20、…90即可，这样获取不同的页面之后，再用正则表达式提取出相关信息，就可以得到TOP100的所有电影信息了。
下面我们开始编写爬虫。

1. 构造请求

这个和上面b站新番排行榜是一样的，我们就不重复，直接调用，但我们需要加入一个请求头信息，不然那可能会返回403，这样运行之后，就可以成功获取首页的源代码了。获取源代码后，就需要解析页面，提取出我们想要的信息。

def get_page(url):
    try:
        response = requests.get(url,headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None
url = 'http://maoyan.com/board/4' 
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}

2.正则提取

我们直接观察源代码分析，找到对应的规则，用正则表达式进行编写，可以看到，一部电影信息对应的源代码是一个dd节点，我们用正则表达式来提取这里面的一些电影信息。首先，需要提取它的排名信息。而它的排名信息是在class为board-index的i节点内，这里利用非贪婪匹配来提取i节点内的信息，随后需要提取电影的图片。可以看到，后面有a节点，其内部有两个img节点。经过检查后发现，第二个img节点的data-src属性是图片的链接。这里提取第二个img节点的data-src属性，再往后，需要提取电影的名称，它在后面的p节点内，class为name。所以，可以用name做一个标志位，然后进一步提取到其内a节点的正文内容，再提取主演、发布时间、评分等内容时，都是同样的原理。最后，正则表达式写为：

<dd>.*?board-index.*?>(.*?)</i>.*?data-src="(.*?)".*?name.*?a.*?>(.*?)</a>.*?star.*?>(.*?)</p>.*?releasetime.*?>(.*?)</p>.*?integer.*?>(.*?)</i>.*?fraction.*?>(.*?)</i>.*?</dd>

这样就能匹配到我们想要的信息，为了更好的显示我们爬取的数据，我们将格式微微调整然后打印

pattern = re.compile('.*?board-index.*?>(.*?).*?data-src="(.*?)".*?name.*?a.*?>(.*?).*?star.*?>(.*?)
.*?releasetime.*?>(.*?)
.*?integer.*?>(.*?).*?fraction.*?>(.*?).*?
', re.S)
items = re.findall(pattern, html)
for item in items:
    print('index', item[0])
    print('image', item[1])
    print('title', item[2])
    print('actor', item[3].strip()[3:])
    print('time', item[4].strip()[5:])
    print('score', item[5]+ item[6])

打印出来的结果：

index 1
image https://p1.meituan.net/movie/20803f59291c47e1e116c11963ce019e68711.jpg@160w_220h_1e_1c
title 霸王别姬
actor 张国荣,张丰毅,巩俐
time 1993-01-01
score 9.5
index 2
image https://p0.meituan.net/movie/283292171619cdfd5b240c8fd093f1eb255670.jpg@160w_220h_1e_1c
title 肖申克的救赎
actor 蒂姆·罗宾斯,摩根·弗里曼,鲍勃·冈顿
time 1994-09-10(加拿大)
score 9.5
index 3
image https://p0.meituan.net/movie/289f98ceaa8a0ae737d3dc01cd05ab052213631.jpg@160w_220h_1e_1c
title 罗马假日
actor 格利高里·派克,奥黛丽·赫本,埃迪·艾伯特
time 1953-09-02(美国)
score 9.1

3.整合代码

最后，实现main()方法来调用前面实现的方法，将单页的电影结果打印出来：

def main(offset):
    url = 'http://maoyan.com/board/4?offset=' + str(offset)
    html = get_page(url)
    parse_page(html)

到此为止，我们就完成了单页电影的提取，也就是首页的10部电影。

4.分页爬取

因为我们需要抓取的是TOP100的电影，所以还需要遍历一下，给这个链接传入offset参数，实现其他90部电影的爬取，此时添加如下调用即可：

for i in range(10):
    main(offset=i * 10)
    time.sleep(1)

5.完整代码

到此为止，我们的猫眼电影TOP100的爬虫就全部完成了，再稍微整理一下，完整的代码如下：

def get_page(url):
    try:
        response = requests.get(url,headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None
url = 'http://maoyan.com/board/4' 
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}
def parse_page(html):
    pattern = re.compile('.*?board-index.*?>(.*?).*?data-src="(.*?)".*?name.*?a.*?>(.*?).*?star.*?>(.*?)
.*?releasetime.*?>(.*?)
.*?integer.*?>(.*?).*?fraction.*?>(.*?).*?
', re.S)
    items = re.findall(pattern, html)
    for item in items:
        print('index', item[0])
        print('image', item[1])
        print('title', item[2])
        print('actor', item[3].strip()[3:])
        print('time', item[4].strip()[5:])
        print('score', item[5]+ item[6])
def main(offset):
    url = 'http://maoyan.com/board/4?offset=' + str(offset)
    html = get_page(url)
    parse_page(html)
if __name__ == '__main__':
    for i in range(10):
        main(offset=i * 10)
        time.sleep(1)

猫眼存在轻微的反爬虫，如果速度过快，则会无响应，所以这里又增加了一个延时等待。最后我们看看运行结果，只显示部分：

index 1
image https://p1.meituan.net/movie/20803f59291c47e1e116c11963ce019e68711.jpg@160w_220h_1e_1c
title 霸王别姬
actor 张国荣,张丰毅,巩俐
time 1993-01-01
score 9.5
index 2
image https://p0.meituan.net/movie/283292171619cdfd5b240c8fd093f1eb255670.jpg@160w_220h_1e_1c
title 肖申克的救赎
actor 蒂姆·罗宾斯,摩根·弗里曼,鲍勃·冈顿
time 1994-09-10(加拿大)
score 9.5
index 3
image https://p0.meituan.net/movie/289f98ceaa8a0ae737d3dc01cd05ab052213631.jpg@160w_220h_1e_1c
title 罗马假日
actor 格利高里·派克,奥黛丽·赫本,埃迪·艾伯特
time 1953-09-02(美国)
score 9.1
index 4
image https://p1.meituan.net/movie/6bea9af4524dfbd0b668eaa7e187c3df767253.jpg@160w_220h_1e_1c
title 这个杀手不太冷
actor 让·雷诺,加里·奥德曼,娜塔莉·波特曼
time 1994-09-14(法国)
score 9.5
index 5
image https://p1.meituan.net/movie/b607fba7513e7f15eab170aac1e1400d878112.jpg@160w_220h_1e_1c
title 泰坦尼克号
actor 莱昂纳多·迪卡普里奥,凯特·温丝莱特,比利·赞恩
time 1998-04-03
score 9.5
index 6
image https://p0.meituan.net/movie/da64660f82b98cdc1b8a3804e69609e041108.jpg@160w_220h_1e_1c
title 唐伯虎点秋香
actor 周星驰,巩俐,郑佩佩
time 1993-07-01(中国香港)
score 9.1
index 7
image https://p0.meituan.net/movie/46c29a8b8d8424bdda7715e6fd779c66235684.jpg@160w_220h_1e_1c
title 魂断蓝桥
actor 费雯·丽,罗伯特·泰勒,露塞尔·沃特森
time 1940-05-17(美国)
score 9.2
index 8
image https://p0.meituan.net/movie/223c3e186db3ab4ea3bb14508c709400427933.jpg@160w_220h_1e_1c
title 乱世佳人
actor 费雯·丽,克拉克·盖博,奥利维娅·德哈维兰
time 1939-12-15(美国)
score 9.1
index 9
image https://p1.meituan.net/movie/ba1ed511668402605ed369350ab779d6319397.jpg@160w_220h_1e_1c
title 天空之城
actor 寺田农,鹫尾真知子,龟山助清
time 1992-05-01
score 9.0
index 10
image https://p0.meituan.net/movie/b0d986a8bf89278afbb19f6abaef70f31206570.jpg@160w_220h_1e_1c
title 辛德勒的名单
actor 连姆·尼森,拉尔夫·费因斯,本·金斯利
time 1993-12-15(美国)
score 9.2

这个爬虫是不是很简单，通过这两个简单的实例我们了解到爬虫的基础流程，也大致掌握前面这些库的用法，此外我们在做数据采集少不了保存，后面我会有一篇博客专门介绍这个。

vscode怎么装python_vscode如何安装python
vscode安装python的方法：1、在vscode的扩展中输入"extinstallpython"安装python插件打开VScode，Ctrl+p输入"extinstallpython"，搜索时间可能会比较长安装过程不能停止，否则重新安装；2、在配置文件“settings.json”修改python的安装路径修改用户设置-settings.json，将"python.pythonPath":
Bumblebee Sophia77呀
第一次凌晨四点才睡第一次绕了大半个沈阳第一次尝试吃牛蛙第一次去沈北今天真的超级难忘不知道以后还会不会再见希望自己可以更努力一点好好做计划不仅在学习也要在生活今晚早点睡明天开始最好不要把自己的时间约给别人啦管理好自己的时间!加油!晚安呐期待遇到我的Bumblebee~
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
中性笔|小女子一枚 Kitekiss
女为悦己者容，我对这话的理解就是，要时刻美起来，不为别的，只为自己高兴，哈哈。美有外表之美，亦有内秀之美。外表的美需要禀赋的三分天成，加上后天的七分修饰。哪有那么多禁得住岁月这把杀猪刀雕刻的天生丽质呢？美，也是需要学习和修行的。内秀之美需要书的润色，艺的养成，德的克己，善的加持。却待如何得之？毋须赘言，必要有一颗蓬勃向上的心才行。此画为中性笔人物练习，用时60分钟。画时用眼用手用心，协调一致，能画
偷懒一下，用复盘来打卡吧晨曦_NZ
0326每日复盘今日行动（做了什么）1、背单词2、更文3、研究学校关于孩子在家学习的一些要求（语言太重要了，英语学习不能停呀）4、共读群打卡统计5、关注学习群的消息6、继续陪孩子做学习计划7、回听七姐分享今日见识（学到了什么）利用好碎片时间其实以前一直觉得自己挺会利用碎片时间的，但是最近却发现以前的时间利用，学到的全是碎片知识，而且如果当时不记录，很快就会忘掉。所以，现在都是尽量把握整块时间专心学
生活记事北伟张
与您分享易经课程收获：1.阴阳是我们学习大道的钥匙。2.敞开心扉才能和更多的人交朋友。3.不要有杂念，过去的事情就学会放下，不要纠结。4.主动付出主动索取，我们是主人，一切都是大大方方的。5.不要胡思乱想，胡说八道，胡作非为！
推荐：React与WebRTC构建的1对1视频聊天应用潘俭渝Erik
推荐：React与WebRTC构建的1对1视频聊天应用去发现同类优质开源项目:https://gitcode.com/在这个数字化的时代，实时通信技术为我们提供了无限的可能性，而WebRTC（WebReal-TimeCommunication）正是其中的佼佼者。今天，我们向您推荐一个基于React框架实现的简单1对1视频聊天室示例项目，它集成了WebRTC和屏幕共享API，为学习和实践WebRTC
【教程4＞第9章＞第8节】通过FPGA实现RGB图像转换为CMYK图像——verilog实现与MATLAB辅助验证 fpga和matlab #fpga开发 CMYK RGB 教程4 verilog
本课程学习成果预览(FPGA测试结果通过MATLAB显示)目录1.软件版本2.通过FPGA实现RGB图像转CMYK3.RGB图像转CMYK的测试3.1步骤一：生成测试样本3.2步骤二：通过testbench调用X2.bmp3.3步骤三：vivado仿真3.4步骤四：MATLAB辅助验证4.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》
家长如何教育孩子正确面对挫折？育见未晚
挫折是人生中不可避免的一部分，而正确面对挫折是每个人都需要学会的技能。作为家长，我们应该教育孩子正确面对挫折，帮助他们克服困难，成长为坚强、有信心的人。1.帮助孩子理解挫折的正常性首先，家长应该帮助孩子理解挫折是人生中不可避免的一部分，每个人都会经历。家长应该让孩子知道，挫折并不意味着失败，而是一次学习和成长的机会。例如，当孩子在学习上遇到挫折时，家长可以告诉他们这是正常的，鼓励他们接受挫折并从中
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
关于python的一些面试题
1.技术面试题（1）TCP与UDP的区别是什么？答：在工作机制上TCP采用三次握手四次挥手的机制保障信息传递的稳定性，更适合文件的传输和下载。而UDP采用的是直接传输和直接接受的机制提高信息传递的高效性，更适合点对点的实时交流的环境。（2）DHCP和DNS的作用是什么？答：DHCP相当于网络中的智能管家，他会自动将局域网内的设备进行配置包括但不限于：IP地址、子网掩码、DNS服务器地址。而DNS相
Android音视频探索之旅 | Webrtc 1对1音视频通话核心流程分析慢行的骑兵音视频 android 音视频 webrtc
一.前言使用Webrtc实现1对1的音视频通话，先从Web端进行学习要比直接从Android端进行学习要轻松许多（若没有JS和Html以及Node基础，查找相关基础教程，能梳理代码的逻辑即可）。本文Android端接入Webrtc是通过引入官方的sdk来实现的。本文涉及到的Demo代码包含三部分，服务器端、Web端、Android端。服务器端使用的是Node，Web使用的是Html和JS，Andr
Kotlin介绍江上清风山间明月 Android kotlin 开发语言 android
文章目录1.Kotlin是什么？（身份介绍）2.Kotlin为什么受欢迎？（核心魅力-四大亮点）3.Kotlin看起来什么样？（一瞥语法）4.学习Kotlin能做什么？（应用场景）5.给0基础学习者的建议总结一下Kotlin给你的印象1.Kotlin是什么？（身份介绍）一句话定义：Kotlin是一种现代的、简洁的、安全的、实用的编程语言。谁创造的？一家叫JetBrains的公司（他们做了很多程序员
python里面ca_Python SSL服务器提供中间CA证书洗心岛 python里面ca
我使用Python(2.7)SSL模块编写一些服务器代码，如下所示：ssock=ssl.wrap_socket(sock,ca_certs="all-ca.crt",keyfile="server.key",certfile="server.crt",server_side=True,ssl_version=ssl.PROTOCOL_TLSv1)全部-约阴极射线管'包含签名CA证书和根CA证书：-
服务器搭建python响应https,python实现简单的https服务器
以下提供一个简单的方式快速部署一个https服务器，用于非生产环境的测试使用，如果是正式的生产环境，考虑到性能安全等因素，就不要使用这个了。1、使用pyOpenSSL库：#coding:utf-8fromBaseHTTPServerimportHTTPServer,BaseHTTPRequestHandlerfromSocketServerimportThreadingMixInfromSocke
Leetcode刷题笔记——哈希表篇 code_lover_forever Leetcode刷题笔记 leetcode 笔记散列表 python
Leetcode刷题笔记——哈希表篇一、哈希表在面试中的高频考题第一题：两数之和Leetcode1:两数之和：中等题（详情点击链接见原题）给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标python代码解法classSolution:deftwoSum(self,nums:List[int],target:int)->
Various ways to integrate Python and C (C++) a13393665983 c/c++人工智能 python
VariouswaystointegratePythonandC(C++)KoichiTamura'sblog:VariouswaystointegratePythonandC(C++)VariouswaystointegratePythonandC(C++)ThisisoriginallywhatIwroteinamailIsenttoafriendofmine.Imodifieditalitt
How to setup a Mac with Python dev tools whackw mac mac
HowtosetupaMacwithPythondevtoolsNotesforhowtosetupa64-bitMacwithimportantPythondevelopmenttoolsDeprecated–clickhereforupdatedpageforYosemiteversionCreatedbyTrondKristiansenon27.7.2009,andlastupdated05
理解module, script, library, package in Python ikeepo #小白学Python module library script package setup
OverviewPythonmodulesandPythonpackagesaretwomechanismsthatfacilitatemodularprogramming.AscriptisaPythonfilethat’sintendedtoberundirectly.AmoduleisaPythonfilethat’sintendedtobeimportedintoscriptsorothe
【CVPR 2025】低光增强RT-X Net（红外辅助结构引导）--part2代码讲解 BOB_BOB_BOB_ 低光增强LLIE transformer 深度学习人工智能神经网络计算机视觉
【CVPR2025】本文参考论文RT-XNET:RGB-THERMALCROSSATTENTIONNETWORKFORLOW-LIGHTIMAGEENHANCEMENTTransformerDesign下面对方法论部分进行详细分析论文提出网络类似Retinexformer/SG-LLIE，感兴趣的可以在我的主页进一步学习论文地址：arxiv代码地址：github文章目录**代码段1:导入与辅助函数
Python 服务器端与客户端的加密通信（SSL/TLS）解析现实逃脱计划TA python ssl 网络
```htmlPython服务器端与客户端的加密通信（SSL/TLS）解析在当今互联网时代，数据安全变得越来越重要。为了保护数据在传输过程中的安全，使用SSL/TLS协议进行加密通信成为了一种常见的做法。本文将详细介绍如何在Python中实现服务器端和客户端之间的SSL/TLS加密通信。什么是SSL/TLS？SSL（SecureSocketsLayer）和TLS（TransportLayerSec
2021年，村干部又有新任务了，扎根一线，三农将成核心工作！边缘的荳子
今天是初五，一些地方的农民兄弟已经开始准备春耕的事情了。而对于不少村子的村干部来说，也是在学习《农村工作会议》纪要的时间。那么，今年的村干部又有哪些新的任务呢？今天荳子就和大家重点地聊一聊。荳子解析：三农将成为新一年村干部工作的核心，扎根一线，落地才是根本。1、2021年，村干部各有哪些新任务荳子细细通读了关于《农村工作会议》纪要的相关内容，然后给大家总结了一下，以便大家能有一个简单的了解。按照我
C++ 模板保姆级详解——template＜class T＞(什么是模板？模板分哪几类？模板如何应用？)_template<；class t>； 2401_87287231 c++java 算法
类模板的分离编译五、总结六、共勉一、前言在我们学习C++时，常会用到函数重载。而函数重载，通常会需要我们编写较为重复的代码，这就显得臃肿，且效率低下。重载的函数仅仅只是类型不同，代码的复用率比较低，只要有新类型出现时，就需要增加对应的函数。此外，代码的可维护性比较低，一个出错可能会导致所有的重载均出错。那么，模板的出现，就让这些问题有了解决方案，所以本次博客将为大家详细的讲解C++的模板！！二、什
python教程修订版 Ethan learn English python
9/23Inthiscourse,I'mgoingtoteachyoueverythingyouneedtoknowtogetstartedprogramminginPython.Now,Pythonisoneofthemostpopularprogramminglanguagesoutthere在众多的……中.Andit'sbyfar目前为止oneofthemostsõughtafter受欢迎的
Three ways to run a python script file captainOO7 python
Pythonoffersthreedistinctwaystorunascriptormodule,andeachoneaffectssys.path,__name__,andimportbehaviorinsubtlebutimportantways.Let’sbreakthemdownclearly:TheThreeWaystoRunPythonCode1.DirectScriptExecut
读阿米巴模式第三十一天格雷_Jacky张
宁波市北仑格雷塑料制品有限公司读书会张镇第五章阿米巴经营的具体运行五、执行计划前两节讲了计划制定，本小节详细讲述了计划执行。在阿米巴模式下，执行计划也是有很多要点能够让我们学习的。我把书中要点合并，觉得主要是以下几个方面。第一，重视现场，亲自确认。这里的要点是虽然计制定了计划，并已经在执行，但是领导人要习惯于亲自到现在去视察，确认实际的生产情况。一方面是通过现场的亲自确认，搜集一手信息，随时协助下
转自宗大大关于学习观点爱生活的欢欢
20191208富足人生必须懂重要问题--成长--1学习今天和成甲老师对话，主要讨论如何学习，如何思考，如何成长，很多年轻人问我“作为一个普通人，应该怎么成长等等“这样的问题，我真的觉得年轻人缺乏职场成长课，学校里也没有这个课程，其实成长真的很复杂，里面有选择、态度、努力的程度、学习的投入、情商、智商等很多因素，如果没有人指导，靠自己摸索，的确有难度。今天开始讲讲成长，我先讲一下我的观点，首先我觉
Python自动化神器：Pyautogui库实战指南码界奇点 Python python 自动化开发语言 python3.11 ui
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。持续学习，不断总结，共同进步，为了踏实，做好当下事儿~非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨TheStart点点关注，收藏不迷路文章目录1.PyAutoGUI简介1.1什么是PyAutoGUI？1.2安装
儿童英语学习随笔随风猪
下笔写这篇文章时，儿子已经入学英孚英语班一周年，一年前，自己在各个英语教育机构之间，带着孩子多方试课，现如今，回想起来有点过度关注了，其实就是一个学习第二种语言的培训机构，非要区分好坏，可能就像选择普通话和方言一样，哪个血统更纯正而已，选择英孚，选择的就是它的英文外教，当时的想法是，中国人说汉语总比歪果仁说汉语强吧，反过来也是一样的道理。从初开始的各种担忧，到孩子慢慢的感兴趣，我始终坚信要想干好任
我们始终要靠自己，才能活得漂亮小文有话说
文/小文有话说1他家境殷实，父母对他疼爱有加，只有成绩好，其他一律不需要他插手，他为了赢得父母开心和宠爱，努力保持成绩优异，曾是父母眼中的好孩子，是老师眼中的好学生，是同学中的学习榜样。高考前所有人对他报以非常大的期望，为了考好不辜负亲朋好友的期望，他不断给自己加压，承受高压的他高考失利了，让他与重点大学失之交臂。他不愿再承受复读所带来的重重压力，独自一人拉着行李箱来到外省的二线小城，读着以前家人
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st