孙大花

爬虫之Handler处理器和自定义Opener

一、Handler处理器和自定义Opener

opener是 request.OpenerDirector 的实例，我们之前一直都在使用的urlopen，它是一个特殊的opener（也就是模块帮我们构建好的）。
但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级功能。所以要支持这些功能：
使用相关的 Handler处理器来创建特定功能的处理器对象；
然后通过 request.build_opener()方法使用这些处理器对象，创建自定义opener对象；
使用自定义的opener对象，调用open()方法发送请求。
如果程序里所有的请求都使用自定义的opener，可以使用request.install_opener() 将自定义的 opener 对象定义为全局opener，表示如果之后凡是调用urlopen，都将使用这个opener（根据自己的需求来选择）

二、Handler处理器和自定义Opener

from urllib import request

# 构建一个HTTPHandler 处理器对象，支持处理HTTP请求
http_handler = request.HTTPHandler()

# 调用request.build_opener()方法，创建支持处理HTTP请求的opener对象
opener = request.build_opener(http_handler)

# 构建 Request请求
request = request.Request("http://www.baidu.com/")

# 调用自定义opener对象的open()方法，发送request请求
response = opener.open(request)

# 获取服务器响应内容
print(response.read().decode('utf-8'))
这种方式发送请求得到的结果，和使用request.urlopen()发送HTTP/HTTPS请求得到的结果是一样的。

如果在 HTTPHandler()增加 debuglevel=1参数，还会将 Debug Log 打开，这样程序在执行的时候，会把收包和发包的报头在屏幕上自动打印出来，方便调试，有时可以省去抓包的工作。
# 仅需要修改的代码部分：
# 构建一个HTTPHandler 处理器对象，支持处理HTTP请求，同时开启Debug Log，debuglevel 值默认 0
http_handler = request.HTTPHandler(debuglevel=1)

# 构建一个HTTPHSandler 处理器对象，支持处理HTTPS请求，同时开启Debug Log，debuglevel 值默认 0
https_handler = request.HTTPSHandler(debuglevel=1)

三、ProxyHandler处理器（代理设置）

使用代理IP，这是爬虫/反爬虫的第二大招，通常也是最好用的。很多网站会检测某一段时间某个IP的访问次数(通过流量统计，系统日志等)，如果访问次数多的不像正常人，它会禁止这个IP的访问。所以我们可以设置一些代理服务器，每隔一段时间换一个代理，就算IP被禁止，依然可以换个IP继续爬取。request中通过ProxyHandler来设置使用代理服务器，下面代码说明如何使用自定义opener来使用代理：

from urllib import request

headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"
}

# 构建了两个代理Handler，一个有代理IP，一个没有代理IP
httpproxy_handler = request.ProxyHandler({"http" : "221.5.54.6:808"})
nullproxy_handler = request.ProxyHandler({})

proxySwitch = True #定义一个代理开关

# 通过 request.build_opener()方法使用这些代理Handler对象，创建自定义opener对象
# 根据代理开关是否打开，使用不同的代理模式
if proxySwitch:
opener = request.build_opener(httpproxy_handler)
else:
opener = request.build_opener(nullproxy_handler)

req = request.Request("http://www.baidu.com/",headers=headers)

# 1. 如果这么写，只有使用opener.open()方法发送请求才使用自定义的代理，而urlopen()则不使用自定义代理。
response = opener.open(req)

# 2. 如果这么写，就是将opener应用到全局，之后所有的，不管是opener.open()还是urlopen() 发送请求，都将使用自定义代理。
# request.install_opener(opener)
# response = request.urlopen(req)

print(response.read().decode('utf-8'))
注意：

如果使用的代码服务器是61.135.217.7:80，由于此代理服务器是有道的，所以在返回时，返回的不是百度page的内容，而是有道page的内容

免费的开放代理获取基本没有成本，我们可以在一些代理网站上收集这些免费代理，测试后如果可以用，就把它收集起来用在爬虫上面。

免费短期代理网站举例：

西刺免费代理IP

快代理免费代理

如果代理IP足够多，就可以像随机获取User-Agent一样，随机选择一个代理去访问网站。

from urllib import request
import random

headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"
}

proxy_list = [
{"http" : "60.211.166.42:63000"},
{"http": "221.5.54.6:808"}
]

# 随机选择一个代理
proxy = random.choice(proxy_list)
print(proxy)

# 构建了两个代理Handler，一个有代理IP，一个没有代理IP
httpproxy_handler = request.ProxyHandler(proxy)
nullproxy_handler = request.ProxyHandler({})

proxySwitch = True #定义一个代理开关

req = request.Request("http://www.baidu.com/",headers=headers)

# 1. 如果这么写，只有使用opener.open()方法发送请求才使用自定义的代理，而urlopen()则不使用自定义代理。
response = opener.open(req)

print(response.read().decode('utf-8'))
但是，这些免费开放代理一般会有很多人都在使用，而且代理有寿命短，速度慢，匿名度不高，HTTP/HTTPS支持不稳定等缺点（免费没好货）。

四、ProxyBasicAuthHandler处理器（代理授权验证）

from urllib import request,parse

# 私密代理授权的账户
user = "mr_mao_hacker"
# 私密代理授权的密码
passwd = "sffqry9r"
# 私密代理 IP
proxyserver = "61.158.163.130:16816"

# 1. 构建一个密码管理对象，用来保存需要处理的用户名和密码
passwdmgr = request.HTTPPasswordMgrWithDefaultRealm()

# 2. 添加账户信息，第一个参数realm是与远程服务器相关的域信息，一般没人管它都是写None，后面三个参数分别是代理服务器、用户名、密码
passwdmgr.add_password(None, proxyserver, user, passwd)

# 3. 构建一个代理基础用户名/密码验证的ProxyBasicAuthHandler处理器对象，参数是创建的密码管理对象
# 注意，这里不再使用普通ProxyHandler类了
proxyauth_handler = request.ProxyBasicAuthHandler(passwdmgr)

# 4. 通过 build_opener()方法使用这些代理Handler对象，创建自定义opener对象，参数包括构建的 proxy_handler 和 proxyauth_handler
opener = request.build_opener(proxyauth_handler)

# 5. 构造Request 请求
req = request.Request("http://www.baidu.com/")

# 6. 使用自定义opener发送请求
response = opener.open(req)

# 7. 打印响应内容
print(response.read())
说明：

HTTPPasswordMgrWithDefaultRealm()：用来保存私密代理的用户密码
ProxyBasicAuthHandler()：用来处理代理的身份验证。

五、HTTPBasicAuthHandler处理器（Web客户端授权验证）

有些Web服务器（包括HTTP/FTP等）访问时，需要进行用户身份验证，爬虫直接访问会报HTTP 401 错误，表示访问身份未经授权，如果我们有客户端的用户名和密码，我们可以通过下面的方法去访问爬取：如果我们有客户端的用户名和密码，我们可以通过下面的方法去访问爬取：

from urllib import request,parse

# 用户名
user = "test"
# 密码
passwd = "123456"
# Web服务器 IP
webserver = "http://192.168.199.107"

# 1. 构建一个密码管理对象，用来保存需要处理的用户名和密码
passwdmgr = request.HTTPPasswordMgrWithDefaultRealm()

# 2. 添加账户信息，第一个参数realm是与远程服务器相关的域信息，一般没人管它都是写None，后面三个参数分别是 Web服务器、用户名、密码
passwdmgr.add_password(None, webserver, user, passwd)

# 3. 构建一个HTTP基础用户名/密码验证的HTTPBasicAuthHandler处理器对象，参数是创建的密码管理对象
httpauth_handler = request.HTTPBasicAuthHandler(passwdmgr)

# 4. 通过 build_opener()方法使用这些代理Handler对象，创建自定义opener对象，参数包括构建的 proxy_handler
opener = request.build_opener(httpauth_handler)

# 5. 可以选择通过install_opener()方法定义opener为全局opener
request.install_opener(opener)

# 6. 构建 Request对象
req = request.Request("http://192.168.199.107")

# 7. 定义opener为全局opener后，可直接使用urlopen()发送请求
response = request.urlopen(req)

# 8. 打印响应内容
print(response.read())

六、http.cookiejar和HTTPCookieProcessor处理器

在Python3处理Cookie，一般是通过http.cookiejar模块和 urllib.request模块的HTTPCookieProcessor处理器类一起使用。

http.cookiejar模块：主要作用是提供用于存储cookie的对象
HTTPCookieProcessor处理器：主要作用是处理这些cookie对象，并构建handler对象。

http.cookiejar主要的对象有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar

CookieJar：管理HTTP cookie值、存储HTTP请求生成的cookie、向传出的HTTP请求添加cookie的对象。整个cookie都存储在内存中，对CookieJar实例进行垃圾回收后cookie也将丢失。
FileCookieJar (filename,delayload=None,policy=None)：从CookieJar派生而来，用来创建FileCookieJar实例，检索cookie信息并将cookie存储到文件中。filename是存储cookie的文件名。delayload为True时支持延迟访问访问文件，即只有在需要时才读取文件或在文件中存储数据。
MozillaCookieJar (filename,delayload=None,policy=None)：从FileCookieJar派生而来，创建与Mozilla浏览器 cookies.txt兼容的FileCookieJar实例。
LWPCookieJar (filename,delayload=None,policy=None)：从FileCookieJar派生而来，创建与libwww-perl标准的 Set-Cookie3 文件格式兼容的FileCookieJar实例。
其实大多数情况下，我们只用CookieJar()，如果需要和本地文件交互，就用 MozillaCookjar() 或 LWPCookieJar()

6.1、获取Cookie，并保存到CookieJar()对象中

from urllib import request
import http.cookiejar as cookielib

# 构建一个CookieJar对象实例来保存cookie
cookiejar = cookielib.CookieJar()

# 使用HTTPCookieProcessor()来创建cookie处理器对象，参数为CookieJar()对象
handler=request.HTTPCookieProcessor(cookiejar)

# 通过 build_opener() 来构建opener
opener = request.build_opener(handler)

# 4. 以get方法访问页面，访问之后会自动保存cookie到cookiejar中
opener.open("http://www.baidu.com")

## 可以按标准格式将保存的Cookie打印出来
cookieStr = ""
for item in cookiejar:
cookieStr = cookieStr + item.name + "=" + item.value + ";"

## 舍去最后一位的分号
print(cookieStr[:-1])

6.2、访问网站获得cookie，并把获得的cookie保存在cookie文件中

from urllib import request
import http.cookiejar as cookielib

# 保存cookie的本地磁盘文件名
filename = 'cookie.txt'

# 声明一个MozillaCookieJar(有save实现)对象实例来保存cookie，之后写入文件
cookiejar = cookielib.MozillaCookieJar(filename)

# 使用HTTPCookieProcessor()来创建cookie处理器对象，参数为CookieJar()对象
handler = request.HTTPCookieProcessor(cookiejar)

# 通过 build_opener() 来构建opener
opener = request.build_opener(handler)

# 创建一个请求
response = opener.open("http://www.baidu.com")

# 保存cookie到本地文件
cookiejar.save()

6.3、从文件中获取cookies，作为请求的一部分

from urllib import request
import http.cookiejar as cookielib

# 创建MozillaCookieJar(有load实现)实例对象
cookiejar = cookielib.MozillaCookieJar()

# 从文件中读取cookie内容到变量
cookiejar.load('cookie.txt')

# 使用HTTPCookieProcessor()来创建cookie处理器对象，参数为CookieJar()对象
handler = request.HTTPCookieProcessor(cookiejar)

# 通过 build_opener() 来构建opener
opener = request.build_opener(handler)

response = opener.open("http://www.baidu.com")

print(response.read().decode("utf-8"))

6.4、通过cookie爬取需要用户名密码验证的网站

from urllib import request
import http.cookiejar as cookielib

# 通过CookieJar()类构建一个cookieJar()对象，用来保存cookie的值
cookie = cookielib.CookieJar()

# 通过HTTPCookieProcessor()处理器类构建一个处理器对象，用来处理cookie
# 参数就是构建的CookieJar()对象
cookie_handler = request.HTTPCookieProcessor(cookie)

opener = request.build_opener(cookie_handler)

# 自定义opener的addheadders的参数，可以赋值HTTP报头参数
opener.addheaders = [("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36")]

# 需要登录的账户和密码
data = {"email":"[email protected]", "password":"xxxxxx"}

# 通过urlencode()转码
postdata = request.urlencode(data)

# 构建Request请求对象，包含需要发送的用户名和密码
request = request.Request("http://www.renren.com/PLogin.do", data = postdata)

# 通过opener发送这个请求，并获取登录后的Cookie值，
opener.open(request)

# opener包含用户登录后的Cookie值，可以直接访问那些登录后才可以访问的页面
response = opener.open("http://www.renren.com/410043129/profile")

# 打印响应内容
print(response.read())

7-1 树的同构 studyovo_Hz hbu数据结构 c++算法数据结构
7-1树的同构分数20作者陈越单位浙江大学给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2，则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的，因为我们把其中一棵树的结点A、B、G的左右孩子互换后，就得到另外一棵树。而图2就不是同构的。现给定两棵树，请你判断它们是否是同构的。输入格式:输入给出2棵二叉树树的信息。对于每棵树，首先在一行中给出一个非负整数N(≤10)，即该树
特斯拉机器人来喽玉菲炫舞
特斯拉要出机器人了，名字叫optimus，听到这个消息我很是兴奋，但也因此和朋友争执了一番。我喜欢特斯拉，是因为我把埃隆·马斯克当成我的科技偶像。我看到特斯拉的机器人兴奋也是因为这个。大概三到五年之后量产售价不到2万美元，听到这里就很兴奋，这几年要努力赚钱，希望能成为第一批用户。为什么和朋友争执呢？我说以后我要成为他的第一批用户，朋友就说机器人有什么好的？我说当然好啦，他能够驾驶车辆，还能够拿起重
axios拦截器今天学习了ma
页面发送http请求，很多情况我们要对请求和其响应进行特定的处理；如果请求数非常多，单独对每一个请求进行处理会变得非常麻烦，程序的优雅性也会大打折扣。好在强大的axios为开发者提供了这样一个API：拦截器。axios拦截器分为两种：请求拦截器和响应拦截器拦截器是在客户端产生的。（统一处理http请求和响应）主要作用就是对客户端发送的请求或接收来自服务端返回的响应进行统一的检测和修改等操作。1.请
闭嘴比开口更难：成年人沟通的 5 个生存真相耐思nice～一点思考人工智能笔记程序人生考研学习方法职场和发展
为什么真诚的话反而伤人？那些让人生开挂的沟通高手，都偷偷掌握了这些反直觉生存法则。你有没有算过，每天说出去的话，有多少真正达到了目的？和父母聊职业规划，最后变成互相指责；和同事讨论方案，莫名陷入谁对谁错的争论。我们总以为，把心里话说出来就是真诚，却忘了成年人的世界里，沟通从来都是一场精心设计的“战略游戏”。一、信息管制：有些话，是关系的“防弹衣”心理学中的“认知失调理论”揭示：当人们接收到超出自己
软件工程学概述：从危机到系统化工程的演进之路耐思nice～软件工程导论-张海藩软件工程
在数字化时代，软件已渗透到生活的方方面面。可你是否遇到过这样的情况：一款期待已久的软件，上线后却频繁崩溃、漏洞百出，不仅影响使用体验，还可能造成巨大损失？这背后，或许就与“软件危机”有着千丝万缕的联系。今天，我们就一同走进软件工程的世界，探寻其发展脉络与核心知识。一、软件危机1.1软件危机的介绍软件危机是指在计算机软件的开发和维护过程中所遇到的一系列严重问题。这些问题主要表现在：软件开发成本和进度
十种常用数据分析模型耐思nice～数据分析数据分析人工智能机器学习数学建模
1-线性回归（LinearRegression）场景：预测商品销售额优点：简单易用，结果易于解释缺点：假设线性关系，容易受到异常值影响概念：建立自变量和因变量之间线性关系的模型。公式：[y=b_0+b_1x_1+b_2x_2+...+b_nx_n]代码示例：importpandasaspdfromsklearn.linear_modelimportLinearRegressionfromsklea
巜燃野少年的天空》观后感蓝色之光
很久没有去影院看电影了，闺蜜向姐头一天晚上就买好了票约我这次一定要陪她一起去看场电影。最主要的是为了让我开心，本不想出门，因为长沙的天热实在太热。但听到她的用心，毫不犹豫地第二天清晨就出门了。青春朝气活力梦想影片主要讲述了一群臭味相投的“咸鱼少年”和一群参差不齐的“杂草少女”打破偏见与隔阂、一起热舞的青春故事。让我印象最深刻感动的是剧中女主角小黄的爸爸，为了鼓励女儿跳舞编造了一个长达十八年的童话，
2021-12-01 慢品清茶细读书
这个女人不一般早就听说这个女人不一般，可我一点也不信。她，长相不咋地，身材不咋地，不爱化妆，穿着更是普通，根本没有哪一点能提现出让人得以外表上的赏心悦目。她是从车间流水线上提到检验班的，上来就直接干上了检验班班长的职务。这职务当时在整个生产环节挺牛的。上要和销售部门直接对接，下要和各个车间各个工序和环节接洽。即要面对销售的质量关，还要检查监督并及时反馈产品生产过程存在的一些问题，挺重要的岗位。会干
FPGA通信设计十问
1.FFT有什么用？FFT（快速傅里叶变换）是离散傅里叶变换（DFT）的高效实现算法，它的核心作用是快速将信号从时域转换到频域，从而简化信号分析和处理的过程。自然界的信号（如声音、图像、电磁波等）通常以时域形式存在（即随时间变化的波形），但很多特性（如频率成分、谐波分布）在频域中更易分析FFT能快速计算信号中各频率分量的幅值和相位。可以进行频率拆分与实时处理。FFT是“信号的透视镜”，让我们能“看
什么是网关，网关有哪些作用? oneday&oneday 微服务面试经验分享网络
网关(Gateway)是在计算机网络中用于连接两个独立的网络的设备，它能够在两个不同协议的网络之间传递数据。在互联网中，网关是一个可以连接不同协议的网络的设备，比如说可以连接局域网和互联网，它可以把局域网的内部网络地址转换成互联网上的合法地址，从而使得局域网内的主机可以与外界通信。在计算机系统中，网关可以用于实现负载均衡、安全过滤、协议转换等功能。具体来说，网关可以分为以下几种:应用网关:用于应用
Python 字符串前缀详解
Python提供了多种字符串前缀，用于改变字符串的创建方式和行为。下面我将全面汇总并详细解释每种字符串前缀的特性、用途和示例。1.原始字符串(RawString)-r前缀语法:r'...'或r"..."作用:禁用字符串中的转义字符反斜杠\被视为普通字符特别适合处理包含大量反斜杠的字符串适用场景:文件路径(特别是Windows路径)正则表达式需要保留反斜杠的任何情况示例:#普通字符串中的转义path
经过二十多天以来，我终于创建了自己的专题欢迎来投稿！汪汪了梦了
我们虽然平凡，但我们活得实实在在，活的幸福安康，那些富贵的人，有他的难处，绞尽脑汁的活着你一不小心就带上手铐了，有的后院出火，家庭破裂，我们这些平凡的人，要珍惜现在，精神和物质生活会越来越好，祝福我们！图片发自App我在这里等你哟！
分享一个 CloudFlare 免费版完美抵挡 CC 攻击的 WAF 规则明月登楼 CloudFlare 网络
最近Telegram群里做DDoS/CC攻击收费服务的好像越来越多了，有几个得瑟的还宣称什么采用了十八层穿透技术，保证击穿任何CDN防火墙（说实话，牛逼吹的很响，我是一句没看懂，我就知道十八层地狱！），还叫嚣打不死不收费！有几个国内QQ群著名老鼠屎们差点儿原地高潮了，又开始四处作妖梦想着能推销他们的高防服务器和CDN大赚一笔了。可惜，这些东西在CloudFlare面前也就是免费版再加个定制的WAF
矩阵A+B（矩阵相加） crystaljy 矩阵
Description在数学中，矩阵是一个按照长方阵列排列的复数或实数集合，最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。矩阵是高等代数学中的常见工具，也常见于统计分析等应用数学学科中。在物理学中，矩阵于电路学、力学、光学和量子物理中都有应用；计算机科学中，三维动画制作也需要用到矩阵。矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实
2018年10月检视呼和浩特张勇
2018年10月检视10月月度检视2018年11月呼和浩特市1101张勇没有反思的人生不值得过-苏格拉底【2018年10月目标及检视完成情况】罗列年度目标及完成进度10/12一，家庭和睦夫妻恩爱（同频共情的沟通与高质量的陪伴。）二，子女成为对社会有用之人（全家人正在养成物品归位和整洁的习惯，科学的学习习惯，生活习惯和高效使用优质的教育资源）三，做一个不惧困难，有能力面对各种问题的人（学习易效能，善
哈马斯和真主党官员曝伊朗安全官员策划了对以色列的突袭聚百宝国际时事谈
《华尔街日报》报道哈马斯和真主党高级成员称伊朗安全官员帮助策划了周六哈马斯对以色列的突然袭击并于上周一在贝鲁特举行的一次会议上批准了这次袭击哈马斯领导人伊斯梅尔·哈尼亚表示哈马斯正处于伟大胜利的边缘伊朗制造的产品由伊朗伊斯兰共和国船只从沙希德·拉吉或霍梅尼港运输到叙利亚拉塔基亚然后从那里运往黎巴嫩南部打击区域与阿尔塔巴兹卸载iSO集装箱的港口区域完全匹配真主党精锐特种部队拉杜安部队已部署到与以色列
C++ 数组详解：从基础到实战光の java jvm 前端
一、数组的定义与核心特性（一）什么是数组？数组（Array）是C++中用于存储一组相同类型元素的连续内存空间。它通过一个统一的名称（数组名）和索引（下标）来访问每个元素，是实现批量数据管理的基础工具。（二）核心特性特性说明同类型所有元素必须是同一数据类型（如int、double）连续性元素在内存中连续存放，地址递增（&arr[i+1]=&arr[i]+sizeof(类型)）固定大小数组声明时需指定
积极阳光的早安心语，唯美精致，送给开启崭新一天的你若浅_
看似不起眼的日复一日会在将来的某一天突然让你看到坚持的意义加油1、生活不可以等待别人来安排，要自已去争得和拼搏；而无论其结果是喜是悲，但能够慰藉的是，你总不枉在这世界上活了一场。早安！2、人生就是一个磨练的过程，如果没有酸甜苦辣，你始终都不会成熟。因此，我们应该在阳光下灿烂，风雨中奔跑，对自己说一声：昨天挺好，今日很好，明天会更好！早安！3、做最真实最漂亮的自己，依心而行，别回头，别四顾，别管别人
班长朋友 Visby
文:‖18岁的小仙女图片发自App昨天与一简友聊天，聊了一天做了什么什么事，然后我说，我陪一个朋友聊了一整天的天。可能这种事情在以前是一件很经常的事情，可是，从上个学期开始认真对待生活的时候，已经没有这样和一个人聊这么久了。因为冰哥的书相识虽然我称呼朋友班长，也知道他是一个第八年的老班长。可是，与班长朋友的相识，却是因为冰哥的书，一系列的书。刚从部队回来，闲来无事便每每翻阅冰哥写的一系列的书，然后
德语学习 | 德语版小王子经典语句，一起学习背诵起来吧~ whisper29
▽一说到书名，大家都不陌生，但是它的作者可能很多人都说不出名字，是不是因为这位法国作家的名字太长？作者安托万·圣埃克苏佩里本身是一个热爱飞行热爱自由的人，或许书中的飞行员“我”是作者自己，同时小王子也是作者内心的另一个自己。通过两个自我的对话交流，内心敏感“我”不断寻找感情的寄托，爱情、友情。比如爱情，在遥远的家乡，他有一个玫瑰一样美丽而骄傲的爱人。但是他又躁动不安，向往诗和远方。在远方，他遇见了
《梦界》何时何地爱梦的我
何时何地。夏日炎炎，多数人在这种时刻都是昏昏欲睡的。有些许的无聊，于是跑到学生的教室里和他们一起待着，孩子的精气神总是和年龄相关的。我趴在桌子上假装思考问题，大屏幕突然出现视频。内容看上去有些许的熟悉啊，这不就是我之前在教研室和老师们一起学习探讨的视频吗，怎么在这里。若是正常的研讨视频我也就不在意了，爱吃的我完全在视频里是从头吃到尾啊。若不是孩子们早知我的属性，怕是要笑话我吧，不过他们依旧是笑了。
2020.1.16 100个基本雪月颜城
《100个基本》到手了，封面倒是很漂亮，纸张不是想象中的麻纸，而是光滑的纸张。翻开页面，左边是简单的一句话，右边是一些针对这句话的阐述。以前没有接触过这类书，因此第一感觉是又一本浪费纸张的书。《人间值得》已经读了两遍，故事和道理都讲的很好，相比之下，《100个基本》给我的第一印象并不是很好，只是冲着作者的名气和好看的封面买的，希望读完之后能对它有所改观。
6月3日亲子阅读日记 - 草稿竹林笛声
今晚自主阅读《生气汤》和《巴巴爸爸的河马桥》，这两本都是以前重复阅读过的。《生气汤》是一本情绪管理绘本，这一天小男孩霍斯过得很不高兴。他带着一肚子怒气回家。但是，他妈妈却说要煮汤。当水滚开时，妈妈对着锅子大叫，她要小男孩也照样做。在阅读前发生了一件事儿，女儿拿着姐姐的一把刻刀在玩，我告诉她这不是玩具，它很锋利，会伤害到人，可她非要玩。她爸爸就强行从她手中拿过来，这时她暴跳如雷，发疯的大哭…哭了一会
还在了解什么是SSL证书嘛？一篇文章让你简洁明了的认识SSL
一、SSL基础概念1.SSL的定义SSL（SecureSocketsLayer）是一种安全协议，用于在客户端（如浏览器）与服务器之间建立加密通信。它通过数据加密、身份验证和完整性保护，确保网络传输的安全性。2.SSL与TLS的关系SSL：由网景公司于1994年开发，最后一个版本是SSL3.0。TLS（TransportLayerSecurity）：SSL的升级版，由IETF标准化。目前主流版本是T
一篇文章带你搞懂什么是类的继承 paid槮 python 开发语言
如果需要在类Microwave的基础上添加“增加”或“修改”功能且继续保留原来的类Microwave，可以使用继承的方式。继承是指在原类的基础上创建一个新类,而新类会自动获取原类中的所有属性和方法。原类称为父类,新类称为子类。类的继承方式在创建新类时，class后面的括号用于继承父类且不接收参数。class子类名(父类名):def__init(self,子参数):super().__init__(
MySQL主从模式的数据一致性 mysia
MySQL单机的数据一致性MySQL作为一个可插拔的数据库系统，支持插件式的存储引擎，在设计上分为Server层和StorageEngine层。在Server层，MySQL以events的形式记录数据库各种操作的Binlog二进制日志，其基本核心作用有：复制和备份。除此之外，我们结合多样化的业务场景需求，基于Binlog的特性构建了强大的MySQL生态，如：DTS、单元化、异构系统之间实时同步等等
Java实习模拟面试之创玖科技：前后端交互、数据库、Spring全家桶、性能优化与Linux实战培风图南以星河揽胜 java面试 java 面试科技
关键词：JavaScript、JQuery、Ajax、Node.js、MySQL、Oracle、Spring、SpringMVC、SpringBoot、MyBatis、Tomcat、Redis、Nginx、Linux、Git、SAAS系统开发一、面试开场：自我介绍面试官提问：请做个自我介绍，重点突出你的技术栈和项目经验。候选人回答：您好，我是一名计算机科学与技术专业的应届生，具备扎实的Java基础
鸣潮礼包兑换码有哪些鸣潮哪个手游平台充值折扣最大诸葛村夫123
现在的手机游戏有很多类型，不管是传奇，仙侠，二次元，还是策略类型，他们都有一个共同点，就是想着法的要玩家充值，虽然有时候能够找到几个礼包兑换码，但是和游戏中的哪些“神豪”相比，完全不是一个档次，大家不知道的是，其实哪些所谓的“神豪”账号，其中隐藏很多特殊人群，也就是大家经常说的“手游内部号”。谈及手游内部号，很多人会觉得它远离我们，或者是种不好的存在。对此，今天我想为大家全方位地详细解读一下。我作
你有焦虑病吗？陈大芬
日更第三天，竟然现在在上下班开车的路上，也会想今天写些什么的问题，貌似是个不错的信号。不过仍对要写什么有些无措，觉得有很多东西可写，但真正下笔时却又不知如何开始，如何生动有趣。罢了，和自己和解。先不要想太多，我觉得写作是个武功修炼的过程，现在自己还处于武功一级的状态，本就不应该期待现在就看到十级的效果。慢慢来，说不定，我也在写到100篇的时候就突然开窍了，下笔如有神了。好了，心里建设完毕。今天有四
（C++）list，vector，set，map四种容器的应用——教务管理系统（测试版）（list基础教程）（vector基础教程）（set基础教程）（map基础教程）（STL库教程）双叶836 STL C++C++基础教学 C++项目 c++list 开发语言数据结构 c语言
目录源代码：代码详解：第1步：搭建基础框架和数据结构目标：定义数据结构和全局容器练习任务：第2步：实现学生管理功能（使用map）目标：添加学生和显示学生列表练习任务：第3步：实现课程管理功能（使用vector）目标：添加课程和显示课程列表练习任务：第4步：实现选课功能（使用list）目标：学生选课和退课功能练习任务：主函数：多说一点（重点代码解释）：一.list>enrollments;代码详解1
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

爬虫之Handler处理器和自定义Opener

你可能感兴趣的:(爬虫之Handler处理器和自定义Opener)