孤寒者

两万字博文教你python爬虫requests库【详解篇】

上一篇博文一篇万字博文带你入坑爬虫这条不归路（你还在犹豫什么&抓紧上车）【❤️熬夜整理&建议收藏❤️】被众多爬虫爱好者/想要学习爬虫的小伙伴们阅读之后，很多小伙伴私信我说——大佬搞爬虫都是用的socket套接字嘛？

（苦笑）“那肯定不是啊！python为我们封装了那么多伟大而又简单实用的爬虫库，”不过我想说的是，“ 学啥技术都是从底层抓起，万丈高楼平地起，它也是基于地基稳！ 所以在入坑文中简单地介绍使用了下底层爬虫库——socket！”

而本文，本博主就带领小伙伴们认真地学习一下Python中一大广为使用的爬虫库——Requests——专为人类而构建；有史以来下载次数最多的Python软件包之一！

重点来啦！重点来啦！！

相信有不少小伙伴已经通过我的上篇博文入坑爬虫，而本篇文讲解的Requests库也是学习爬虫之路的一大最为重要的知识点，在我们日后的爬虫开发中使用的最多的也是它哦！

学好Requests，你的爬虫之路日后将畅通无阻！！！

❤️两万字Requests库详解❤️

1.简介
2.发起请求
- 参数详解：
- - （1）请求方法method：
  - （2）统一资源定位符url
  - （3）传递url参数params
  - （4）传递form表单数据——data
  - （5）传递json数据——json
  - （6）自定义headers
  - （7）自定义cookies
  - - ①获取cookies：
    - ②使用Cookie维持登录状态的两种方法：
  - （8）设置代理proxies
  - （9）重定向allow_redirects
  - （10）禁止证书验证vertify
  - （11）设置超时timeout
  - - 拓展：
  - （12）文件上传
  - （13）Prepared Request
- 总结：
3.接收响应
- （1）响应内容
- （2）字符编码
- （3）二进制数据
- （4）json数据
- （5）状态码
- （6）响应报头
- （7）服务器返回的cookies
- （8）查看响应的url
- 总结：
4.使用requests库进行实战：
- （1）基操之实战项目一：进行百度贴吧指定搜索内容获取到的html源码头5页的爬取！
- - ①上代码：
  - ②实现效果：
- （2）升级版操作之实战项目二：使用session实现人人网登录状态维持
- - ①上代码：
  - ②实现效果：
5.In The End！

1.简介

Requests是一个优雅而简单的Python HTTP库，专为人类而构建。

Requests是有史以来下载次数最多的Python软件包之一，每天下载量超过400,000次。

之前的urllib（后面会更新文章讲解哦——敬请期待！）做为Python的标准库，因为历史原因，使用的方式可以说是非常的麻烦而复杂的，而且官方文档也十分的简陋，常常需要去查看源码。与之相反的是，Requests的使用方式非常的简单、直观、人性化，让程序员的精力完全从库的使用中解放出来。

Requests的官方文档同样也非常的完善详尽，而且少见的有中文官方文档&&英文官方文档。

2.发起请求

根据入坑文可知爬虫：模拟浏览器发送请求，获取响应。那么首先我们就要学会使用Requests发起请求！

Requests的请求不再像urllib一样需要去构造各种Request、opener和handler，直接使用Requests构造的方法，并在其中传入需要的参数即可。

源码：
def request(method, url,params=None, data=None, headers=None, cookies=None,
    timeout=None, allow_redirects=True, proxies=None,verify=None,  json=None):

参数详解：

（1）请求方法method：

每一个请求方法都有一个对应的API，比如GET请求就可以使用get()方法：

而POST请求就可以使用post()方法，并且将需要提交的数据传递给data参数即可：

而其他的请求类型，都有各自对应的方法：

知识点补给站——POST请求方法的小知识点：
	应用场景：登录注册
	需要传输大文本内容的时候使用（post请求对长度没有要求）。

（2）统一资源定位符url

URL（Universal Resource Locator），即统一资源定位符。

（3）传递url参数params

传递URL参数也不用再像urllib中那样需要去拼接URL，而是简单的，构造一个字典，并在请求时将其传递给params参数：

import requests
params = {
     'key': 'value1', 'key2': 'value2'}
resp = requests.get("http://httpbin.org/get", params=params)
print(resp.url)

小知识点：
有时候我们会遇到相同的url参数名，但有不同的值，而python的字典又不支持键的重名，那么我们可以把键的值用列表表示：

import requests
params = {
     'key': 'value1', 'key2': ['value2', 'value3']}
resp = requests.get("http://httpbin.org/get", params=params)
print(resp.url)

知识点补给站：
	本文大多使用的URL站点是httpbin.org，它可以提供HTPP请求测试哦！

（4）传递form表单数据——data

将放进data的数据转换为form表单数据,同时不能传json数据，json数据为null。（注意：json和data二者只能同时存在其一）

（5）传递json数据——json

将json对应的数据放进json参数里。

（6）自定义headers

是不是很熟悉，这就是反爬第一阶段常用套路！

如果想自定义请求的Headers，同样的将字典数据传递给headers参数。

（7）自定义cookies

①获取cookies：

第一种方法：

import requests
from fake_useragent import UserAgent

r = requests.get('https://www.baidu.com',headers = {
     'User-Agent': UserAgent().random})
print(r.cookies)

print('*'*25)
print(r.cookies.items())
print('*'*25)

for key,value in r.cookies.items():
    print(key + "=" + value)

此处我们首先调用cookies属性即可成功得到cookies，可以发现他是个RequestsCookieJar类型。然后用items()方法将其转化为元组组成的列表，遍历输出每一个Cookie的名称和值，实现Cookie的遍历解析。

第二种方法：

使用requests.utils.dict_from_cookiejar:把cookiejar对象转化为字典。

import requests
from fake_useragent import UserAgent

url = 'http://www.baidu.com'
response = requests.get(url=url, headers ={
     'user-agent': UserAgent().random})
cookie = requests.utils.dict_from_cookiejar(response.cookies)
print(cookie)

"""
输出：
{'BAIDUID_BFESS': '52EB4182E0877DFD9DBA8E0793772027:FG=1', 'H_PS_PSSID': '33802_34222_31254_33848_34112_34107_26350_34093', 'BDSVRTM': '0', 'BD_HOME': '1'}
"""

②使用Cookie维持登录状态的两种方法：

第一种方法： 请求头中加入网页复制的cookie来维持登录状态！

实战之以QQ空间为例来说明：
（如何在网页中获取Cookie：首先登录QQ空间，将Headers中的Cookie内容复制即可！）

import requests

headers = {
     
    'cookie': '此处换为你自己的Cookie即可！',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36'
}

r = requests.get('https://user.qzone.qq.com/这里写上要登录的QQ号/infocenter', headers=headers)
print(r.text)

我们发现，结果中包含了登录后的结果，说明我们登录成功！

第二种方法： 通过cookies参数来设置，直接将cookies构造字典传入即可！

（8）设置代理proxies

什么是代理？
代理IP是一个ip ,指的是一个代理服务器。
要晓得正向代理和反向代理是啥？
知不知道服务器的地址做为判断标准：知道就是正向代理，不知道就是反向代理。

3. 代理ip的分类（常见有两大分类依据：匿名度&&协议）
①匿名度：
透明代理：目标服务器可以通过代理找到你的ip；
匿名代理：两者之间；
高匿代理：在爬虫中经常使用，目标服务器无法获取你的ip。
②协议：（根据网站使用的协议不同，需要使用响应的协议代理服务）
http代理：目标的url为http协议；
https代理：目标url为https协议；
socks代理：只是简单的传递数据包，不关心是何种协议，比http和HTTPS代理消耗小，可以转发http和https的请求。

为何使用代理？
（1）让服务器以为不是同一个客户端在请求；
（2）防止我们的真实地址被泄露，防止被追究。
用法：
当我们需要使用代理时，同样构造代理字典，传递给proxies参数。

（9）重定向allow_redirects

在网络请求中，我们常常会遇到状态码是3开头的重定向问题，在Requests中是默认开启允许重定向的，即遇到重定向时，会自动继续访问。

（10）禁止证书验证vertify

有时候我们使用了抓包工具，这个时候由于抓包工具提供的证书并不是由受信任的数字证书颁发机构颁发的（比如，之前12306的整数就没有被官方CA机构信任，就会出现证书验证错误的结果！），所以证书的验证会失败，这时我们就需要关闭证书验证。

解决方法：在请求的时候把verify参数设置为False就可以关闭证书验证了。
小拓展：
但是关闭验证后，会有一个比较烦人的warning，它建议我们给它指定证书。我们可以通过设置忽略警告的方式来屏蔽它：

（11）设置超时timeout

为了防止服务器不能及时响应，而设置一个超时时间，即超过了这个时间还没有得到响应，那就报错！
设置访问超时——设置timeout参数即可。（这个时间的计算是发出请求到服务器返回响应的时间）
实际上：请求分为两个阶段，即连接（connect）和读取（read）。下面设置的timeout将用作连接和读取这二者的timeout总合。如果分别指定，就可以传入一个元组：timeout=(5,11,30)。

拓展：

实际上，我们在多数爬虫开发中——超时参数timeout是和retrying模块（刷新）一起使用的！

使用retrying模块提供的retry方法
通过装饰器的方式，让被装饰的函数反复执行
retry中可以传入参数 stop_max_attempt_number，让函数报错后继续重新执行，达到最大执行次数的上限，如果每次都报错，整个函数报错，如果中间有一个成功，程序继续往后执行

①代码讲解：

import requests
from retrying import retry

headers = {
     "User-Agent":"Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/532.2 (KHTML, like Gecko) Chrome/4.0.222.3 "}

@retry(stop_max_attempt_number=3)   # stop_max_attempt_number=3最大执行3次，还不成功就报错
def _parse_url(url):                                            # 前面加_代表此函数，其他地方不可调用
    print("*"*100)
    response = requests.get(url, headers=headers, timeout=3)    # timeout=3超时参数，3s内
    assert response.status_code == 200                          # assert断言，此处断言状态码是200，不是则报错
    return response.content.decode()


def parse_url(url):
    try:
        html_str = _parse_url(url)
    except Exception as e:
        print(e)
        html_str = None
    return html_str

if __name__ == '__main__':
    # url = "www.baidu.com"         # 这样是会报错的！
    url = "http://www.baidu.com"
    print(parse_url(url))

②实现效果一：无法爬取到的情况：url = “www.baidu.com”!

②实现效果二：正确爬取到的情况：url = “http://www.baidu.com”!

（12）文件上传

假如有的网站需要上传文件，我们也可以使用requests实现！

当前脚本的同一目录下有个名为1.jpg的文件：

import requests

files = {
     'file': open('1.jpg','rb')}
r = requests.post("http://httpbin.org/post", files=files)
print(r.text)

这个网站会返回响应，里面包含files这个字段，而form字段是空的，这证明文件上传部分会单独有个files字段来标识。

（13）Prepared Request

我们知道在urllib中可以将请求表示为数据结构，其中各个参数都可以通过一个Request对象来表示。这在requests中同样可以做到，这个数据结构叫做Prepared Request。如下：

from requests import Request,Session

url = 'http://httpbin.org/post'
data = {
     
    'name':'peter'
}
headers = {
     
    'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.29 Safari/525.13'
}

s = Session()
req = Request('POST', url, data=data, headers=headers)
prepped = s.prepare_request(req)
r = s.send(prepped)
print(r.text)

先用url,data,headers参数构造了一个Request对象，这时需要再调用Session的prepare_request()方法将其转换为一个Prepared Request对象，然后调用send()方法发送即可！

使用较少，但是这样使用的好处是：有了Request这个对象，就可以将请求当作独立的对象来看待，这样在进行队列调度时会非常方便！

总结：

import requests

# res=requests.get("http://httpbin.org/get")       #功能：发起完整的网络请求

'''
源码：
def request(method, url,params=None, data=None, headers=None, cookies=None,
    timeout=None, allow_redirects=True, proxies=None,verify=None,  json=None):
'''

#1.method
# res=requests.post("http://httpbin.org")
# res=requests.delete("http://httpbin.org")

# url  字符串  统一资源定位符

# params    将放进params里的字典数据变为url的请求参数(如果是中文会自动编码)
# test_url="http://httpbin.org/get"
# params={"name":"allen","name2":"哈哈"}
# res=requests.get(url=test_url,params=params)
# print(res.text)

# data   将放进data的数据转换为form表单数据,同时不能传json数据，json数据为null
# test_url="http://httpbin.org/post"            #post提交数据
# data={"stu":"丸子","worker":"鲸落"}
# res=requests.post(url=test_url,data=data)
# print(res.text)

# json      将json对应的数据放进json数据里
# test_url="http://httpbin.org/post"               #post提交数据
# json={"name":"selffly"}    #'{"name":"selffly"}' json串形式也可以传，字典也可以传
# res=requests.post(url=test_url,json=json)
# print(res.text)

# 添加头部信息headers       添加cookies     添加timeout     设置代理proxies=None      verify=False安全验证(为False是忽略证书)
# test_url="http://httpbin.org/get"
# headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36"}
# cookies={"sessionid":"dfsdaaagdgagdf"}
# proxies={'http':"127.0.0.1:8888"}           #这个代理胡写的，不可用
# res=requests.get(url=test_url,headers=headers,cookies=cookies,timeout=10,proxies=proxies)
# print(res.text)

# 测试重定向allow_redirects    如果为True就可以进行重定向；反之不可以
# res_bd=requests.get("http://www.baidu.com",allow_redirects=False)
# print(res_bd.text)

3.接收响应

根据入坑文可知爬虫：模拟浏览器发送请求，获取响应。使用requests发送请求我们OK了，下面我们要做的就是获取响应！

通过Requests发起请求获取到的，是一个requests.models.Response对象。通过这个对象我们可以很方便的获取响应的内容。

（1）响应内容

requests通过text属性，可以获得字符串格式的响应内容。

（2）字符编码

Requests会自动的根据响应的报头来猜测网页的编码是什么，然后根据猜测的编码来解码网页内容，基本上大部分的网页都能够正确的被解码。而如果发现text解码不正确的时候，就需要我们自己手动的去指定解码的编码格式。

（3）二进制数据

而如果你需要获得原始的二进制数据，那么使用content属性即可。

（4）json数据

如果我们访问之后获得的数据是JSON格式的，那么我们可以使用json()方法，直接获取转换成字典格式的数据。

（5）状态码

通过status_code属性获取响应的状态码

应用：
状态码常用来判断请求是否成功，而requests还提供了一个内置的状态码查询对象requests.codes，如下。这里通过比较返回码和内置的成功的返回码，来保证请求得到了正常响应，输出成功请求的消息，否则程序终止，这里我们用requests.codes.ok得到的是成功的状态码200。其实我们直接和200判断就好了！不过像下面这样写B格高！

import requests
r = requests.get('https://www.baidu.com')
print('内置的成功的返回码：',requests.codes.ok)
print('状态码：',r.status_code)
exit() if not r.status_code == requests.codes.ok else print('Request Successfully')

（6）响应报头

通过headers属性获取响应的报头

（7）服务器返回的cookies

通过cookies属性获取服务器返回的cookies

（8）查看响应的url

还可以使用url属性查看访问的url。

总结：

import requests

res=requests.get("http://www.baidu.com")	#发起完整的网络请求
print(res.content)      #字节码格式   图片，视频数据等
res.encoding="utf-8"    #乱码需要解码，修改编码方式
print(res.text)         #字符串格式  非字节码
print(res.status_code)  #状态码
print(res.url)          #获取响应的url
print(res.cookies)      #获取cookies

res=requests.get("http://httpbin.org/get")
print(res.json()["headers"]["User-Agent"])      #使用json()方法将数据变为字典格式
print(res.headers)    #获取响应报头

# 拓展：还可以使用方法获取请求的一些数据：
print("请求头：",res.request.headers)
print("请求的url",res.request.url)
print("请求的cookie",res.request._cookie)    # 返回cookiejar类型

4.使用requests库进行实战：

（1）基操之实战项目一：进行百度贴吧指定搜索内容获取到的html源码头5页的爬取！

①上代码：

import os
import requests

'''
为了构造正确的url！！！
进入百度贴吧进行测试，任意搜索一个信息，通过不同页更换，观察url找寻规律：
https://tieba.baidu.com/f?kw=美食&ie=utf-8&pn=0
https://tieba.baidu.com/f?kw=美食&ie=utf-8&pn=50
https://tieba.baidu.com/f?kw=美食&ie=utf-8&pn=100
https://tieba.baidu.com/f?kw=美食&ie=utf-8&pn=150
'''

class TiebaSpider:
    def __init__(self,tieba_name):
        self.tieba_name = tieba_name
        self.url_temp = "https://tieba.baidu.com/f?kw="+tieba_name+"&ie=utf-8&pn={}"
        self.headers = {
     "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36"}

    # 构造url列表
    def get_url_list(self):
        return [self.url_temp.format(i*50) for i in range(5)]

    # 发送请求，获取响应
    def parse_url(self,url):
        response = requests.get(url,headers=self.headers)
        return response.content.decode()

    # 保存
    def save_html_str(self, html_str, page_num):
        file_path = "{}_第{}页.html".format(self.tieba_name, page_num)
        dir = 'ceshi'
        if not os.path.exists(dir):
            os.mkdir(dir)
        file_path = dir + '/' + file_path
        with open(file_path, "w", encoding='utf-8') as f:
            f.write(html_str)
        print("保存成功！")

    # 实现主要逻辑
    def run(self):
        # 构造url列表
        url_list = self.get_url_list()
        # 发送请求，获取响应
        for url in url_list:
            html_str = self.parse_url(url)
            # 保存
            page_num = url_list.index(url)+1
            self.save_html_str(html_str, page_num)

if __name__ == '__main__':
    name_date = input("请输入你想知道的内容：")
    tieba_spider = TiebaSpider(name_date)
    tieba_spider.run()

②实现效果：

（2）升级版操作之实战项目二：使用session实现人人网登录状态维持

requests模拟登陆的三种方法：

					   1.session：
					        实例化对象
					        session.get(url) #cookie保存在session中
					        session.get(url) #带上保存在session中cookie
					
					   2.cookie方法在headers中
					   3.cookie传递给cookies参数：
					        cookie = {
     "cookie 的name的值":"cookie 的value对应的值"}

①上代码：

import requests

# 1.实例化session
session = requests.Session()

# 2. 使用session发送post请求，对方服务器会把cookie设置在session中
headers = {
     "User-Agent":"Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/532.2 (KHTML, like Gecko) Chrome/4.0.222.3 "}
post_url = "http://www.renren.com/PLogin.do"
post_data = {
     "email":"自己的账号","password":"自己的密码"}

session.post(post_url,data=post_data,headers=headers)

# 3.请求个人主页，会带上之前的cookie，能够请求成功
profile_url = "http://www.renren.com/自己进自己主页会有的/profile"
response = session.get(profile_url,headers=headers)

with open("renren.html", "w", encoding="utf-8") as f:
    f.write(response.content.decode())

②实现效果：

5.In The End！

从现在做起，坚持下去，一天进步一小点，不久的将来，你会感谢曾经努力的你！

本博主会持续更新爬虫基础分栏及爬虫实战分栏，认真仔细看完本文的小伙伴们，可以点赞收藏并评论出你们的读后感。并可关注本博主，在今后的日子里阅读更多爬虫文！

	如有错误或者言语不恰当的地方可在评论区指出，谢谢！
	如转载此文请联系我说明用以意并标注出处及本博主名，谢谢！

你可能感兴趣的:(初级Python网络爬虫开发,爬虫,两万字博文,原力计划,requests库详解,附实战小项目)

70.我真的需要吗？鑫玺海燕
昨天和路君晴晴她们一起出去玩，再路过一棵松树的时候，菲儿说那边有松果妈妈你帮我捡，我就给菲儿捡了四颗，然后我想着还有两个小朋友，就给旭旭剪了一颗，然后又给大烁捡了一颗，然后又给晴晴和路君各捡了一颗，晴晴说你给我们每个人都捡了你给你自己捡了吗？我说对哦！我还没给自己捡呢！然后我又给自己捡了一个，当时的想法就是，我对每一个人好，也要想着爱自己别把自己给忘了，这件事就这样就过去了，直到刚才回想起那个画面
2018-11-18 丽华1117
图片发自App我的决定：是继续改善和父亲的关系让他感受我的爱。行动计划：1、每周为他洗脚2次。2、每周沟通三次以上每次不低于半小时。3、每周陪他散步2次。4、为他准备特别的生日礼物。2018.11.19计划6：30--9：00起床洗漱，为孩子做早餐。出发上班。9：00--11：30微信＋电话链接生日顾客和电话回访10个顾客。11：30--13：00午餐，午休13：00--14：30健身14：00-
构建数据恢复的坚实防线：MySQL数据恢复策略的文档化实践 liuxin33445566 mysql 数据库
数据恢复策略的文档化是确保企业在面临数据丢失或损坏时能够迅速、有效地恢复数据的关键步骤。在MySQL数据库环境中，这一过程尤为重要，因为良好的文档化不仅有助于规范恢复流程，还能提高团队的响应速度和恢复成功率。本文将详细探讨如何在MySQL中实现数据恢复策略的文档化，包括策略规划、文档编写、存储管理以及持续更新等方面。1.引言在当今的数字化时代，数据的价值日益凸显，数据丢失或损坏可能给企业带来巨大的
推荐一个跨平台的Unity插件——UnityPython 夏磊讳
推荐一个跨平台的Unity插件——UnityPythonunity-pythonPythonpluginforUnity3D.项目地址:https://gitcode.com/gh_mirrors/un/unity-python在游戏开发领域，尤其是Unity引擎的爱好者中，能够灵活运用多种编程语言进行创作无疑是提高效率和创新力的一大助力。今天要向大家介绍的UnityPython，正是这样一个能让
墙角梅南国红豆521
墙角数枝梅凌寒独自开遥知不是雪为有暗香来墙角里的几枝腊梅，凌寒自开，可谓独步严冬，而王安石一眼看穿此为梅而非雪，是因香气扑鼻而来，完全无法阻挡其“优势”。但若这梅花不是这般香，作者会不会错认为雪呢？每个班级里都有几株“墙角梅”，他们就如同失了香气的梅花，徒有其“表”，而无其“韵”。之所以这样说，是因为教育上有一个这样的现象：老师带学生无数，而最终能够记得的是“两头”的学生。“好”头的学生出类拔萃，
两件事 Gavin_f0ce
深夜十点，我把换洗的衣服堆成一座小山，揉成一团，像灌篮似的投进了洗衣机。启动，注水，定时，倒入洗衣液，动作行云流水，一切得心应手，剩下的事情就是回到房间等待。坐床上发会呆，却不经意发觉了两件事:第一件:人厌旧的速度太快第二件：人身上的耐性太少。回想买衣服的时候精挑细选，从手提袋中急忙的取出，站在镜子前反复比划，迫不及待的想象下一刻镜子里出现帅气的身影。于是乎小心翼翼的拆掉标价牌，从这一刻起，这件物
UnityPython：在Unity中无缝运行Python代码岑晔含Dora
UnityPython：在Unity中无缝运行Python代码unity-pythonPythonpluginforUnity3D.项目地址:https://gitcode.com/gh_mirrors/un/unity-python注意：这个项目已不再维护。但如果你想了解过去如何在Unity中集成Python的方案，那么请继续阅读。项目介绍UnityPython是一个为Unity3D开发的游戏引
Unity-Python 项目使用指南秋或依
Unity-Python项目使用指南unity-pythonPythonpluginforUnity3D.项目地址:https://gitcode.com/gh_mirrors/un/unity-python项目介绍Unity-Python是一个开源项目，旨在为Unity游戏引擎提供Python脚本支持。该项目通过集成Python解释器，使得开发者可以在Unity中使用Python进行游戏逻辑的编
探索Unity3D的新边界：Unity3D-Python-Editor 孔岱怀
探索Unity3D的新边界：Unity3D-Python-Editor1、项目介绍在游戏开发的世界中，Unity3D以其强大的功能和易用性赢得了开发者们的青睐。然而，当我们的开发需求变得越来越复杂时，内置的C#语言可能无法满足所有需求。Unity3D-Python-Editor是一个创新的开源项目，它将Python集成到Unity3D环境中，利用IronPython库提供了一个友好且高效的Pyth
力扣第39题组合总和 buaichifanqie leetcode 算法 c++
前言记录一下刷题历程力扣第39题组合总和组合总和原题目：给你一个无重复元素的整数数组candidates和一个目标整数target，找出candidates中可以使数字和为目标数target的所有不同组合，并以列表形式返回。你可以按任意顺序返回这些组合。candidates中的同一个数字可以无限制重复被选取。如果至少一个数字的被选数量不同，则两种组合是不同的。对于给定的输入，保证和为target的
婆婆的故事--三兄弟--上学篇（九）淡妆浓抹两相宜
五一假期，老三带我去医院做了白内障手术。手术后医生要求多平躺，不能侧卧，不能低头，害怕安装的晶体移位。回到家，我听从医生的吩咐乖乖的躺在床上，老三每隔十分钟给我滴一次眼药水。大概是怕我无聊，老三和他媳妇都坐在床边陪我聊天。床头写字桌上的相框里有许多老照片，老三拿出他的毕业照给他老婆看，“看的出来哪个是我吗？”我躺在床上闭着眼睛听他两口子说话。小双说：“这个是你。”老三说：“嗯。我是个分界线，从我往
Rust模块std::thread 夏天又到了 Rust编程与项目实战 rust java 算法
【图书介绍】《Rust编程与项目实战》-CSDN博客《Rust编程与项目实战》(朱文伟，李建英)【摘要书评试读】-京东图书(jd.com)Rust到底值不值得学，之一-CSDN博客Rust到底值不值得学，之二-CSDN博客Rust多线程编程概述-CSDN博客12.3.2等待所有线程完成在前面的实例中，主线程没等到派生线程执行完毕就结束了，从而整个进程就会结束。那么怎么让派生线程执行完毕呢？答案是通
Go Web 编程 PDF book_longker 资源 golang pdf 开发语言
GoWeb开发必读:《BuildingWebApplicationswithGo》PDF资源分享找寻良久,终于寻得这本珍贵资源!现在我免费分享给大家你是否正在学习Go语言开发Web应用?是否想要提升Go并发编程能力?这本书绝对不容错过!关于这本书《BuildingWebApplicationswithGo》是一本非常实用的GoWeb开发指南:以构建网络论坛为案例,全面讲解GoWeb开发️深入剖析请
Golang学习手册 book_longker #Golang golang 开发语言后端
Golang基础第一章：Golang的安装和开发工具配置1.1安装1.2vscode插件安装失败解决方法1.3新建项目，编译文件1.4Go语言开发工具Vscode配置第二章：GoLang定义变量、fmt包、Println、Printf、Go语言注释2.1.变量声明和定义变量声明变量定义变量初始化2.2.fmt包打印输出Print、Println、Printf2.3.Go语言中的注释单行注释多行注释
仕考网：公务员面试流程介绍仕考网面试职场和发展
通知进面信息——资格审查——面试签到——抽签候考面试形式：面试分为结构化和无领导小组两种形式1.在结构化面试中，当轮到某位考生时，引导员将在候考室宣布其编号，随后考生跟随引导人员前往考场入口。考生在开始考试时需回答自己的考试号，但不得透露姓名，面试过程通常涉及题本或考官直接提问两种方式。2.公务员面试中的无领导小组讨论环节，要求考生在进入考场后自行选择或通过抽签确定座位。此环节所有考生将面对相同题
仕考网：行测与职测的区别，你了解多少？仕考网职场发展
1.考试类别和科目行测是公务员考试的科目，职测是事业单位考试的科目。这两者的考试类别不同，分别对应不同的岗位。2.考试内容行测和职测在考试内容上有很多相同的地方，都包括常识判断、言语理解与表达、判断推理、数量关系和资料分析等五大模块但是每个模块的具体考查内容上并不完全相同。职测中的言语理解与表达模块除了考查逻辑填空和片段阅读外，还会考查语句表达模块，包括句子排序、错别字、读音、病句、歧义句、判断推
力扣第213题“打家劫舍 II” 数据分析螺丝钉 LeetCode刷题与模拟面试面试算法 leetcode 经验分享 python
在本篇文章中，我们将详细解读力扣第213题“打家劫舍II”。通过学习本篇文章，读者将掌握如何使用动态规划来解决这一问题，并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释，以便于理解。问题描述力扣第213题“打家劫舍II”描述如下：你是一个专业的小偷，计划偷窃沿街的房屋，每间房内都藏有一定的现金。这一整条街的所有房屋都围成一圈，这意味着第一个房屋和最后一个房屋是紧挨着的。同时，相邻的
图卡说书丨数字时代，是什么让我们注意力分散，逐渐丧失决断能力？期待重生
大家好，我是你们的老朋友——佩溪_love，很高兴与大家再次相聚【图卡说书】今天我将继续为大家带来顶级脑力教练吉姆·奎克的重磅作品《无限可能》的第二章：人类学习力就是我们的超能力原文再现1、必须终身学习，才能跟上世事变化。2、每个人都有等待唤醒的「超能力」，这里的超能力现实生活中实用的能力，比如自由穿梭于书页之间的阅读能力、机器人般超强的记忆力、像激光一样的专注力、无垠无限的创造力、清晰的思维、细
C8T6超绝模块--USART串口通信挽天技术 STM32模块示例代码单片机嵌入式硬件
C8T6超绝模块–USART串口通信注意USART的引脚请自行查阅相应的数据手册本模块主要实现功能实现开发板与电脑通信，在开发板上电时通过USART发送一串字符串给电脑，然后开发板进入中断接收等待状态，如果电脑有发送数据过来，开发板就会产生中断，我们在中断服务函数接收数据，并马上把数据返回发送给电脑大纲USART原理和结构体讲解代码流程（收发数据）代码流程（实现控制）具体案例USART原理和结构体
精准打击：Conda中conda remove命令的高效使用指南 2401_85743969 conda
精准打击：Conda中condaremove命令的高效使用指南在Python项目开发中，Conda作为Anaconda发行版中的包管理器，不仅用于安装和管理包，还提供了强大的环境管理功能。随着项目的发展，有时需要从环境中移除不再需要的包。condaremove命令是Conda提供的一个关键工具，它允许用户从当前环境中移除特定的包。本文将详细介绍如何在Conda中使用condaremove命令，并通
优化PyCharm：让IDE响应速度飞起来 2401_85743969 ide pycharm python
优化PyCharm：让IDE响应速度飞起来PyCharm，作为一款功能强大的集成开发环境（IDE），在提供丰富功能的同时，有时也会出现响应慢的问题。这不仅影响开发效率，还可能打击开发者的积极性。本文将详细介绍如何在PyCharm中解决IDE响应慢的问题，包括诊断原因、优化设置和一些实用的技巧。PyCharm响应慢的原因硬件资源限制：内存或CPU资源不足。大量未关闭的标签和窗口：打开的文件和窗口过多
在Docker容器中部署Flask应用：一步步的实践指南 2401_85743969 算法 dnn 学习
引言Docker是一种流行的容器化技术，它允许开发者将应用及其依赖打包到一个轻量级、可移植的容器中。Flask是一个用Python编写的轻量级Web应用框架。Gunicorn是一个PythonWSGIHTTP服务器，用于生产环境。本文将详细介绍如何在Docker容器中运行Flask应用，包括使用Gunicorn作为服务器。Docker容器化的优势环境一致性：确保应用在不同环境中的一致性。开发与生产
薇诺娜可以长期用吗，薇诺娜一年搞几次活动测评君高省
薇诺娜每年两次五折活动时间，薇诺娜是药妆还是医用护肤品查看更多关于薇诺娜每年两次五折活动时间，薇诺娜是药妆还是医用护肤品的文章薇諾娜藥妝護膚品始創於上世紀九十年代末，是昆明貝泰妮生物科技有限公司旗下的高端功能性醫學護膚品牌。薇諾娜藥妝護膚品提供針對東方人皮膚結構研發的壹系列產品及皮膚問題解抉方案，已成為中國各大醫院皮膚科公認的專業醫學護膚品牌，覆蓋國超過70%醫院。正基于此，立足于云南特殊的功能草
前端面试题（附答案）持续更新中…… 卖家导航程序员前端
块标签：div、h1~h6、ul、li、table、p、br、form。特征：独占一行，换行显示，可以设置宽高，可以嵌套块和行行标签：span、a、img、textarea、select、option、input。特征：只有在行内显示，内容撑开宽、高，不可以设置宽、高（img、input、textarea等除外）。5.清除浮动⭐⭐⭐父级div定义overflow:hidden结尾处加空div标签c
sequelpro mysql 图形化工具仔仔H
Sequelproformac是Macos平台上的一款帮助用户快速连接SQL数据库的Mac软件，sequelproformac是MySQL数据库管理应用程序。连接版本安装包版本1.1.2链接:https://pan.baidu.com/s/19cBQU8DyyXU1pjskjwI1Jw提取码:j2ka
20180601 恍然如梦
武晓敏焦点网络初级九期坚持分享第97天驻马店西平20180601今天是六一儿童节，打开朋友圈大部分说的都是节日，我们班十几岁的青少年也兴奋着要过儿童节，为什么这样的一个节日引起各个年龄阶段人的关注呢？或许童年时期才是我们每个人一生中最无忧无虑最快乐的时光吧！愿我们每个人都有一颗孩子般无忧无虑的童心，像孩子般简单的快乐！
牛客错题集3，前端开发结构卖家导航程序员 oracle 数据库
在Thread中有一个成员变量ThreadLocals，该变量的类型是ThreadLocalMap,也就是一个Map，它的键是threadLocal，值为就是变量的副本。通过ThreadLocal的get()方法可以获取该线程变量的本地副本，在get方法之前要先set,否则就要重写initialValue()方法。ThreadLocal的使用场景：数据库连接：在多线程中，如果使用懒汉式的单例模式创
第二十四章 rust中的运算符重载余识- Rust从入门到精通 rust 开发语言后端
注意本系列文章已升级、转移至我的自建站点中，本章原文为：rust中的运算符重载目录注意一、前言二、基本使用三、常用运算符四、通用约束一、前言C/C++中有运算符重载这一概念，它的目的是让即使含不相干的内容也能通过我们自定义的方法进行运算符操作运算。比如字符串本身是不能相加的，但由于C++中的String重载了运算符+，所以我们就可以将两个字符串进行相加、但实际的含义其实是拼接。而rust中同样存在
LeetCode 算法：单词拆分 c++ Codec Conductor 力扣算法 leetcode c++动态规划字符串数据结构数据结构与算法
原题链接：单词拆分难度：中等⭐️⭐️题目给你一个字符串s和一个字符串列表wordDict作为字典。如果可以利用字典中出现的一个或多个单词拼接出s则返回true。注意：不要求字典中出现的单词全部都使用，并且字典中的单词可以重复使用。示例1：输入:s=“leetcode”,wordDict=[“leet”,“code”]输出:true解释:返回true因为“leetcode”可以由“leet”和“co
【.NET全栈】ASP.NET开发Web应用——LINQ技术 JosieBook #.NET全栈 .net asp.net linq
文章目录一、LINQ基础1、LINQ简介2、延迟执行3、LINQ表达式简介1、基本查询语法2、投影新对象3、过滤和排序4、分组和聚合5、联合查询二、LINQtoDataSet操作内存表1、LINQtoDataSet简介2、类型化DataSet三、LINQtoSQL操作数据库1、数据实体类2、DataContext类介绍3、在ASP.NET中应用LINQtoSQL4、自动生成数据实体类5、生成存储过
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

两万字博文教你python爬虫requests库【详解篇】

❤️两万字Requests库详解❤️

1.简介

2.发起请求

参数详解：

（1）请求方法method：

（2）统一资源定位符url

（3）传递url参数params

（4）传递form表单数据——data

（5）传递json数据——json

（6）自定义headers

（7）自定义cookies

①获取cookies：

②使用Cookie维持登录状态的两种方法：

（8）设置代理proxies

（9）重定向allow_redirects

（10）禁止证书验证vertify

（11）设置超时timeout

拓展：

（12）文件上传

（13）Prepared Request

总结：

3.接收响应

（1）响应内容

（2）字符编码

（3）二进制数据

（4）json数据

（5）状态码

（6）响应报头

（7）服务器返回的cookies

（8）查看响应的url

总结：

4.使用requests库进行实战：

（1）基操 之 实战项目一：进行百度贴吧指定搜索内容获取到的html源码头5页的爬取！

①上代码：

②实现效果：

（2）升级版操作 之 实战项目二：使用session实现人人网登录状态维持

①上代码：

②实现效果：

5.In The End！

你可能感兴趣的:(初级Python网络爬虫开发,爬虫,两万字博文,原力计划,requests库详解,附实战小项目)

（1）基操之实战项目一：进行百度贴吧指定搜索内容获取到的html源码头5页的爬取！

（2）升级版操作之实战项目二：使用session实现人人网登录状态维持