Kelvin写代码

2.17.3-Python爬虫(requests登录)

文章目录

1. 环境与配置
- 1.1. 创建一个pure python项目
- 1.2. 集成configparser
- 1.3. 集成selenium
- - 1.3.1. pycharm安装selenium包
  - 1.3.2. 下载自己chrome浏览器版本对应的驱动
  - 1.3.3. 编写python、selenium、chrome连通性代码
- 1.4. 集成requests
- 1.5. 集成MongoDB
2. 目标背景介绍（xdclass.net）
- 2.1. 目标1：获取列表信息（Reqeusts GET方式）
- - 2.1.1. 分析
  - 2.1.2. 实现
- 2.2. 目标2：登录（Requests POST方式）
- - 2.2.1. 分析
  - 2.2.2. 实现
- 2.3. 目标3：访问个人中心（Reqeusts GET方式）
- - 2.3.1. 分析
  - 2.3.2. 实现
3. 目标背景介绍（若依ruoyi）
- 3.1. 目标1：若依登录（Requests POST方式）
- - 3.1.1. 分析
  - 3.1.2. 实现探索
  - 3.1.3. 验证登录信息（cookie-editor插件）
  - 3.1.4. 登录（Requests 携带cookie）
  - 登录（requests 使用 Session()）
4. 目标背景介绍（siwei.me）
- 4.1. 目标1：使用requests获取列表all
- - 4.1.1. 分析
  - 4.1.2. 实现
5. 工具的配置、使用
- 5.1. requests、selemium保存和设置cookie

前言：首先，这是关于python3爬虫的内容。

先思考一个问题，就是在做python爬虫的时候，是否需要用到类似于Django框架？我认为，是不要的，因为一旦使用，那么很多的精力就要消耗在如何去熟悉框架API、配置上去，而非聚焦于如何处理爬虫爬取过程中的问题处理。

当然，为此可能付出的代价就是自己要去写配置文件、orm、可能的server接口等，但这些应该都是比较容易处理的，也更能锻炼对于python基础的掌握，而不是上来就是框架，被框架束缚。

1. 环境与配置

1.1. 创建一个pure python项目

选择Pure Python，取名MyMoney

New environment using代表的是创建一个新的python虚拟环境，这个是为了隔离各个项目对python包的依赖，存放于venv目录

Base interpreter是解释器，选择python3的版本

比较干净，什么也没有，开始动工！因为之前已经调研了很久的selenium、requests等，所以下面比较多的是代码的转移、整理、加工的工作，在这个新工程里从0开始。

还要为这个项目做好版本管理，在gitee上创建项目并上传代码。

 1007  git init 
 1008  touch README.md
 1009  git add .
 1010  git commit -m "first commit"
 1011  git remote add origin https://gitee.com/kelvin11/my-money.git
 1012  git push -u origin "master"

原项目没有.gitignore，需要自己添加

# Byte-compiled / optimized / DLL files
__pycache__/
*.py[cod]
*$py.class

# C extensions
*.so

# Distribution / packaging
.Python
build/
develop-eggs/
dist/
downloads/
eggs/
.eggs/
lib/
lib64/
parts/
sdist/
var/
wheels/
*.egg-info/
.installed.cfg
*.egg
MANIFEST

# PyInstaller
#  Usually these files are written by a python script from a template
#  before PyInstaller builds the exe, so as to inject date/other infos into it.
*.manifest
*.spec

# Installer logs
pip-log.txt
pip-delete-this-directory.txt

# Unit test / coverage reports
htmlcov/
.tox/
.coverage
.coverage.*
.cache
nosetests.xml
coverage.xml
*.cover
.hypothesis/
.pytest_cache/

# Translations
*.mo
*.pot

# Django stuff:
*.log
local_settings.py
db.sqlite3

# Flask stuff:
instance/
.webassets-cache

# Scrapy stuff:
.scrapy

# Sphinx documentation
docs/_build/

# PyBuilder
target/

# Jupyter Notebook
.ipynb_checkpoints

# IPython
profile_default/
ipython_config.py

# pyenv
.python-version

# celery beat schedule file
celerybeat-schedule

# SageMath parsed files
*.sage.py

# Environments
.env
.venv
env/
venv/
ENV/
env.bak/
venv.bak/

# Spyder project settings
.spyderproject
.spyproject

# Rope project settings
.ropeproject

# mkdocs documentation
/site

# mypy
.mypy_cache/
.dmypy.json
dmypy.json

.idea

至此，一个pure python项目就创建好并上到git了。

思考：下一步要做什么呢？直接上代码？

的确是，不过代码是什么类型的代码呢？我认为是配置库要先使用起来，毕竟，不管是连接db还是写一些项目变量，都需要配置文件。python项目的配置库，是通过什么三方库实现的呢？

就是使用：configparser。用法参考网上的博客：https://www.cnblogs.com/tester-blog/p/14814105.html，据此，集成到代码中

再思考：我们准备用什么数据库？

一般可能上mysql，这里其实也考虑用mongodb，毕竟，mongodb跟爬虫更搭，而且，我们的项目中也不适合存在2种db类型，那只能是mongodb和mysql二选一了，目前考虑先上mongodb。

1.2. 集成configparser

在python 3 中ConfigParser模块名已更名为configparser

read(filename) #读取配置文件，直接读取ini文件内容

sections() #获取ini文件内所有的section，以列表形式返回['log', 'mysql']

options(sections) #获取指定sections下所有options ，以列表形式返回['host', 'port', 'user', 'password']

items(sections) #获取指定section下所有的键值对，[('host', '127.0.0.1'), ('port', '3306'), ('user', 'root'), ('password', '123456')]

get(section, option) #获取section中option的值，返回为string类型
# 获取指定的section下的option  127.0.0.1

getint(section,option) # 返回int类型
getfloat(section, option)  # 返回float类型
getboolean(section,option) # 返回boolen类型

一个简单的使用demo

[log]
name = demo
level = INFO
file_ok = True
file_name = demo.log

[mysql]
host=127.0.0.1
port=3306
user=root
password=123456

from configparser import ConfigParser

# 实例化对象
con = ConfigParser()
con.read("conf.ini",encoding="utf-8")
# 获取指定的section和option值
val = con.get("log","name")
print('获取指定的section下的option', type(val), val)

# 获取所有section
section = con.sections()
print("获取配置文件所有的section",section)
# 获取所有options
option= con.options("mysql")
print("获取配置文件所有的option",option)
# 获取指定section下所有的键值对，返回的是一个列表
item = con.items("mysql")
print('获取指定section下所有的键值对', item)
# 将列表转化成字典
# item = dict(con.items("mysql"))
# print(item["user"])

# for key,val in item.items():
#     print(key,"=",val)

1.3. 集成selenium

关乎selenium的驱动下载、api，参考博客：https://zhuanlan.zhihu.com/p/111859925

在我们的项目中，先使用一个MySelenium.py来进行可行性与连通性验证。

1.3.1. pycharm安装selenium包

1.3.2. 下载自己chrome浏览器版本对应的驱动

下载地址：https://registry.npmmirror.com/binary.html?path=chromedriver/

找一下自己chrome浏览器版本：

发现，并没有完全对应的，先找个相对匹配的较新版本：

我把下载的驱动文件放在了跟MyMoney项目同级的目录下，即：/Users/kelvin/PycharmProjects/chromedriver

1.3.3. 编写python、selenium、chrome连通性代码

背景：python爬虫，如果遇到了完全无从下手的接口，那selenium将是一个很好的选择，它帮助我们用浏览器的视角，来查看页面信息，我们要做的，就是使用selenium API来打开浏览器、点击，然后对于展示出来的页面，使用xpath来提取页面信息。

python+selenium最简单的代码，只有3行

from selenium import webdriver
driver = webdriver.Chrome(r"/Users/kelvin/PycharmProjects/chromedriver")    # Chrome浏览器，地址就是驱动存放的地址
driver.get("https://www.baidu.com")  # 打开网页

运行，就可以看到python代码调起了chrome浏览器并访问了百度：

可以看到，有个小的提示，“Chrome正收到自动测试软件的控制”，这个就是指的selenium了。

至此，我们简单的集成selenium的工作就完成了，后面就是对selenium的参数调整（爬虫伪装）以及真正使用一些工具来达到我们爬取数据的目的。

1.4. 集成requests

request简单用法的参考博客：https://blog.csdn.net/m0_58086930/article/details/121162071

背景：为什么有了selenium之后，还要再集成requests呢？其实这是此2者的特性不同所决定的。

当比如遇到了无法绕过的验证码，那么人为介入并提供可视化UI将是一个比较好的解决方案；另一方面，当我们已经一马平川，就等着批量从已分析出的接口中提取数据的时候，那requests将是一个利器。

我们能想到的一个case，就是通过selenium登录、浏览并定位到特定的页面，此时我们已经可以拿到cookie，那么，批量调取接口拿数据的时候，将cookie set进去并通过requests进行快速调用，那就免去了登录的困扰并且提高了交互效率（无需浏览器加载页面html、css、js等资源）。

requests百度一下

上来，肯定还是要先装requests包

然后开始愉快的写代码，我希望是3行就能搞定最好：

import requests
res = requests.get("https://baidu.com")
res.encoding = "utf-8"
print(res.text)

悲剧了，4行才搞定…打印的结果是如下，如果不够直观，可以保存到baidu.html，然后用浏览器打开

DOCTYPE html>
<html> <head><meta content=always name=referrer><link rel=stylesheet type=text/css href=http://s1.bdstatic.com/r/www/cache/bdorz/baidu.min.css><title>百度一下，你就知道title>head> <body link=#0000cc> <div id=wrapper> <div id=head> <div class=head_wrapper> <div class=s_form> <div class=s_form_wrapper> <div id=lg> <img hidefocus=true src=//www.baidu.com/img/bd_logo1.png width=270 height=129> div> <form id=form name=f action=//www.baidu.com/s class=fm> <input type=hidden name=bdorz_come value=1> <input type=hidden name=ie value=utf-8> <input type=hidden name=f value=8> <input type=hidden name=rsv_bp value=1> <input type=hidden name=rsv_idx value=1> <input type=hidden name=tn value=baidu><span class="bg s_ipt_wr"><input id=kw name=wd class=s_ipt value maxlength=255 autocomplete=off autofocus>span><span class="bg s_btn_wr"><input type=submit id=su value=百度一下 class="bg s_btn">span> form> div> div> <div id=u1> <a href=http://news.baidu.com name=tj_trnews class=mnav>新闻a> <a href=http://www.hao123.com name=tj_trhao123 class=mnav>hao123a> <a href=http://map.baidu.com name=tj_trmap class=mnav>地图a> <a href=http://v.baidu.com name=tj_trvideo class=mnav>视频a> <a href=http://tieba.baidu.com name=tj_trtieba class=mnav>贴吧a> <noscript> &tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2f%3fbdorz_come%3d1 name=tj_login class=lb>登录a> noscript> <script>document.write('+ encodeURIComponent(window.location.href+ (window.location.search === "" ? "?" : "&")+ "bdorz_come=1")+ '" name="tj_login" class="lb">登录');script> <a href=//www.baidu.com/more/ name=tj_briicon class=bri style="display: block;">更多产品a> div> div> div> <div id=ftCon> <div id=ftConw> <p id=lh> <a href=http://home.baidu.com>关于百度a> <a href=http://ir.baidu.com>About Baidua> p> <p id=cp>©2017 Baidu <a href=http://www.baidu.com/duty/>使用百度前必读a>  <a href=http://jianyi.baidu.com/ class=cp-feedback>意见反馈a> 京ICP证030173号  <img src=//www.baidu.com/img/gs.gif> p> div> div> div> body> html>

图片是由于使用的//这种形式导致去寻找的文件没找到而加载不出来，这种用法挺多，在抓淘宝数据的时候，也遇到了同样的方式，暂时先放一下，集中注意力。

先搞这么多，主要是为了引入requests，后面需要用到post的方式进行请求数据，再用案例来说明。

1.5. 集成MongoDB

背景：爬虫很多时候遇到的是非结构化数据或者说、数据比较多和乱、以python结构数据居多。为了不丢失数据，我们选择用MongoDB来作为数据存储。另外，即使是一个html，我们也可以将其存放于MongoDB中，以便后期的二次加工处理。

MongoDB菜鸟教程：https://www.runoob.com/python3/python-mongodb.html

使用docker安装mongodb

docker pull mongo:latest
docker images
# 我们可以使用以下命令来运行 mongo 容器
docker run -itd --name mongo -p 27017:27017 mongo --auth
# 进入容器设置admin密码
docker exec -it mongo mongo admin
# 创建一个名为 admin，密码为 liukun520 的用户。
db.createUser({ user:'admin',pwd:'liukun520',roles:[ { role:'userAdminAnyDatabase', db: 'admin'},"readWriteAnyDatabase"]});
# 尝试使用上面创建的用户信息进行连接。
db.auth('admin', 'liukun520')
# 上面输出结果为1

如果是在云主机上创建的容器，要开27017端口

MongoDB基本使用

26行数据，描述了MongoDB的CRUD，应该算是足够简单了。更多的MongoDB API还是先看看菜鸟教程。https://www.runoob.com/python3/python-mongodb.html

import pymongo
# MongoDB连接的元数据
mongo_meta = {'host': 'my.tengxun', 'port': '27017', 'user_name': 'admin', 'password': 'liukun520', 'db': 'admin'}
# 创建数据库连接
myclient = pymongo.MongoClient('mongodb://%s:%s@%s:%s/' % (mongo_meta['user_name'], mongo_meta['password'], mongo_meta['host'], mongo_meta['port']))
# 查询
db_record = myclient["mymoney_db"]["cny"].find_one({"name": "刘坤"})
if db_record:
    print('当前有一笔钱:' + str(db_record))
# 删除
myclient["mymoney_db"]["cny"].delete_one({"name": "刘坤"})
print('删除成功')
db_record = myclient["mymoney_db"]["cny"].find_one({"name": "刘坤"})
if db_record is None:
    print('没有找到"刘坤"的钱，开始凭空印钱！')
    # 新增
    # 在db：mymoney_db下创建集合collection：cny，并初始化一个文档document：{"name": "刘坤", "money": "9999999"}
    mydict = {"name": "刘坤", "money": "9999999"}
    insert_result = myclient["mymoney_db"]["cny"].insert_one(mydict)
    print('印钱结束，主键id：' + str(insert_result.inserted_id))
    # 更新
    myquery = {"name": "刘坤"}
    newvalues = {"$set": {"money": "1000000000"}}
    myclient["mymoney_db"]["cny"].update_one(myquery, newvalues)
    db_record = myclient["mymoney_db"]["cny"].find_one({"name": "刘坤"})
    print('更新之后的数据是:' + str(db_record))

2. 目标背景介绍（xdclass.net）

站点：https://xdclass.net/#/index

无意中发现的一个站点，其登录接口也比较简单，正好适合requests和selenium的实操。

2.1. 目标1：获取列表信息（Reqeusts GET方式）

2.1.1. 分析

我们找到一个模块，页面上是视频推荐 -> 挑战20k月薪面试必备。

对应的接口数据，通过F12分析，是get请求了一个url，如下图：

method: get
url: https://api.xdclass.net/pub/api/v1/web/index_card

response: json格式，具体取数路径见下图

2.1.2. 实现

主程序代码很简单

from utils.requests import RequestsUtil

res = RequestsUtil.do_request('https://api.xdclass.net/pub/api/v1/web/index_card', "get")
print(res.json()['data'][4]) # .json()会将返回的数据转成字典，['data']是取其中data结构数据，拿到的是list，list中第4项是"挑战20K月薪面试必备"

打印的结果是dict，如下：

其中用到了 RequestsUtil

# coding=utf-8
import requests


def do_request(url, method, params=None, content_type=None, headers=None):
    """

    :param url:
    :param method: get或post，不区分大小写
    :param params: 字典类型
    :param content_type: 如果是json，那么填写 application/json
    :param headers:
    :return: 如果确定返回的数据格式是json，那么可以通过 res.json() 方法转成字典格式
    """
    try:
        if method.lower() == "get":
            result = requests.get(url=url, params=params, headers=headers)#.json()
            return result
        elif method.lower() == "post":
            if content_type == "application/json":
                result = requests.post(url=url, json=params,
                                       headers=headers)#.json()  # Response响应结果类可以调用json()方法转成字典格式
            else:
                result = requests.post(url=url, data=params,
                                       headers=headers)#.json()  # 转成dict字典，后面才可以执行result["key"]
            return result
        else:
            print("method is not allowed")

    except Exception as e:
        print("请求异常：{0}".format(e))

2.2. 目标2：登录（Requests POST方式）

2.2.1. 分析

先从首页点击“登录”，看到如下界面：

点击登录，是向后端发送下面的post请求（Payload是简单的表单数据）：

Request URL: https://api.xdclass.net/pub/api/v1/web/web_login
Request Method: POST
Payload: (Form Data)
	phone: 13045890834
	pwd: hdc@328216

2.2.2. 实现

主程序代码也很简单

from utils.requests import RequestsUtil

url = "https://api.xdclass.net/pub/api/v1/web/web_login"
data = {"phone": "13045890834", "pwd": "hdc@328216"}
result = RequestsUtil.do_request(url, "post", params=data, content_type="application/x-www-form-urlencoded")
print(result.text)  # 结果请求成功

打印的结果是：

{"code":0,"data":{"head_img":"https://xd-video-pc-img.oss-cn-beijing.aliyuncs.com/xdclass_pro/default/head_img/14.jpeg","name":"hudechao","token":"xdclasseyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJ4ZGNsYXNzIiwicm9sZXMiOiIxLDIiLCJpbWciOiJodHRwczovL3hkLXZpZGVvLXBjLWltZy5vc3MtY24tYmVpamluZy5hbGl5dW5jcy5jb20veGRjbGFzc19wcm8vZGVmYXVsdC9oZWFkX2ltZy8xNC5qcGVnIiwiaWQiOjY3ODQxMDMsIm5hbWUiOiJodWRlY2hhbyIsImlhdCI6MTY1MzYxNTAzNSwiZXhwIjoxNjU0MjE5ODM1fQ.w94qknq2jZSJG3RFUU8MlBf7JlVMu3TxdPtEYlisOMA"},"msg":null}

可以看出，就是用户的基本信息。

2.3. 目标3：访问个人中心（Reqeusts GET方式）

2.3.1. 分析

点击头像，进入到个人中心

查找接口的做法，还是只能根据页面展示的信息，从接口的响应中去寻找，最后我们找到了这个

这个接口的基本信息是：

Request URL: https://api.xdclass.net/user/api/v1/video_record/page?token=xdclasseyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJ4ZGNsYXNzIiwicm9sZXMiOiIxLDIiLCJpbWciOiJodHRwczovL3hkLXZpZGVvLXBjLWltZy5vc3MtY24tYmVpamluZy5hbGl5dW5jcy5jb20veGRjbGFzc19wcm8vZGVmYXVsdC9oZWFkX2ltZy8xNC5qcGVnIiwiaWQiOjY3ODQxMDMsIm5hbWUiOiJodWRlY2hhbyIsImlhdCI6MTY1MzYxNTM2NCwiZXhwIjoxNjU0MjIwMTY0fQ.vDG_qhVcvWNCMFgapxcm_a3YoMMI1DA8v5UOw-fIWUI
Request Method: GET
Payload： Query String Parameters，也就是放在get请求头部的token信息，只要拼接好get请求就可以了。

这里看起来，只要带一个token参数就可以了，而token，就是上面登录时候就有返回。

2.3.2. 实现

主程序代码：

from utils.requests_util import RequestsUtil

# 第1步：登录
url = "https://api.xdclass.net/pub/api/v1/web/web_login"
data = {"phone": "13045890834", "pwd": "hdc@328216"}
result = RequestsUtil.do_request(url, "post", params=data, content_type="application/x-www-form-urlencoded")
print('登录结果\n' + result.text)  # 结果请求成功
user_token = result.json()['data']['token']

# 第2步：访问个人中心。开始拼接个人中心get请求的url
query_data = {'token', user_token}
personal_center_url = 'https://api.xdclass.net/user/api/v1/video_record/page'
#   方式1，参数形式（有问题：应该是对参数token值又进行了一次urlencode，导致获取不到结果，这个站点，直接把token值拼在后面请求就好了，就是用方式2）
# personal_center_result = RequestsUtil.do_request(personal_center_url, 'get', params=query_data)
# print(personal_center_result.text)
#   方式2，拼接url
personal_center_url = personal_center_url + "?token=" + user_token
personal_center_result = RequestsUtil.do_request(personal_center_url, 'get')
print('个人中心请求结果\n' + personal_center_result.text)

打印的结果：

至此，其实比较关键的是requests对于cookie的操作，可惜这个站点基本没用到，所以考虑用ruoyi系统来实现。

3. 目标背景介绍（若依ruoyi）

3.1. 目标1：若依登录（Requests POST方式）

3.1.1. 分析

为了简单，我们先把若依的验证码功能关掉，就是下面图标注的地方，如果不关，那需要我们识别计算。

关闭的办法：

shiro:
  user:
    # 登录地址
    loginUrl: /login
    # 权限认证失败地址
    unauthorizedUrl: /unauth
    # 首页地址
    indexUrl: /index
    # 验证码开关（这里改为false，就没有验证码了）
    captchaEnabled: false
    # 验证码类型 math 数组计算 char 字符
    captchaType: math

3.1.2. 实现探索

主程序代码：

from utils.requests_util import RequestsUtil

url = "http://localhost:8888/login"
data = {"username": "admin", "password": "admin123", "rememberMe": "false"}
result = RequestsUtil.do_request(url, "post", params=data, content_type="application/x-www-form-urlencoded")
print('登录结果\n' + result.text)
result = RequestsUtil.do_request('http://localhost:8888/index', "get") # 访问首页内容，查看是否是登录页
print('访问首页\n' + result.text)

为什么访问http://localhost:8888/index还是返回的登录页呢？其实很简单，因为我们访问的时候没有携带会话cookie信息。

研究一下浏览器，在登录后访问首页，都携带了什么信息。

3.1.3. 验证登录信息（cookie-editor插件）

准备内容
- 在chrome和火狐
- 分别安装插件，名字叫做“cookie-editor”
验证步骤
- 先在chrome登录若依（我是本地启动的，localhost:8888）
- chrome登录后，使用cookie-editor导出cookie（默认是会被复制到剪贴板的）
- 打开火狐，并访问若依，localhost:8888，默认是会跳转到登录页面
- 点开火狐的cookie-editor插件，点击导入
  
  此时，我们把浏览器头部/login去掉，直接访问localhost:8888，可以看到会跳转到首页
  
  我们再更近一步，确认一下是不是JSESSIONID这个cookie来登录的，删掉其他的cookie，看看是否还是登录状态：
  
  其他cookie都删除，只保留JSESSIONID，刷新页面仍正常访问！
  
  所以到这里，我们知道，如果要是登录状态，cookie要携带这个JSESSIONID。

3.1.4. 登录（Requests 携带cookie）

主程序代码：

import requests as requests
from utils.requests_util import RequestsUtil

url = "http://localhost:8888/login"
data = {"username": "admin", "password": "admin123", "rememberMe": "false"}
login_result = RequestsUtil.do_request(url, "post", params=data, content_type="application/x-www-form-urlencoded")
print('登录结果\n' + login_result.text)
# 下面开始处理cookie
cookies = login_result.cookies # 获取登录后的所有cookie信息
index_result = requests.get('http://localhost:8888/index', cookies=cookies) # 访问index页面，携带login获取到的cookie
print('访问首页\n' + index_result.text)

执行的结果，可以看到跟不携带cookie是不同的，有了登录人的信息：

从代码实现来看，感觉使用requests的api也比较简单，后面考虑使用原生的api进行实现。

登录（requests 使用 Session()）

对于requets，还可以使用session机制，就不需要手动设置cookie了

import requests

url = "http://localhost:8888/login"
data = {"username": "admin", "password": "admin123", "rememberMe": "false"}
session = requests.Session()
login_result = session.post(url, data=data)
print('登录结果\n' + login_result.text)
index_result = session.get('http://localhost:8888/index')
print('访问首页\n' + index_result.text)

运行结果也是OK的，这种方法就比较简单易用：

4. 目标背景介绍（siwei.me）

站点： http://siwei.me/

这是一个在学习vue.js的时候书上（《vue.js快速入门》）提到的一个站点，用来演示做http请求与跨域相关只是介绍的，正好用来做python的requests模块功能的连通性验证。

列表：http://siwei.me/interface/blogs/all

查看详情：http://siwei.me/interface/blogs/show?id=1244

4.1. 目标1：使用requests获取列表all

4.1.1. 分析

4.1.2. 实现

5. 工具的配置、使用

5.1. requests、selemium保存和设置cookie

https://www.cnblogs.com/x00479/p/14254004.html

你可能感兴趣的:(python,python,爬虫,requests)

Python 和 Pandas 版本的对应关系 Distantfbc python pandas 开发语言
在使用Python和Pandas时，确保它们的版本兼容是非常重要的。以下是Python和Pandas版本的对应关系，帮助你选择合适的版本。安装示例如果你使用的是Python3.9，并希望安装与之兼容的Pandas版本，可以使用以下命令：pipinstallpandas==1.3.0#安装Pandas1.3.x版本检查当前版本你可以使用以下代码检查当前安装的Python和Pandas版本：impor
还活在上个时代，Etcd 3.0 实现分布式锁竟如此简单程序员荒生开源学习 etcd 分布式
上下文传统Python单机系统部署中，由于GIL的存在，相同进程中我们可以不用处理并发问题。但是随着业务发展需要，原有单机系统演变成分布式或多进程系统后。这将使原有的单机单进程并发控制策略失效。为了解决该问题需要引入一种跨进程、跨机器的互斥锁机制来控制共享资源的访问，这也就是分布式锁的由来。所以，分布式锁的引入是为了保障多台机器或多个进程对共享资源读写的同步，保证数据的最终一致性。分布式锁天生具有
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【前缀和】2024E-分割数组的最大差值【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #前缀和 java c++c语言华为od javascript 算法 python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出说明解题思路代码pythonjavaC++CNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题解|详细考点分类|不断更新
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【排序】2024E-热点网站统计【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #模拟 java c++c语言华为od golang 算法 leetcode
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出示例二输入输出解题思路代码pythonjavacppCNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题解|详细考点分
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【BFS】2024E-狼羊过河【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #BFS #模拟算法 java c++华为od c语言 javascript leetcode
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述补充说明示例输入输出说明解题思路转化为搜索状态树最小层数问题节点的设计以及更新重复状态的排除代入BFS代码框架代码pythonJavaC++CNodeJavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【模拟】2024E-找终点【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #模拟 java c++c语言 leetcode golang 华为od
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出说明示例二输入输出解题思路代码pythonjavaC++CNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题解|详细考
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【DFS/BFS】2024E-战场索敌【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #BFS #DFS 算法 java c++c语言 leetcode 华为od javascript
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出解题思路代码解法一：BFSpythonjavacppCNodejavaScriptGo解法二：DFSpythonjavacppCNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【贪心】2024E-用户调度问题【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #贪心 java c++c语言 leetcode 华为od javascript python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出说明解题思路代码pythonjavacppCNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题解|详细考点分类|不断更新
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【贪心】2024E-静态代码扫描服务【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #贪心 java c++c语言华为od python 算法 javascript
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出说明示例二输入输出解题思路题意理解贪心策略代码pythonjavacppCNodejavaScriptgo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【二分查找】2024E-部门人力分配【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #二分查找 #贪心 java c++华为od leetcode 算法 python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出说明解题思路代码pythonjavacppCNodejavaScriptgo时空复杂度本题易错点左指针初始化问题华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题
【Py/Java/C++三种语言OD独家2024E卷真题】20天拿下华为OD笔试之【二分查找】2024E-平均像素值【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #二分查找算法 java c++华为od leetcode python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述补充说明示例一输入输出说明示例二输入输出解题思路代码pythonjavacpp时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024D+E卷最全真题【完全原创题解|详细考点分类|不断更新题目】【华
【Py/Java/C++三种语言OD独家2024E卷真题】20天拿下华为OD笔试之【二分查找】2024E-孙悟空吃蟠桃【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #二分查找 java c++华为od python 算法 leetcode
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出示例二输入输出解题思路代码pythonjavacpp时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024D+E卷最全真题【完全原创题解|详细考点分类|不断更新题目】【华为OD笔试】
【Py/Java/C++三种语言OD独家2024E卷真题】20天拿下华为OD笔试之【模拟】2024E-多数组合并【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #模拟 java c++华为od leetcode 算法 python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出解题思路代码pythonjavacpp时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024D+E卷最全真题【完全原创题解|详细考点分类|不断更新题目】【华为OD笔试】2024D+E卷
【Py/Java/C++三种语言OD独家2024E卷真题】20天拿下华为OD笔试之【回溯】2024E-字符串拼接【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #回溯 #DFS java c++华为od leetcode 算法 python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳od1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出说明示例二输入输出说明解题思路代码pythonjavacpp时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024D+E卷最全真题【完全原创题解|详细考点分类|不断更新题目】【华为O
【Py/Java/C++三种语言OD独家2024E卷真题】20天拿下华为OD笔试之【排序】2024E-预订酒店【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #模拟 java c++华为od 算法 leetcode python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出示例二输入输出示例三输入输出解题思路代码pythonjavacpp时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024D+E卷最全真题【完全原创题解|详细考点分类|不断更新题目】【
【Py/Java/C++三种语言OD独家2024E卷真题】20天拿下华为OD笔试之【位运算】2024E-分苹果【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法 #数学 #位运算最新华为OD真题算法 java c++python 华为od leetcode
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳od1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读2024年8月29日（2024E卷）题目描述与示例题目描述输入描述输出描述示例一输入输出示例二输入输出示例三输入输出说明解题思路题干阅读理解如何满足A的分配规则如何贪心地让B获利代码pythonjavacpp时空复杂度相同问题不同描述2023B-分积木题目描述输入描述输
darts框架使用 ME_Seraph 机器学习 darts
文|Seraph高版本Pytorch问题运行test.py报错IndexError:invalidindexofa0-dimtensor.Usetensor.item()toconverta0-dimtensortoaPythonnumber解决：update函数的参数loss.data[0]，prec1.data[0]，prec5.data[0]等修改为loss.item()，prec1.ite
python面试题阿芯爱编程面试 python 开发语言
以下是一些Python面试题：一、基础语法Python中的列表（list）和元组（tuple）有什么区别？答案：可变性：列表是可变的，可以修改列表中的元素、添加或删除元素；元组是不可变的，一旦创建就不能修改。语法：列表使用方括号[]定义，元组使用圆括号()定义（单个元素的元组需要在元素后面加逗号，如(1,)）。性能：由于元组的不可变性，在某些情况下元组的性能比列表略高，例如在用作字典的键时（字典的
机器学习：k均值 golemon. ML 机器学习均值算法人工智能
所有代码和文档均在golitter/Decoding-ML-Top10:使用Python优雅地实现机器学习十大经典算法。(github.com)，欢迎查看。在“无监督学习”中，训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律，为进一步的数据分析提供基础，较为经典的是聚类。**聚类试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”。**聚
Python常见面试题的详解4 ylfhpy Python基础 python 开发语言面试
1.单例模式的实现方式要点：Python有多种实现单例模式的方法。模块由于其特性天然支持单例，首次导入生成对象，后续导入直接复用。通过装饰器可以控制实例的创建，元类能借助__call__方法管理实例化过程，重写类的__new__方法也能保证实例的唯一性。示例：pythondefsingleton(cls):instances={}defget_instance(*args,**kwargs):#如
python：求解爱因斯坦场方程 belldeep python python 爱因斯坦
在物理学中，爱因斯坦的广义相对论（GeneralRelativity）是描述引力如何作用于时空的理论。广义相对论由爱因斯坦在1915年提出，并被阿尔伯特·爱因斯坦、纳森·罗森和纳尔逊·曼德尔斯塔姆共同发展。广义相对论的核心方程是爱因斯坦场方程，它描述了时空的几何结构如何由物质的分布决定。如果你想用Python来探索或模拟广义相对论中的某些现象，你可以从以下几个方面入手：1.使用现有的库Python
【Python】使用国内镜像加速 pip 安装详解 Peter-Lu #人工智能之python基础 python pip
文章目录一、pip工具简介1.什么是pip？2.什么是`-i`参数？二、国内镜像源的选择三、如何使用国内镜像源1.临时指定国内镜像源2.批量安装依赖时使用镜像源3.全局配置国内镜像源配置方法：四、国内镜像的使用场景1.安装大型库时2.批量安装依赖五、注意事项1.镜像源的选择2.镜像源的可信性3.镜像源与pip缓存在Python开发中，pip是一个非常重要的工具，用于安装和管理Python的第三方库
pandas（02 pandas基本功能和描述性统计） twilight ember pandas python 开发语言
前面内容：pandas(01入门)目录一、PythonPandas基本功能1.1Series基本功能1.2DataFrame基本功能二、PythonPandas描述性统计2.1常用函数*2.2汇总数据(describe)*一、PythonPandas基本功能到目前为止，我们已经学习了三种Pandas数据结构以及如何创建它们。我们将主要关注DataFrame对象，因为它在实时数据处理中非常重要，并讨
工控网络安全学习路线 206333308 安全
一、基础技能编程语言：从汇编语言开始学习，了解底层机器指令和内存管理等基础知识。接着学习C/C++，掌握面向过程和面向对象编程的基本概念和技术，为后续的漏洞挖掘和底层分析打下基础。最后学习Python，它在安全领域应用广泛，可用于自动化脚本编写、漏洞扫描和数据分析等。《计算机网络原理》：掌握网络通信的基本原理，包括OSI七层模型、TCP/IP协议栈、IP地址分配、子网掩码等。了解网络拓扑结构、路由
大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm 2301_76348014 程序员深度学习大数据知识图谱
文章目录大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介Django技术介绍Neo4j数据库Bootstrap4框架Echarts简介NavicatPremium15简介Layui简介Python语言介绍MySQL数据库深度学习六、核心理论贪心算法A
Python的垃圾回收机制，详解Python的GC体系李云龙炮击平安线程 python 系统架构面试跳槽后端架构
什么是垃圾回收？为什么需要垃圾回收？垃圾回收即Garbagecollection简称为GC，是Python，Java等高级语言所使用的内存回收机制，由虚拟机帮助我们管理内存，让它自动把我们去追踪和回收内存中的对象。没有作用的对象就是垃圾，虚拟机就是扫地机器人，在某个时机自动帮我们清除垃圾。区别于C和C++这种让用户自己进行内存管理的方式，由虚拟机代用户管理内存。让用户自己进行内存管理的方式固然自由
自动化办公|xlwings 数据类型和转换游客520 自动化实用代码 python全栈学习自动化运维 python
xlwings数据类型和转换：Python与Excel的桥梁在使用xlwings进行Python和Excel数据交互时，理解两者之间的数据类型对应关系至关重要。本篇将详细介绍Python数据类型与Excel数据类型的对应关系，以及如何进行数据类型转换。一、Python数据类型与Excel数据类型的对应关系Python数据类型Excel数据类型说明int数字整数float数字浮点数str文本字符串b
python如何解压缩文件或文件夹游客520 实用代码 python全栈学习 python
在日常开发或数据处理工作中，我们经常需要对文件或文件夹进行压缩和解压缩操作。Python提供了强大的内置模块，如zipfile和shutil，可以帮助我们高效地完成这些任务。本文将介绍如何使用Python对文件夹或文件进行压缩和解压缩，内容包括两种常见方式：zipfile和shutil，并提供完整代码示例。压缩文件或文件夹1.使用zipfile模块压缩文件夹zipfile模块是Python标准库的
Python 爬虫验证码识别 acheding python python 爬虫 ocr
在我们进行爬虫的过程中，经常会碰到有些网站会时不时弹出来验证码识别。我们该如何解决呢？这里分享2种我尝试过的方法。0.验证码示例1.OpenCV+pytesseract使用Python中的OpenCV库进行图像预处理（边缘保留滤波、灰度化、二值化、形态学操作和逻辑运算），然后结合pytesseract进行文字识别。pytesseract需要配合安装在本地的tesseract-ocr.exe文件一起
【Python实用技巧】爬取数据保存到Excel中「已注销」 python python 爬虫开发语言
嗨嗨，大家好~今天来给你们分享一个小技巧如何用python爬取数据保存到Excel中话不多说，马上开始需要源码、教程，或者是自己有关python不懂的问题，都可以来这里哦https://jq.qq.com/?_wv=1027&k=s5bZE0K3这里还有学习资料与免费课程领取开发工具Python版本：3.6相关模块：importrequestsfromlxmlimportetreeimportti
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

2.17.3-Python爬虫(requests登录)

文章目录

1. 环境与配置

1.1. 创建一个pure python项目

1.2. 集成configparser

1.3. 集成selenium

1.3.1. pycharm安装selenium包

1.3.2. 下载自己chrome浏览器版本对应的驱动

1.3.3. 编写python、selenium、chrome连通性代码

1.4. 集成requests

1.5. 集成MongoDB

2. 目标背景介绍（xdclass.net）

2.1. 目标1：获取列表信息（Reqeusts GET方式）

2.1.1. 分析

2.1.2. 实现

2.2. 目标2： 登录（Requests POST方式）

2.2.1. 分析

2.2.2. 实现

2.3. 目标3：访问个人中心（Reqeusts GET方式）

2.3.1. 分析

2.3.2. 实现

3. 目标背景介绍（若依ruoyi）

3.1. 目标1：若依登录（Requests POST方式）

3.1.1. 分析

3.1.2. 实现探索

3.1.3. 验证登录信息（cookie-editor插件）

3.1.4. 登录（Requests 携带cookie）

登录（requests 使用 Session()）

4. 目标背景介绍（siwei.me）

4.1. 目标1：使用requests获取列表all

4.1.1. 分析

4.1.2. 实现

5. 工具的配置、使用

5.1. requests、selemium保存和设置cookie

你可能感兴趣的:(python,python,爬虫,requests)

2.2. 目标2：登录（Requests POST方式）