Python爬虫之urllib库详解

一、说明：

urllib库是python内置的一个http请求库，requests库就是基于该库开发出来的，虽然requests库使用更方便，但作为最最基本的请求库，了解一下原理和用法还是很有必要的。

二、urllib四个模块组成：

urllib.request　　
请求模块(就像在浏览器输入网址，敲回车一样)

urllib.error　　　
异常处理模块(出现请求错误，可以捕捉这些异常)

urllib.parse　　
url解析模块

urllib.robotparser
robots.txt解析模块，判断哪个网站可以爬，哪个不可以爬，用的比较少

在python2与python3中有所不同

在python2中：

import urllib2
response = urllib2.urlopen('http://www.baidu.com')

在python3中：

import  urllib.request
response = urllib.request.urlopen('http://www.baidu.com')

三、urllib.request

1、urlopen函数

urllib.request.urlopen(url, data=None, timeout=socket._GLOBAL_DEFAULT_TIMEOUT,*, cafile=None, capath=None, cadefault=False, context=None)

url参数

from urllib import request
response = request.urlopen('http://www.baidu.com')
print(response.read().decode('utf-8'))

data参数

没有data参数时，发送的是一个get请求，加上data参数后，请求就变成了post方式(利用’http://httpbin.org测试网址)

import urllib.request
import urllib.parse

data1= bytes(urllib.parse.urlencode({'word':'hello'}),encoding='utf-8')
response = urllib.request.urlopen('http://httpbin.org/post',data = data1)
print(response.read())

data参数需要bytes类型，所以需要使用bytes()函数进行编码，而bytes函数的第一个参数需要时str类型，所以使用urllib.parse.urlencode将字典转化为字符串。

timeout参数

设置一个超时的时间，如果在这个时间内没有响应，便会抛出异常

import urllib.request

try:
    response = urllib.request.urlopen('http://www.baidu.com', timeout=0.001)
    print(response.read())
except:
    print('error')

将超时时间设置为0.001秒，在这个时间内，没有响应，输出error

2、response 响应类型

import urllib
from urllib import request
 
response = urllib.request.urlopen('http://www.baidu.com')
print(type(response))

状态码与响应头

import urllib
from urllib import request

response = urllib.request.urlopen('http://www.baidu.com')
print(response.status)
print(response.getheaders())
print(response.getheader('Server'))

read方法

import urllib.request

response = urllib.request.urlopen('http://www.baidu.com')
print(type(response.read()))
print(response.read().decode('utf-8'))

response.read()返回的是bytes形式的数据，所以需要用decode(‘utf-8’)进行解码。

3、Request对象　

如果我们需要发送复杂的请求，在urllib库中就需要使用一个Request对象

import urllib.request
 
#直接声明一个Request对象，并把url当作参数直接传递进来
request = urllib.request.Request('http://www.baidu.com')
response = urllib.request.urlopen(request)
print(response.read().decode('utf-8'))

声明了一个Request对象，把url当作参数传递给这个对象，然后把这个对昂作为urlopen函数的参数

更复杂的请求，加headers

#利用Request对象实现一个post请求

import urllib.request
url = 'http://httpbin.org/post'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
data = {'word':'hello'}
data = bytes(str(data),encoding='utf-8')
req = urllib.request.Request(url = url,data = data,headers = headers,method = 'POST')
response = urllib.request.urlopen(req)
print(response.read().decode('utf-8'))

上面的这个请求包含了请求方式、url，请求头，请求体，逻辑清晰。

Request对象还有一个add_header方法，这样也可以添加多个键值对的header

4、高级请求方式

设置代理

很多网站会检测某一段时间某个IP的访问次数(通过流量统计，系统日志等)，如果访问次数多的不像正常人，它会禁止这个IP的访问。ProxyHandler(设置代理的handler)，可以变换自己的IP地址。

from urllib import request # 导入request模块
 
url = 'http://httpbin.org' # url地址
handler = request.ProxyHandler({'http': '122.193.244.243:9999'}) # 使用request模块ProxyHandler类创建代理
#handler = request.ProxyHandler({"http":"账号:密码@'122.193.244.243:9999'"})
#付费代理模式　
opener = request.build_opener(handler) # 用handler创建opener
resp = opener.open(url) # 使用opener.open()发送请求
print(resp.read()) # 打印返回结果

cookie

import urllib.request
import urllib.parse

url = 'https://weibo.cn/5273088553/info'
# 正常的方式进行访问
# headers = {
#     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
#携带cookie进行访问
headers = {
    'GET https': '//weibo.cn/5273088553/info HTTP/1.1',
    'Host': ' weibo.cn',
    'Connection': ' keep-alive',
    'Upgrade-Insecure-Requests': ' 1',
    'User-Agent': ' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
    'Accept': ' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
    # 'Referer: https':'//weibo.cn/',
    'Accept-Language': ' zh-CN,zh;q=0.9',
    'Cookie': ' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url, headers=headers)
response = urllib.request.urlopen(request)
# 输出所有
# print(response.read().decode('gbk'))
# 将内容写入文件中
with open('weibo.html', 'wb') as fp:
    fp.write(response.read())

四、urllib.error

可以捕获三种异常：URLError,HTTPError(是URLError类的一个子类)，ContentTooShortError

URLError只有一个reason属性

HTTPError有三个属性：code,reason,headers

import urllib.request
from urllib import error

try:
    response = urllib.request.urlopen('http://123.com')
except error.URLError as e:
    print(e.reason)

import urllib
from urllib import request
from urllib import error
#先捕捉http异常，再捕捉url异常
try:
    response = urllib.request.urlopen('http://123.com')
except error.HTTPError as e:
    print(e.reason, e.code, e.headers)
except error.URLError as e:
    print(e.reason)
else:
    print('RequestSucess!')

五、URL解析urllib.parse

urlparse函数

该函数是对传入的url进行分割,分割成几部分，并对每部分进行赋值

import urllib
from urllib import parse

result = urllib.parse.urlparse('http://www,baidu.com/index.html;user?id=5#comment')
print(type(result))
print(result)

结果方便的拆分了url


ParseResult(scheme='http', netloc='www,baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')
Process finished with exit code 0

从输出结果可以看出，这几部分包括：协议类型、域名、路径、参数、query、fragment

urlparse有几个参数：url,scheme,allow_fragments

在使用urlparse时，可以通过参数scheme = 'http’的方式来指定默认的协议类型,如果url有协议类型，scheme参数就不会生效了

urlunparse函数

与urlparse函数作用相反，是对url进行拼接的　

urljoin函数

用来拼接url

urlencode函数

可以把一个字典转化为get请求参数

六、urllib.robotparser

使用较少，可作为了解

总结

到此这篇关于Python爬虫之urllib库详解的文章就介绍到这了,更多相关Python urllib库内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

心底有神药桦楗
图片来自网络（侵删）一早，刚到办公室，老父亲就打来电话。电话中，很是兴奋，原来他老人家已经在小区散步多时了。这够让我意外的。更让我意外的是，老父亲电话中说，这次配制的中药有奇效，才吃四副就可以出门了，估计将剩下那六副吃完，病也许就好了。搁下电话，我半晌没回过神来。老父亲患病21年了，得了无特效之药的“矽肺病”，过冬犹过关。尤其是前年，毫不意识的在ICU住了5天，半梦半醒的又住了5天，走出ICU还住
Android Gson复杂数据结构（如Map、List）的序列化逻辑原理剖析
一、复杂数据结构序列化概述1.1复杂数据结构处理的重要性在Android开发中，JSON数据往往包含复杂数据结构，如Map、List等。Gson作为常用的JSON处理库，其对复杂数据结构的序列化能力至关重要。准确处理这些结构能确保数据在网络传输、本地存储等场景下保持完整的语义和结构，避免数据丢失或格式错乱。1.2核心处理流程Gson对复杂数据结构的序列化主要包含以下步骤：类型识别：确定待序列化对象
如何将电商单体应用拆分为微服务？拆分粒度如何权衡？天天摸鱼的java工程师微服务 java
如何将电商单体应用拆分为微服务？拆分粒度如何权衡？引言：在电商行业高速发展的今天，系统扩展性和交付速度成为核心竞争力。许多企业初期采用单体架构快速上线，但随着业务规模扩大，单体应用逐渐成为制约发展的瓶颈。你是否也面临这样的挑战：代码库臃肿不堪、发布周期越来越长、局部故障导致全局瘫痪、技术栈升级举步维艰？作为一名有8年开发经验的Java工程师，我曾主导多个大型电商系统的微服务拆分。今天我将分享从业务
读懂“浦江经验”中的“解‘题’密码” 小KU2023
8月20日，人民日报全文刊发题为《扑下身子“迎考”沉到一线“解题”——解码“浦江经验”》的报道，深情回顾时任浙江省委书记的习近平同志亲自倡导并带头到基层接访群众形成的“浦江经验”。学思想、见行动。面对新征程新使命、新形势新挑战，广大党员干部要深入学习、深刻领会“浦江经验”，练就“想为”之境界、“敢为”之担当、“善为”之能力，及时把群众的操心事、烦心事、揪心事办成放心事、舒心事、幸福事。学习“浦江经
时序数据库IoTDB好不好？时序数据说时序数据库数据库 iotdb 物联网开源
时序数据库IoTDB（InternetofThingsDatabase）是专为物联网场景设计的一款开源时序数据库系统，由清华大学团队开发并贡献给Apache基金会。经过多年发展，IoTDB已经在工业物联网、车联网、能源电力等多个领域得到广泛应用。那么IoTDB究竟好不好？下面我将从几个核心优势来分析。一、专为物联网优化的存储架构分层存储设计：IoTDB采用"内存缓冲区+磁盘文件+分布式存储"的分层
Django基础(七)———模型常用Field以及Meta配置
前言上篇文章给大家介绍类Django和MySQL数据库的综合使用，以及框架中的ORM模型。这篇文章将继续讲述ORM模型当中常用的Field以及Meta配置一、模型常用Field在Django中，定义了一些Field来与数据库表中的字段类型来进行映射。以下将介绍那些常用的字段类型。1.AutoField映射到数据库中是int类型，可以有自动增长的特性。一般不需要使用这个类型，如果不指定主键，那么模型
数据库重构：提升数据库响应速度的策略 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据数据库重构 ai
数据库重构：从"拥堵路口"到"高速通道"的性能进化指南关键词：数据库重构、性能优化、索引策略、表结构设计、查询优化、数据分区、分库分表摘要：当你的数据库开始出现"响应变慢"“查询超时"的预警信号，单纯的"打补丁"优化已无法解决根本问题。本文将带你系统了解数据库重构的核心策略，通过生活化比喻、实战案例和代码示例，从索引优化到表结构重构，从查询调优到数据分区，一步步将"拥堵的数据库"改造成"流畅的信息
Zookeeper 在 Kafka 中的作用详解：分布式协调服务的核心价值 lxb_不卑不亢消息队列 MQ 进阶实战分布式 zookeeper kafka rocketmq
摘要ApacheKafka是一个高吞吐、分布式的流处理平台，广泛应用于大数据和实时系统中。而ApacheZookeeper，则是Kafka背后不可或缺的“隐形英雄”。本文将深入剖析Zookeeper在Kafka架构中的核心作用，帮助开发者全面理解其在分布式协调、元数据管理、故障恢复等方面的关键地位。一、Zookeeper简介Zookeeper是一个开源的分布式协调服务，最初由Hadoop生态发展而
数据库小胡123
数据库长期保存在计算机的存储设备上，按照一定规则组织起来，可被各种用户或应用共享的数据集合数据库系统(DBS)采用数据库技术的计算机系统，由数据库，数据库管理系统，数据库管理员，硬件平台，软件平台构成数据库管理系统(DBMS)是操作和管理数据库的软件，用于建立，使用和维护数据库，对数据库进行统一管理和控制提供的功能:数据定义语言(DDL)数据操作语言(DML)数据控制语言(DCL)数据存储方式:l
junit mockito_如何学习Java中的单元测试：JUnit和Mockito课程 dfsgwe1231 单元测试编程语言 python 人工智能 java
junitmockito大家好，今天我将讨论JUnit和单元测试，这是任何软件开发人员的关键技能之一。您可能已经知道JUnit和Mockito是Java应用程序中最受欢迎的两个测试库，并且几乎在每个Java应用程序类路径中都可以找到它们。我经常与Java开发人员见面并一起工作，这些Java开发人员非常了解Java但还没有编写单个单元测试。当我问他们为什么不编写单元测试时，他们提出了许多借口，例如他
.net core session 存储到redis缓存数据库
1.Startup.cs文件ConfigureServices方法加入以下代码#region使用Redis保存SessionvarredisConn=Configuration["WebConfig:Redis:Connection"];varredisInstanceName=Configuration["WebConfig:Redis:InstanceName"];//Session过期时长分
“此心光明，亦复何言”与“圣贤之志” river李一承
一个人一生中，无论有多少成就或者多少名声到最后都会走到生命的尽头，只不过离开人世的时间不一罢了。而王阳明各种才华积于一身，诗歌、绘画、打仗无不精通，但是他却年仅57岁就离开了世间。王阳明一生中，要么在休息于内心，要么四处讲学，要么四处平乱，并且直到生命的尽头。就在他去世的前一年的五月，王阳明在多年的平叛经历中又迎来了一次皇帝给予他的新任务。不过要在平常，王阳明一定会毫不犹豫的去遵从圣旨。可是到了今
【ASP.NET Core】内存缓存（MemoryCache）原理、应用及常见问题解析 ArabySide #ASP.NET Core asp.net 缓存后端 asp.net core c#
系列文章目录链接:【ASP.NETCore】REST与RESTful详解，从理论到实现链接:【ASP.NETCore】深入理解Controller的工作机制文章目录系列文章目录前言一、ASP.NETCore中的内存缓存——MemoryCache1.1内存缓存的结构1.2MemoryCache的注册1.3MemoryCache的配置项1.3.1缓存时间的过期策略1.3.2缓存的优先级1.4Memor
HoRain云--Docker容器迁移全攻略：4种方法详解与实战避坑指南 HoRain云小助手 arm开发
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
Kafka 控制器（Controller）详解：架构、原理与实战锅锅来了 #Kafka运维实战 kafka 架构分布式
目录Kafka控制器（Controller）详解：架构、原理与实战一、控制器的核心职责1.元数据管理2.分区状态机3.故障恢复4.集群操作协调二、传统ZooKeeper模式下的控制器1.控制器选举机制2.控制器与ZooKeeper的交互3.潜在问题三、KRaft模式下的控制器1.架构革新2.控制器节点配置3.Raft协议实现4.优势Kafka控制器（Controller）详解：架构、原理与实战Ka
【ASP.NET Core】ASP.NET Core中Redis分布式缓存的应用 ArabySide #.NET Core Redis 缓存 redis 分布式缓存 asp.net asp.net core
系列文章目录链接:【ASP.NETCore】REST与RESTful详解，从理论到实现链接:【ASP.NETCore】深入理解Controller的工作机制链接:【ASP.NETCore】内存缓存（MemoryCache）原理、应用及常见问题解析文章目录系列文章目录前言一、Redis1.1Redis简介1.2常用数据结构1.3Redis的持久化1.3.1RDB1.3.2AOF1.4常用应用场景1.
25岁从零开始学习平面设计，会不会太晚？ 93091cdf8ebb
很多新手小白想学平面设计，但是苦于不知从何处入门、怎么样去学。究竟怎样系统学习平面设计？今天就来谈谈平面设计系统学习的方法。更多学习设计内容关注V公众号广告设计之站了解平面设计平面设计是以“视觉”作为沟通和表现的方式，通过文字、图片等媒介有机结合，借此表达视觉上的讯息。平面设计的分类有很多，如：名片设计、标志设计、字体设计、VI视觉形象设计等等。所以设计师要掌握字体排印、视觉艺术、版面、电脑软件等
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
读《如何给孩子读绘本》——松居直燕纪事
读《如何给孩子读绘本》很是激动。里面提及的关于绘本的种种都让人为之振奋。好希望身边的家长也能接触它，并“喂”孩子多一些绘本。人的生命价值在于体验。而幼年时的体验对人一生的影响是巨大的。如同纯白的画布，那幼年的体验是生命的底色。在读“用耳朵听童谣的体验”这一章节，看到作者描述妈妈总在睡前给他读《儿童之国》，想到我小时候，妈妈给我们姐弟们唱的那首“牵牛花，吹喇叭，叫醒小灰兔，叫醒小猪鸭，我也早早起，喂
《历史》与《战国策》札记（一百六一）刘子曰_b08e
秦惠王死，公孙衍欲穷张仪。李雠谓公孙衍曰：“不如召甘茂于魏，召公孙显于韩，起樗里子于国。三人者，皆张仪之雠也，公用之，则诸侯必见张仪之无秦矣。”秦惠王死了，公孙衍想让张仪在秦国混不下去。李雠对公孙衍说：“不如从魏国召回甘茂，从韩国召回公孙显，在秦国起用樗里子。这三个人，都是张仪的仇人，你任用他们，那么诸侯一定会看出张仪不再受秦国重用了。”一朝君子一朝臣。张仪依仗得到秦惠王的重用，排除异己。等到秦惠
87号日精进李佳蔓_ae18
敬爱的李老师，智慧的班主任，亲爱的跃友们：大家好！我是来自北京八分客健康科技有限公司公司的李雪春。今天是我的日精进行动第112天，给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1、比学习：来华之梦学习《薪酬与产值》，菲二的计算方法和原理。2、比改变：自己改变了，周围的一切就都改变了。3、比付出：来华之梦学习，中间解决顾客问题。4、比谦卑：:劳谦虚己,则附之者众;骄
2023-04-10 我_4b6f
保定影像之街道（一一八三）2019年1月13日，星期日。农历戊戌年乙丑月庚戌日（狗年）十二月（腊月）初八。河北省保定市：五四路。保定市，古称清苑、上谷、保州、保府。因城池似靴，又称靴城。保定与北京相伴而生，保定之名取自“保卫大都、安定天下”之意。五四路，东西街道。五四路始建时，因其东端与青年路相接，关联命名为五四路（五四青年节）。2003年5月21日，国务院办公厅批准修订后的《保定市城市总体规划(
摄影|松果之色阿风的诗0109
今天又有一件挺好玩的事情——捡松果！松果四月天，熟透了的松果，便随风吹落。散落在松软的松针下，静静躺着，直到被有心人拾起。松果之俯拍我们一行人为了拾松果，手上拿着菜篮子，拿着大口袋，从小路上山去。四月的季节，到处都是绿油油的，心情都舒畅极了，在松林中穿梭和寻找着。每个人都在不同的方向低头搜索着，看到自己钟意的松果都惊喜万分，直呼这边的好大个啊！平拍松果仔细看着这个小玩意儿，真是特别极了，松果果瓣有
大唐奇案：辩机之死叶知秋老师
《新唐书》有载“会御史劾盗，得浮屠辩机金宝神枕，自言主所赐。初，浮屠庐主之封地，会主与遗爱猎，见而悦之，具帐其庐，与之乱，更以二女子从遗爱，私饷亿计。至是，浮屠殊死，杀奴婢十余。”作为语文老师，虽然不能做到信达雅，简单翻译一下还是可以的：正逢御史审问小偷，得到辩机和尚的金宝神枕，辩机说是高阳公主赏赐的。起初，辩机在高阳公主的封地结庐居住，正好碰到高阳公主和房遗爱外出打猎，高阳公主看见辩机很是喜悦，
备份系统也能成为“核心设施”？瑞数信息给出了一套“有韧性”解题思路！科技云报道网络安全人工智能
在数字化转型的浪潮中，分布式数据库正逐步取代传统架构，成为企业关键系统的“地基”。但随之而来的，是一系列备份与恢复的新挑战：数据碎片化、故障定位困难、恢复时间冗长，甚至在关键时刻“有备无用”。尤其在当下这个“勒索频发、业务上云、系统高并发”的环境中，传统灾备系统显然无法满足企业对稳定性、恢复速度与风险应对能力的更高要求。“数据韧性”由此成为企业的新焦点。所谓数据韧性，是指企业在面对故障、攻击、操作
《社会理论和社会结构》笔记2之孔德“大脑卫生原则” 2022-05-14 定投的奇迹
看到社会学家孔德的‘’大脑卫生原则”读出了自我。面对很多读书建议：拿到一本书，要看前言、目录、前序、后序、他人评价，我一直很排斥，奉行自己的读书原则：读书直奔正文。因为我不要别人以为是如何，我不要别人怎么说，我要的是我自己看完原文之后，我自己怎么想。然后再看前言、目录、前序、后序、他人评价，通过比较，看到我的视野的狭窄，我的看问题的不深刻，从而获得成长。虽然一直这样做，但没有看到所谓大咖这方面的观
智囊•上智部•通简卷•0152郭子仪•谋身有术智囊智囊
原文汾阳王宅在亲仁里，大启其第，任人出入不问。麾下将吏出镇来辞，王夫人及爱女方临妆，令持巾兑汲水，役之不异仆隶。他日子弟列谏，不听，继之以泣，曰：“大人功业隆赫，而不自崇重，贵贱皆游卧内，某等以为虽伊、霍不当如此。”公笑谓曰：“尔曹固非所料。且吾马食官粟者五百匹，官饩者一千人，进无所往，退无所据。向使崇垣扃户，不通内外，一怨将起，构以不臣，其有贪功害能之徒成就其事，则九族齑粉，噬脐莫追。今荡荡无间
Java 原生 HTTP Client en-route 微服务之间如何调用 java http 开发语言
介绍Java原生HttpClient是从Java11开始引入的标准库，用于简化HTTP请求的发送与响应处理。它支持同步和异步请求，并内置对HTTP/1.1和HTTP/2协议的支持。HttpClient提供了易用的API来设置请求头、请求体、处理响应以及配置SSL/TLS加密等安全功能。一个简单的例子发送GET请求并将打印ResponseHttpClientclient=HttpClient.new
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
美团优惠券领取的方法有哪些?美团优惠券在哪里可以领取好项目氧券
详解美团优惠券领取方法，让你省钱攻略轻松掌握！美团作为中国领先的本地生活服务平台，为消费者提供了丰富多样的优惠券活动。那么，你知道美团优惠券在哪里可以领取吗？本文将为你详细介绍美团优惠券的领取方法，让你省钱攻略轻松掌握！一、美团优惠券领取方法1.手机端领取：（1）打开美团APP，点击首页右下角的“我的”按钮，进入个人中心。（2）在个人中心页面，找到“我的优惠”选项，点击进入。（3）在优惠券页面，你
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

Python爬虫之urllib库详解

目录

一、说明：

二、urllib四个模块组成：

三、urllib.request

1、urlopen函数

2、response 响应类型

3、Request对象

4、高级请求方式

四、urllib.error

五、URL解析urllib.parse

六、urllib.robotparser

总结

你可能感兴趣的:(Python爬虫之urllib库详解)

3、Request对象