urllib2详解

先发个牢骚：博客园这服务器也太破了吧！每次想写个什么东西这慢的，要不是看上这编辑器还不错，真难以忍受。下面是正题：

先发段代码：

main() { printf(&unix["\021%six\012\0"],(unix)["have"]+"fun"-0x60);}

以上的一条代码是1987年，由贝尔实验室的David Korn提交的获奖作品，为什么我想起这茬儿呢？还不是因为urllib和urllib2,“大师把代码写成上面那样可以获奖，你要把代码写成那样，就是垃圾”，这不是我的话，不过是有他的意思的。我看到了urllib和urllib2在设计，代码构造上很多不同，想到，或者是猜测python发展过程中，guido越来越看不惯urllib的混乱结构了，但是很多人已经习惯import urllib了，并且用的还可以，所以urllib不管代码里多么混乱，但他能运行！很好，于是guido只能在urllib外在开发了urllib2,来满足一个有“洁癖”的程序员的心理需求呢，所以，当我这个菜鸟程序员看到urllib2的代码结构的时候，明显比urllib清晰了很多，明确了很多，心情好多了。介绍的时候我会对比urllib2怎么做的，而urllib又是怎么做的。

1. 初步介绍

　　urllib2

　　urlib2是使用各种协议完成打开url的一个扩展包。最简单的使用方式是调用urlopen方法，比如

import urllib2

content_stream = urllib2.urlopen('http://www.baidu.com/')

content = content_stream.read()

print content

即可以接受一个字符串型的url地址或者一个Request对象。将打开这个url并返回结果为一个像文件对象一样的对象.

接下来是OpenerDirector操作类。这是一个管理很多处理类（Handler）的类。而所有这些 Handler 类都对应处理相应的协议，或者特殊功能。分别有下面的处理类:BaseHandler,HTTPErrorProcessor,HTTPDefaultErrorHandler,HTTPRedirectHandler,ProxyHandler,

AbstractBasicAuthHandler,HTTPBasicAuthHandler,ProxyBasicAuthHandler,AbstractDigestAuthHandler

ProxyDigestAuthHandler,AbstractHTTPHandler,HTTPHandler,HTTPCookieProcessor,UnknownHandler,FileHandler,

FTPHandler,CacheFTPHandler

是不是很多？很怕，和我说看到看的结构简单不一致，不是的，他们都是遵循相应的规则，需求创建的类，甚至是相似的。你何必一口想吃成个胖子，全部都要会，先只管最最基本的需求吧，http协议的处理类。

刚才我们说的最简单的urlib2的使用，也就是源码中给出的使用方式：

#file: urllib2.py

_opener = None

def urlopen(url, data=None, timeout=socket._GLOBAL_DEFAULT_TIMEOUT):

    global _opener

    if _opener is None:

        _opener = build_opener()

    return _opener.open(url, data, timeout)

对比给出urllib的最基本的使用方式：

_urlopener = None

def urlopen(url, data=None, proxies=None):

    """Create a file-like object for the specified URL to read from."""

    from warnings import warnpy3k

    warnpy3k("urllib.urlopen() has been removed in Python 3.0 in "

             "favor of urllib2.urlopen()", stacklevel=2)



    global _urlopener

    if proxies is not None:

        opener = FancyURLopener(proxies=proxies)

    elif not _urlopener:

        opener = FancyURLopener()

        _urlopener = opener

    else:

        opener = _urlopener

    if data is None:

        return opener.open(url)

    else:

        return opener.open(url, data)

有个小警告： warnpy3k("urllib.urlopen() has been removed in Python 3.0 in " "favor of urllib2.urlopen()", stacklevel=2) ,说在py3k中已经移除了urllib.urlopen,更加偏爱urllib2.urlopen(),我想或多或少证明了我前面的一点猜测，guido看不惯urllib里的一些代码，在python2.6里先给你些小提示，慢慢改习惯吧，兄弟们。

现在分析urllib2里的urlopen, 一般我们直接调用urlopen()就是表示去调用build_opener()方法，然后用build_opener()方法返回的类对象去调用该对象的open方法，下面给出部分build_opener()的代码：

#build_opener()
def build_opener(*handlers):
    
    opener = OpenerDirector()
    default_classes = [ProxyHandler, UnknownHandler, HTTPHandler,
                       HTTPDefaultErrorHandler, HTTPRedirectHandler,
                       FTPHandler, FileHandler, HTTPErrorProcessor]

    skip = set()
    for klass in default_classes:
        for check in handlers:
            if isclass(check):
                if issubclass(check, klass):
                    skip.add(klass)
            elif isinstance(check, klass):
                skip.add(klass)
    for klass in skip:
        default_classes.remove(klass)

    for klass in default_classes:
        opener.add_handler(klass())

    for h in handlers:
        if isclass(h):
            h = h()
        opener.add_handler(h)
    return opener

这里我们可以看到，使用urllib2.urlopen()生成的是我们前面提到的管理很多处理器类的OpenerDirector操作类，然后给他加入很多的处理器,作为其一个属性，然后调用该处理器操作类对象的open方法就可以获取页面了。流程就是

1.  生成一个处理器opener = OpenerDirector()对象

                                |

                                |

2.  给这个处理器对象加入处理器opener.add_handler(h)

                                |

                                |

3.  使用打开方法，可能是具体handler类的打开方法。获取至本地的“文件流”对象，使用“文件流”。read()获取内容，写入文件

即只要你是使用urllib2,不管你是要用代理，还是要用ftp,http,都逃不过这套过程

下面分析urllib里的urlopen(),使用urllib.urlopen()方法会生成一个FancyURLopener类的对象，而FancyURLopener类是URLopener类的子类，那么这个类对象直接调用URLopener类的open(url)方法就行了，对于使用者来说，urllib.urlopen()的使用方式更易于使用，但这只是初步使用上简单，在深度使用后，urllib就没有urllib2结构清晰了。

下面给出2中方法的不同实现:

1. urllib2

a. HTTPHandler方式

#! -*- encoding:utf-8 -*-

import urllib2

opener = urllib2.OpenerDirector()
handler = urllib2.HTTPHandler()
opener.add_handler(handler)
content_stream = opener.open('http://www.baidu.com/')
print content_stream.read()

b. ProxyHandler方式

#! -*- encoding:utf-8 -*-

import urllib2

handler = urllib2.ProxyHandler(proxies = {'http' : 'http://217.66.205.76:8080/'})
opener = urllib2.build_opener(handler)
f = opener.open('http://www.baidu.com/')
print f.read()

这里可以看到做的操作有先实例化一个处理类，然后调用build_opener类产生我们的管理器对象，调用管理器的open方法，就能获取网页内容了。细心的读者对这段示例程序不知道会不会有一个疑问，确定这里是以代理去打开的baidu首页吗？而不是这里的代理根本没起作用，实际仍然是以本地IP打开的？那么就需要测试了，只需要做一个简单的操作，将代理地址改一个不能使用的地址，比如：

#! -*- encoding:utf-8 -*-

import urllib2

handler = urllib2.ProxyHandler(proxies = {'http' : 'http://216.664.205.76:8080/'})
opener = urllib2.build_opener(handler)
f = opener.open('http://www.baidu.com/')
print f.read()

运行这段代码就会得到错误的信息的。因为这代理地址根本就是我胡编乱造的。

c. FileHandler

打开本地文件

#! -*- encoding:utf-8 -*-

import urllib2

handler = urllib2.FileHandler()
request = urllib2.Request(url='file:/D:\myapplesapple_id.txt')
opener = urllib2.build_opener(handler)
f = opener.open(request)
print f.read()

注意这里一定要指定是文件类型，即url一定要有file:/而不能单蠢的写url='D:\myapplesapple_id.txt'

d FTPHandler

先一步步的来：

#! -*- encoding:utf-8 -*-

import urllib2

handler = urllib2.FTPHandler()
request = urllib2.Request(url='ftp://www.×××××.com/')
opener = urllib2.build_opener(handler)
f = opener.open(request)
print f.read()

执行结果显示：

    if resp[0] == '3': resp = self.sendcmd('PASS ' + passwd)

  File "C:\Python26\lib\ftplib.py", line 243, in sendcmd

    return self.getresp()

  File "C:\Python26\lib\ftplib.py", line 218, in getresp

    raise error_perm, resp

urllib2.URLError: <urlopen error ftp error: 530 Login or password incorrect!>

需要登录用户名和密码！

#! -*- encoding:utf-8 -*-

import urllib2

handler = urllib2.FTPHandler()
request = urllib2.Request(url='ftp://用户名:密码@ftp地址/')
opener = urllib2.build_opener(handler)
f = opener.open(request)
print f.read()

执行以下，获得结果：

drwxr-xr-x 1 ftp ftp              0 Jan 08  2011 *****
drwxr-xr-x 1 ftp ftp              0 Jan 11  2011 *****
drwxr-xr-x 1 ftp ftp              0 Oct 28  2010 *******

带*的该ftp服务器下跟目录下的文件名，bingo!

以上是一些基本使用方法，但大家也可以看出就那么一套模式。下面是urllib的在写这些程序的做法

还是先给urllib的介绍吧，前面虽然写过urllib,但是有同学说我写的有点虎头蛇尾，弥补下自己的罪过

urllib可以打开任意的一个url地址，遵循了一些标准,比如

-RFC1808：相对路径处理方法

-RFC1738：标准url地址

-RFC1630：url细则

通过使用URLopener().open(file)将返回一个使用了不同协议操作的对象。接下来这个对象就可以调用像read(),readline(),readlines(),fileno(), close()和info()方法，大家可以看出很多都是类似于文件对象的方法。info方法返回一个mimetools.Message对象，能用于这个对象的各种信息状态的显示。如果使用info方法，将相应的调用getheader方法.

urllib中主题就2个类，一个URLopener类，一个FancyURLopener类，FancyURLopener是URLopener类的子类，也就是对URLopener类的扩展。而其他绝大部分的类都是围绕或者基于这2个类进行处理，一个urllib模块只要通了URLopener其他甚至都可以自己扩展了。

大多数情况下我们都是使用urllib.urlopen()

刚才已经对比过这2个方法了，可以看到urllib.urlopen()可以直接使用代理，假如我们真的使用不那么高级点，这个还是不错的，而urllib2的urlopen却不是能直接支持代理的。所以这对于很多同学认定urllib比urllib2好，不明白为什么会有urllib2这个玩意的一个原因吧。

a. 直接使用urlopen

#! -*- encoding:utf-8 -*-

import urllib

f = urllib.urlopen('http://www.baidu.com/')
print f.read()

b. 加入代理

#! -*- encoding:utf-8 -*-

import urllib

f = urllib.urlopen(url='http://www.baidu.com/', proxies={'has_key' : 'http://216.66.205.76:8080/'})

print f.read()

这里对比一下urllib2的代理的写法：

urllib2: proxies = {'http' : 'http://217.66.205.76:8080/'}

urllib : proxies={'has_key' : 'http://216.66.205.76:8080/'}

这里没有谁要谁坏的一说，只是告诉大家加以区别而已。

c 打开本地文件

#! -*- encoding:utf-8 -*-

import urllib

f = urllib.urlopen(url='file:/D:\\myapplesapple_id.txt')

print f.read()

这里我们可以看到怎么看怎么我在瞎扯，论代码量来说urllib做同样的工作都是urllib比urllib2少写代码！老实说我有点心虚了，难道urllib2真的不那么能方便程序员吗？

d ftp

#! -*- encoding:utf-8 -*-

import urllib

f = urllib.urlopen(url='ftp://python:read@www.*****.com/')

print f.read()

正确执行，难道?!

URLopener结构：

class URLopener:
    __tempfiles = None
    version = "Python-urllib/%s" % __version__
    def __init__(self, proxies=None, **x509):
    def __del__(self):
    def close(self):
    def cleanup(self):
    def addheader(self, *args):
    def open(self, fullurl, data=None):
    def open_unknown(self, fullurl, data=None):
    def open_unknown_proxy(self, proxy, fullurl, data=None):
    def retrieve(self, url, filename=None, reporthook=None, data=None):
    def open_http(self, url, data=None):
    def http_error(self, url, fp, errcode, errmsg, headers, data=None):
    def http_error_default(self, url, fp, errcode, errmsg, headers):
    def open_https(self, url, data=None):
    def open_file(self, url):
    def open_local_file(self, url):
    def open_ftp(self, url):
    def open_data(self, url, data=None):

该类的设计逻辑是不管37是否等于21，先实例化该类对象出来，如果有代理，在实例化的时候将代理制定给这个实例化对象的一个属性，然后直接调用这个类的open方法，open方法里面有很多处理逻辑，比如，通过你给定url来判断要使用什么协议来对这个url进行处理，调用本类中的那个方法，设计中的一个经典核心代码：

        urltype, url = splittype(fullurl)  #解析url，分析出该url的特点，比如file,ftp,http,等
        if not urltype:
            urltype = 'file'
        if urltype in self.proxies:
            proxy = self.proxies[urltype]
            urltype, proxyhost = splittype(proxy)
            host, selector = splithost(proxyhost)
            url = (host, fullurl) # Signal special case to open_*()
        else:
            proxy = None
        name = 'open_' + urltype
        self.type = urltype
        name = name.replace('-', '_')
        if not hasattr(self, name):
            if proxy:
                return self.open_unknown_proxy(proxy, fullurl, data)
            else:
                return self.open_unknown(fullurl, data)
        try:
            if data is None:
                return getattr(self, name)(url)   #getattr()方法，如果name(形如'open_http','open_ftp','open_local_file')为真，返回这个属性，
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#即调用了这个方法，并且url是他传入的一个参数！从该类中其他方法名可以看出作者就是这个意思。
            else:
                return getattr(self, name)(url, data)
        except socket.error, msg:
            raise IOError, ('socket error', msg), sys.exc_info()[2]

调用到符合url协议的方法了，然后就知道识别找方法，多么有意思的python代码，但是guido不满意,我不能妄自揣夺各种原因，一点我都不敢说，因为我在用他设计的语言。并且用的还很高兴，呵呵。

　　好吧，就这样，我又失败了一次，我真是个失败者。想分析出urllib2比urllib好，结果却成现在这个模样，urllib比urllib2用起来简单。

nvidia-container-toolkit安装失败的解决 3TV python
curl-xhttp://xxx:xxx-fsSLhttps://nvidia.github.io/libnvidia-container/gpgkey|sudogpg--dearmor-o/usr/share/keyrings/nvidia-container-toolkit-keyring.gpgcurl-xhttp://xxx:xxx-s-Lhttps://nvidia.github.io/
macOS查看当前项目的 tree 结构缘友一世 mac折腾记 macos
文章目录使用`tree`命令macOS系统默认不包含tree命令使用tree命令使用homebrew自动安装脚本/bin/zsh-c"$(curl-fsSLhttps://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"安装tree：brewinstalltree查看项目的tree结构：treeyang@MacdeMac-minigradle
API接口在电商的应用及收益前端后端运维数据挖掘api
一、API接口在电商的核心应用场景（一）商品数据管理与展示在电商平台，商品信息的准确与实时更新极为关键。借助API接口，能轻松实现商品数据从供应商系统到电商平台的同步。例如，使用Python结合Requests库编写代码，从外部API获取商品数据：importrequestsurl="https://example.com/api/products"response=requests.get(ur
mindspore编译报错小乐快乐深度学习神经网络
1、重新创建个工程后无法正常运行，2、使用代码为：华为提供的机器学习监督学习中的代码[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=1364937&ptid=165780][color=#999999]回复：HS12发表于2021-10-3018:16[/color][/url][/size]报错信息
ubuntu20 docker安装花椒且喵酱 Linux docker 容器运维
https://www.cnblogs.com/lqqgis/p/18276118#更新软件包索引sudoapt-getupdate#安装需要的软件包以使apt能够通过HTTPS使用仓库sudoapt-getinstallca-certificatescurlgnupglsb-release#添加阿里云官方GPG密钥curl-fsSLhttp://mirrors.aliyun.com/docker
使用Python抓取网页信息 weixin_34292287 python c#
之前用C#帮朋友写了一个抓取网页信息的程序，搞得好复杂，今天朋友又要让下网页数据，好多啊，又想偷懒，可是不想用C#了，于是想到了Python，大概花了两个小时，用记事本敲的，然后在IDLE(PythonGUI)里面测试。发现Python之类的解释性语言很不错，又不用编译，写个脚本就好了。代码如下：#-*-coding:gb2312-*-importsysimporturllibimportre#从
2024年Python最新Python爬虫入门教程27：爬取某电商平台数据内容并做数据可视化 2401_84584609 程序员 python 爬虫信息可视化
‘详情页’])csv_writer.writeheader()forpageinrange(1,26):print(f’正在保存第{page}页数据内容===========')url=f’http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-year-2017-0-1-{page}’headers={‘User-Agent’:‘
python爬取高德地图道路交通状态数据代码 weixin_17839606517 可视化 python 开发语言
"""author:17839606517"""importdatetimeimportdatetimeimportosimportcsvfromcodecsimportStreamReaderWriterimportnumpyasnpimportrequestsimportpandasaspdimportjsonimportcodecsimporttimedefaaa():#初始API的URL#
stm32+w5500实现web服务_【NodeJS】简单静态WEB服务器实现 weixin_39711441
说明利用HTTP模块URl模块Path模块Fs模块创建在项目文件夹下，创建文件夹static,下面创建index.html//引入http模块var http=require('http');//fs模块var fs=require('fs');http.createServer(function(req,res){ //http://localhost:8001/news.html/new
流量分析利器arkime的学习之路（二）---API接口胖哥王老师流量分析学习笔记网络协议学习 arkime API
前文回忆《流量分析利器arkime的学习之路（一）---安装部署》概述注意点Arkime对所有API调用都使用摘要身份验证，因此请确保在库或curl命令中启用摘要身份验证。学习如何进行API调用的最简单方法是打开浏览器的javascript控制台，观察ArkimeUI正在进行的调用，它使用所有相同的API。注意：许多API端点都需要一个数据库字段名称，这与您在搜索表达式中使用的名称不同。查看数据库
http协议之方法与状态码线程A https http mysql
http协议分为两个部分，第一个部分是请求，第二个部分是响应请求：请求行(请求方法，路径，协议名称)头信息(key:value)空行然后主体信息(发送内容)POST10606/02.phpHTTP/1.1HOST:localhostcontent-type:application/x-www-from-urlencodedcontect-length:24username=zhangsan&age
篡改猴脚本已安装但使用不了解决方法梅羽落经验分享脚本
在扩展权限中选择允许访问文件URL具体脚本如何安装使用可看博主之前的文章如何使用插件(刷课,游戏等)-CSDN博客有问题还可以评论哦~~
Flask 和阿里云 OSS 实现文件上传功能 ivwdcwso 开发 flask 阿里云 python oss
在本教程中,我们将学习如何使用Flask框架和阿里云对象存储服务(OSS)来创建一个简单而强大的文件上传应用。这个应用将允许用户通过Web界面上传文件,然后将文件安全地存储到阿里云OSS中,并返回可访问的文件URL。准备工作在开始之前,请确保您已经完成以下准备工作:安装Python(推荐Python3.7+)安装Flask:pipinstallflask安装阿里云OSSSDK:pipinstall
华为OD机试E卷 --热点网站统计--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c++c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述企业路由器的统计页面，有一个功能需要动态统计公司访问最多的网页URLtopN。请设计一个算法，可以高效动态统计TopN的页面。输入描述每一行都是一个URL或一个数字•如果是URL，代表一段时间内的网页访问•如果是一个数字N，代表本次需要输出的TopN个URL输入约束：总访问网
python语言souhushipin爬虫程序代码QZQ EasySoft易软 python 爬虫数据库
importrequests#第一步搜索视频名称，找第2个这个ip?k=Xilmz93BsHYDhRYmz913t6O…开头的文件，url=‘https://data.vod.itc.cn/ip?k=Xilmz93BsHYDhRYmz913t6OUXpCGhROCzHaRsAOdjpCGhRYAtUxIgYeiwmemZDyOwmXAyB2HWhdt5BvOWFcvf2PNNef6q2vUo8fV
python爬虫入门（实践）雁于飞爬虫 python 开发语言
python爬虫入门（实践）一、对目标网站进行分析二、博客爬取获取博客所有h2标题的路由确定目标，查看源码代码实现"""获取博客所有h2标题的路由"""url="http://www.crazyant.net"importrequestsfrombs4importBeautifulSoup#发送请求，获取页面所有内容r=requests.get(url)ifr.status_code!=200:r
C#html生成pdf之wkhtmltopdf及参数说明 Mick_小马哥 C#WEB c#html pdf
实现方法#regionHTML生成PDF//////HTML生成PDF//////页面URL如：http://127.0.0.1/index.html///保存地址如：/upload/pdf/123.pdf///publicstaticboolHtmlToPdf(stringurl,stringpath){if(string.IsNullOrEmpty(url)||string.IsNullOrE
java获取IP为0:0:0:0:0:0:0:1的情况某科学的南条 java2
0:0:0:0:0:0:0:1是ipv6的表现形式，对应ipv4来说相当于127.0.0.1，也就是本机访问时是通过localhost来访问，用java获取ip地址可能会出现该问题，这时获取的ip将是0:0:0:0:0:0:0:1要是机器在局域网中，访问时使用自己的ip访问，如我的ip是：192.168.2.177访问url：http://192.168.2.177:8080这时候请求会经过路由器
iOS开发——NSURLSession初步学习（下载、待完善）吉吉有梦想 iOS开发
文章目录一、前文二、NSURLSession与NSURLConnection区别2.1使用现状2.2普通任务、上传和下载2.3下载任务方式2.4请求方法的控制2.5断点续传的方式2.6配置信息三、NSURLSession的优势四、代码部分4.1Xcode不支持http访问的解决办法4.2手动缓存（繁琐）4.3自动缓存四、demo一、前文写这篇文章，是为了总结一周内的学到的关于NSURLSessio
Vue全流程--数据代理的理解以及在Vue中的应用不清参 Vue全流程 vue.js 前端 javascript
数据代理定义数据代理就是通过一个数据对象代理对另一个对象中的属性进行读/写需要用到的基础知识js的Object.defineProperty函数补充：（请大致读完后再看下文）Documentletnumber=18;letdata={//Modelname:"小王",sex:"男",url:'https://space.bilibili.com/1347961416?spm_id_from=333
【mybatis】基本操作：详解Spring通过注解和XML的方式来操作mybatis m0_74824552 mybatis spring xml
mybatis的常用配置配置数据库连接#驱动类名称spring.datasource.driver-class-name=com.mysql.cj.jdbc.Driver#数据库连接的urlspring.datasource.url=jdbc:mysql://127.0.0.1:3306/mybatis_testcharacterEncoding=utf8&useSSL=false#连接数据库的名
2025年01月19日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：MiniCPM-o项目地址url：https://github.com/OpenBMB/MiniCPM-o项目语言：Python历史star数：15826今日star数：959项目维护者：yiranyyu,iceflame89,yaoyuanTHU,LDLINGLINGLING,tc-mb项目简介：MiniCPM-o2.6:一个适用于视觉、语音和多模态直播的GPT-4o级别模型，可在手机
用java 实现同意授权给公众号访问其信息。这通常通过将用户重定向到一个由微信提供的授权页面完成。用心去追梦 java 微信开发语言
在Java中实现微信公众号的OAuth2.0网页授权流程，主要涉及构建一个HTTP请求来重定向用户到微信提供的授权页面。以下是一个简单的示例，演示如何创建这个重定向链接并将其发送给客户端浏览器。步骤1:构建授权URL首先，你需要根据微信官方文档构造授权URL。这个URL将包含你的应用ID（appid）、回调地址（redirect_uri）、响应类型（response_type=code）、授权作用
PHP:写接口与接口的调用（完整版，封装公共方法） 25号底片~ php android 开发语言
说明：绑定的资源详细展示了两个项目的接口、接口调用的实现，已经数据库的连接，目录展示更加一目了然，有需要可以下载资源，实际文章已经描述的很详细了一、A页面-发送请求页面1、说明发送请求部分，去调用接口的部分（语言不限，这里使用php）这里使用提交按钮发送请求初始数据为对象，通过json进行发送必要数据：接口的url；接口方提供的AccessKeyId，AccessKeySecret（可生成随机数，
django笔记幸福诗歌 python django
init:初始化执行方法setting:配置文件urls:路由刚创建出来的项目分为两级：第一级：项目文件夹manage.py第二级是我们的关键：settings项目的总配置文件urlsurl链接文件wsgi服务器配置文件MVC全名是ModelViewController，是模型(model)－视图(view)－控制器(controller)的缩写，一种软件设计典范，用一种业务逻辑、数据、界面显示分
【python 正则表达式：太复杂了所以通过练习-3(URL 统一资源定位器)】编写常见格式的字符串的正则表达式来由浅入深的认识它 flos chen python python 正则表达式开发语言
5.URL统一资源定位器编写一个程序，从字符串中匹配URL。URL的格式为：协议名可以是http、https、ftp。域名可以是任意长度。端口号可以是任意数字。路径可以是任意长度。参数可以是任意长度。锚点可以是任意长度。代码如下：importredefmatch_url(string):pattern=r"^(http|https|ftp)://[a-zA-Z0-9]+\.[a-zA-Z0-9]+
php链接oracle乱码，尝试把一个php的项目转成java， slm311 java
最近有个新需求，OA上的考勤信息确认，开始的时候搞了个php的版本，莫名其妙的数据库会乱码（oracle）(等有时间再写一篇php链接oracle数据库）折腾了将近一个周，乱码莫名其妙的出现，代码啥也不动，多请求两遍又正常了。准备搞个java来替换php，在gpt的协助下，搞成了。上代码连接数据库：privatestaticfinalStringDB_URL="jdbc:oracle:thin:@
mac python 2.7 升级为python3 做不做代码搬运工 macos python 开发语言
在macOS上将Python2.7升级为Python3，可以使用Homebrew来安装和管理Python3。以下是详细步骤：1.安装Homebrew（如果还没有安装）Homebrew是macOS上常用的包管理工具，能方便地安装Python3。在终端中运行以下命令来安装Homebrew：/bin/bash-c"$(curl-fsSLhttps://raw.githubusercontent.com/
js utf8转jb2312 代码司江龙 jquery
functionUrlEncode(str){vari,c,ret="",strSpecial="!\"#$%&'()*+,/:;?@[\]^`{|}~%";for(i=0;i
python bs4 selenium 查找a href=javascript:()；的实际点击事件和url 大霸王龙 python selenium javascript
在使用BeautifulSoup和Selenium时，处理href="javascript:;"的链接需要一些额外的步骤，因为这些链接不直接指向一个URL，而是通过JavaScript代码来执行某些操作。这可能包括导航到另一个页面、触发模态窗口、显示/隐藏内容等。以下是如何使用Selenium来查找和处理这些链接的步骤：启动WebDriver：首先，你需要启动一个WebDriver（如Chrome
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

urllib2详解

你可能感兴趣的:(url)