python爬虫——urllib库介绍

urllib库

模拟浏览器发送请求的库,python自带
python2: urllib和urllib2
python3: urllib.request和urllib.parse

字符串:二进制字符串之间的转化

encode():字符串–>二进制
    ~~~    如果小括号内不写参数,默认是utf8
    ~~~    如果写,可以写gbk
decode():二进制–>字符串
    ~~~    如果小括号不写,默认是utf8
    ~~~    如果写,可以写gbk

1.urllib.request

     ~~~~     urlopen
     ~~~~     urlretrieve
例1:
python爬虫——urllib库介绍_第1张图片
python爬虫——urllib库介绍_第2张图片

2.response

     ~~~~     read():读取相应内容,内容是字节类型
     ~~~~     geturl():获取请求的url
     ~~~~     getheaders():获取头部信息,列表里面有元组
     ~~~~     getcode():获取状态码
     ~~~~     readlines():按行读取,返回一个列表

你可能感兴趣的:(python爬虫)