python urllib.request

#导入urllin.request包
import urllib.request

#创建完整的url(要访问的网站,例如百度)
url = 'http://www.baidu.com'

#发送请求得到响应
response = urllib.request.urlopen(url)

#可以得到响应的状态码
print(response.status)

#可以获得响应头信息
print(response.headers)

#得到请求的url
print(response.url)

#获得网页内容,但是字节格式
content =  response.read()

#要对得到的字节内容进行解码,得到字符串
content = content.decode('utf-8') #字符格式可能不一样,具体情况选取合适的

#将得到的内容存入文件中
with open('content.txt','w',encoding='utf-8') as fp:
    fp.write(content)


#也可以得到图片

#创建一个图片的完整url
url = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1540216805401&di=68f956690ad56f4b4b0a35705d395478&imgtype=0&src=http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FxwQHtLwKNlLr10wbH0VMibOnQ52icnhsDdFjx0lJop3L742qWudiclSsMMwW4DrTGx34lia7fOibMTeIcdQTmPibpGMw%2F0.jpeg"

#发送请求得到响应
response_img = urllib.request.urlopen(url)

#获得图片,但是字节格式
content_img =  response_img.read()

#将图片的二进制信息存入文件中,打开这个文件就可以访问这个图片
#要选wb存入文件中的必须是二进制信息
with open("content_img.jpg",'wb') as img:
    img.write(content_img)


#有一个简便方法可以快速的存入图片,第一个参数为图片的url,第二个参数为文件的路径
urllib.request.urlretrieve(url,'urlretrieve.jpg')

你可能感兴趣的:(python urllib.request)