通过两种方式获取百度首页源代码(python3)

一、通过urllib.request模块
import urllib.request
s=urllib.request.urlopen("http://www.baidu.com")
print(s.read())
二、通过requests模块

首先通过谷歌浏览器进入百度首页,点击f12,然后刷新页面,可以看到如下图所示,我们可以获取User-Agent

通过两种方式获取百度首页源代码(python3)_第1张图片

复制User-Agent串,创建一个字典

head={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}

完整代码:

import requests
head={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}
s=requests.get("http://www.baidu.com",headers=head)
print(s.text)
这样就可以获取源码了。

你可能感兴趣的:(python3,编程历程)