python爬虫01-get请求,post请求,参数拼接,re正则解析,bs解析,xpath解析xml及html文件,requests进阶模拟登录,反盗链zhuanqu,代理
1、一个简单的读取网页的小案例#导入一个url库fromurllib.requestimporturlopenurl='http://www.baidu.com'#读取并解析url地址response=urlopen(url)#获取url的地址的结果集并有utf-8编码res=response.read().decode('utf-8')#写入结果到文件中withopen("mybaidu.htm