利用python保存网页文本

import  urllib.request   
from  bs4  import  BeautifulSoup
url = "http://google.cn/"  
response = urllib.request.urlopen(url)     #返回文件对象
page = response.read()  
#直接将URL保存为本地文件:
import  urllib.request  
url = "http://www.xxxx.com/1.jpg"
urllib.request.urlretrieve(url,r "d:\temp\1.jpg" )
#当然你可以将返回的对象交给soup处理
soup = BeautifulSoup(response)

#运行soup


或者

import urllib
a=urllib.urlopen("http://www.baidu.com").read()
print a

你可能感兴趣的:(利用python保存网页文本)