python爬虫环境搭建

 

1、所需软件:eclipsepydev插件、python安装包

 

Eclipse:http://www.eclipse.org/downloads/

Pydev插件:http://sourceforge.net/projects/pydev/files/pydev/

Python安装包:https://www.python.org/downloads/

 

2、安装python安装包:

python爬虫环境搭建_第1张图片

 

初学者可用shell编写Python:

 python爬虫环境搭建_第2张图片

 

3、把插件解压之后的文件合并到 eclipse 目录里面:

插件解压后:

 

 

4、重启Eclipse

在Windows->preference里可以看到PyDev:

python爬虫环境搭建_第3张图片

 

 

点击Interpreters里的Python Interpreter,指定Python压缩包的python.exe:

 python爬虫环境搭建_第4张图片

 

5、创建一个Python项目:

python爬虫环境搭建_第5张图片

创建的项目:

 

6、设置编码:

点击Windows—>preferencesàGeneralàEditorsàText EditorsàSpelling

设置UTF-8编码:

python爬虫环境搭建_第6张图片

 

 

右键刚才创建好的项目:

也设置为UTF-8编码:

 python爬虫环境搭建_第7张图片


 

7、编写一个简单的抓取网页代码:

import urllib

 

url="http://item.jd.com/1856581.html"

content=urllib.urlopen(url)

html=content.read().decode("gbk").encode("utf-8")

print html

 

print content.getcode()

print content.geturl()

print content.info()

content.close()

 

 

 

网页抓取成功,无乱码问题:

python爬虫环境搭建_第8张图片

 

 

这样很快,一个小环境就搭建好了。

 

8、另注释:

最开始用的是在线安装Pydev插件,可是一直显示失败,所以就用离线安装Pydev方法了。

写入地址 http://pydev.org/updates

python爬虫环境搭建_第9张图片

 

百度了这个错误解决方法也没解决,也不造怎么回事了。。

python爬虫环境搭建_第10张图片



 

 

你可能感兴趣的:(python爬虫环境搭建)