【入门】Python网络爬虫与信息提取1

理念:The website is API....

定向网络数据爬取和网页解析的基本能力


网络爬虫与信息提取

Python开发工具的选择

常用的Python IDE工具
课程使用工具

Python开发环境配置

  1. 安装Anaconda; 如果不能翻墙,可用国内镜像
    Anaconda是python的一个科学计算发行版。

  2. python的运行方式
    1)交互式:命令行输入指令
    2)文件式:通过IDLE编写.py文件,IDLE适用于小规模的项目,大规模的项目开发可选pycharm

  3. 集成开发环境(IDE)-IDLE(适合小型项目,适合初学者)
    1).命令行输入python(交互式)
    2).命令行输入ipython(交互式,语法高亮显示)
    3).启用IDLE(文件式)
    4).通过IDlE新建hello.py文件,命令行运行python hello.py;或者IDLE里选择Run

IDLE
编写文件(大段代码块)用idle(代码编辑器),文件式,文件运行方式2种
macOS系统,打开terminal,输入python,测试python是否可用。
调用idle需要退出python(exit()),输入idle,点击file新建文件,输入文本(有颜色区分),保存在本地,然后点击run module运行文本。

有没有更好的python代码编辑器?比Idle更强大的编辑器

把Anaconda和pycharm做关联

Requests库入门

Requests库是爬去网页最好的第三方工具


Requests库的更多信息

Requests库的七个主要方法

你可能感兴趣的:(【入门】Python网络爬虫与信息提取1)