pyhton实战之初识爬虫库(beautiful soup)

关键字:pip使用,虚拟环境,beautiful soup

        在前面几篇博客我们记录了python的一些简单语法,主要偏向于理论。俗话说站在岸上学不会游泳,所有从今天开始我们将要进入python学习的新征程---实战篇。我们会在实战篇中穿插一些基础知识,或初识,或温故知新,将我们的基础慢慢打牢。

        今天我们的主题是构建虚拟环境,初识pip以及初步使用beautiful soup包。

        首先我们来了解一下什么是虚拟环境以及为什么要使用虚拟环境?我们先来假设一个场景,如果我们使用了一个第三方的包,且是全局的,开始项目A和B都使用了这个包,某一天这个包升级了,A项目还可以运行,但是不幸的是B项目不兼容了,此时你就非常操蛋了(保大还是保小?)!。当然了,python是不会让你面临这种尴尬的局面的,有种解决方案就是建立虚拟环境。pyhton虚拟环境允许Python包安装在特定应用程序的隔离位置,而不是在全局安装。它们有自己的安装目录,并且不与其他虚拟环境共享库。这点在实际开发中非常重要!详细可以看官网:Installing Packages — Python Packaging User Guide

        构建虚拟环境

          了解了虚拟环境我们来尝试构建一个虚拟环境吧(可以使用编辑器创建,也可以使用cmd命令行的方式创建,此处使用cmd命令行的方式)。

            1)、先建立一个文件夹,此文件夹专门存放pyhton虚拟环境,因为可能会需要很多虚拟环境,如D:\mypython\pyvenv

            2)、在cmd(windows系统)命令行,cd到D:\mypython\pyvenv,然后输入命令行python -m venv test,如下所示

                    此时我们进入该目录下查看,发现里面有很多文件夹,

              3 )、cmd环境下,我们进入Scripts文件夹下,运行activate.bat(linux系统下我们运行activate脚本)

                        注意此时如果成功的话是会有evn标志的,如下所示,前面是有(test)标志的,这个表示你当前是处于沙盒环境的。

        安装第三方库

             虚拟环境构建成功之后我们接下来要做的就是安装第三方包了,比如我们要试玩爬虫,可以安装beautiful soup包。(可查看中文文档Beautiful Soup 4.4.0 文档 — beautifulsoup 4.4.0q 文档)此时我们需要用到一个工具pip。这个我们可以简单理解成java中的maven或者gradle(不知道对不对哈,不对的话求指教)。如上图,我们仍然在D:\mypython\pyvenv\test\Scripts目录下使用命令pyhton -m pip install beautifulsoup4稍候片刻就会提示安装完成,此时我们打开D:\mypython\pyvenv\test\Lib\site-packages目录下,发现已经安装完成。

        试运行

此处使用的的pycharm,打开编辑器setting,选择虚拟环境,如下截图

运行代码,如下截图,可以发现我们的测试网页html的头部被获取到了。

你可能感兴趣的:(pyhton实战之初识爬虫库(beautiful soup))