Python案例学习——模块和包、爬虫的基础概念

在Github下载项目

Github是一个面向开源及私有软件项目的托管平台,世界各地的开发者将自己的项目上传备份,或公开源码供大家学习使用。

其中,Git是一个版本控制系统,用于创建和管理仓库来保存、更新项目,或上传到Github。目前“Jetbrain全家桶”的专业版已支持直接上传C/C++、Java、Python等项目到Github。

关于Git的使用、在Github上传项目,可以参考小甲鱼的Git教程视频。建议有一定的软件开发技术,能够开发出项目之后,再学习git。目前只需学习下载和使用Github项目即可。

那么如何下载项目呢?

Python案例学习——模块和包、爬虫的基础概念_第1张图片

很简单,点那个绿绿的Code,然后Download ZIP即可

Python案例学习——模块和包、爬虫的基础概念_第2张图片
很简单!在项目界面往下拉,可以看到作者写的README.md,即用户文档,说明了该项目的使用方式及环境配置等。

本案例要求的环境展示如下。其中第三方库就是Python依赖的外部环境,需要pip install来安装
Python案例学习——模块和包、爬虫的基础概念_第3张图片

snipaste 截图软件

Python模块和包

模块

在Python中,每一个.py程序都可以当作一个模块。

在导入模块时,其中所有的 函数、类、变量(对象) 均会被导入。

例如:myModule.py如下

xlb = ["zhk","trz","why","wys","ysh","lwj","lmk","lbh","lb","xzy","zhm","fcl","wyx","sy","ljl","szk","mwh","zy"]

gaoshu = 90
xiandai = 95
C = 95

def printScore():
    print("你高数考%d分" % gaoshu)
    print("你线代考%d分" % xiandai)
    print("你C语言考%d分" % C)

class Cat:  # 定义了一个猫猫类
    def __init__(self,setName):  # 构造函数(初始化方法):对象被建立时直接调用
        self.name = setName  # 属性
        print("你获得了一只叫%s的猫猫" % self.name)
        self.weight = 20
        self.voice = "喵~"
    def meow(self):  # 方法:猫叫
        print(self.voice * 10)
    def eat(self,addw):
        self.weight += addw
    def setHeight(self,h):
        self.height = h

导入这个myModule.py时,其中的列表xlb、整数gaoshu、函数printScore()、类Cat均会被导入。

import 语句

很简单。import myModule就ok啦。

import语句通常写在最上面。在后面的代码中,可以通过myModule.xxx来介绍

外部包的下载和使用

http://npm.taobao.org/mirrors/chromedriver/
Python案例学习——模块和包、爬虫的基础概念_第4张图片

爬虫的概念

爬虫的步骤:

  1. 输入网址
  2. 获取网页
  3. 下载网页上的资源

爬虫用于批量获取资源,只能获取本身就可以看到的

自学python字典、字符串、集合、类和对象的实现

推荐学习内容

前端 用某种语言实现界面

你可能感兴趣的:(Python案例学习——模块和包、爬虫的基础概念)