第 13 章 用爬虫测试网站

在这一章里,我将介绍测试的基础知识,以及如何用 Python 网络爬虫测试各种简单或复杂的网站。

13.1 测试简介

运行一套测试方法能够保证你的代码按照既定的目标运行,不仅可以节约你的时间,减少你对 bug 的忧 虑,还可以让新版本升级变得更加简单。
什么是单元测试
一个单元测试通常包含以下特点。
• 每个单元测试用于测试一个零件(component)功能的一个方面。
通常,一个零件的所有单元测试都集成在同一个类(class)里。
• 每个单元测试都可以完全独立地运行,一个单元测试需要的所有启动(setup)和卸载 (teardown)都必须通过这个单元测试本身去处理。单元测试不能对其他测试造成干扰,而且不论按何种顺序排列,它们都必须能够正常地运行。
• 每个单元测试通常至少包含一个断言(assertion)。
• 单元测试与生产代码是分离的。虽然它们需要导入然后在待测试的代码中使用,但是它们一般被保留在独立的类和目录中。

13.2 Python 单元测试

Python 的单元测试模块 unittest,所有标准版 Python 安装后都有。只要先导入模块然后
继承 unittest.TestCase 类,就可以实现下面的功能:
• 为每个单元测试的开始和结束提供 setUp 和 tearDown 函数
• 提供不同类型的“断言”语句让测试成功或失败
• 把所有以 test_ 开头的函数当作单元测试运行,忽略不带 test_ 的函数
需要注意的是,这两个函数在每个测试的开始和结束都会运行一次,而不是把类中所有测 试作为一个整体在开始或结束时各运行一次。

13.3 Selenium 单元测试

Selenium,它是一个可以解决网站上各种复杂问题的优秀测试框架;其实,它的初衷就是用来做网站测试
1. 鼠标拖放动作
单击按钮和输入文字只是 Selenium 的一个功能,其真正的亮点是能够处理更加复杂的网络 表单交互行为。Selenium 可以轻松地完成鼠标拖放动作(drag-and-drop)。
很多验证码里使用拖放动作证明访问者不是一个机器 人,这是一种常用手段。
2. 截屏
除了普通的测试功能,Selenium 还有一个有趣的技巧可以让你的测试更容易(或者让你老 板更喜欢):截屏。截屏可以在单元测试中创建,不需要点击截屏按钮就可以获取

13.4 Python 单元测试与 Selenium 单元测试的选择

Python 的单元测试语法严谨冗长,更适合为大多数大型项目写测试,而 Selenium 的测试方 式灵活且功能强大,可以成为一些网站功能测试的首选。那么应该使用哪个呢?
答案是:不需要选择。Selenium 可以轻易地获取网站的信息,而单元测试可以评估这些信息是否满足通过测试的条件。因此,你没有理由拒绝把 Selenium 导入 Python 的单元测试, 两者组合是最佳拍档。

你可能感兴趣的:(第 13 章 用爬虫测试网站)