利用python进行爬虫

今天,我们来学习爬虫。什么是爬虫呢?

简单来讲,爬虫是指使用一定的手段自动抓取网页上的内容。它是搜索引擎的核心技术之一。

爬虫程序是我们用来自动抓取网页内容的手段。这里我们将讲解如何利用python来编写爬虫程序。

要想抓取网页上的内容,首先我们要认识网页的构成。


认识网页的构成

网页通常由三部分构成,一个网页就等于一个HTML文档:

1. HTML:结构部分,区分每个部分具体是做什么用的,比如标题、正文等,相当于卧室、厨房等

2. CSS:

,样式部分,每个部分长啥样,地板什么颜色,墙壁什么颜色

3. JavaScript:

你可能感兴趣的:(利用python进行爬虫)