Python爬虫-网页认识

一、虚拟环境

安装Python的时候会自动给计算机安装一个Python环境,这个环境叫做系统环境;
一个计算机中除了系统环境一个还可以自己创建多个虚拟环境(虚拟环境只能在有系统环境存在的情况下创建)。

虚拟环境的存在可以让不同类型或者不同版本的第三方库分开管理。

使用虚拟环境的建议:1)实际工作中:一个项目对应一个虚拟环境,并且将虚拟环境放在项目中,一般用venv来命名;
2)学习的时候:一个类项目对应一个虚拟环境,将所有不同类型的虚拟环境集中管理,环境名称做到见名知意

二、认识网页

1. 前端开发的三大技术: html、css、js

  1. html: 负责网页内容(决定网页有什么的)
    html通过不同的标签给网页提供内容(标签提供内容的方式分为:标签内容、标签属性)

  2. css: 负责网页内容的样式和布局

  3. js: 负责网页内容变化

三、认识html标签

1.

2.最外层有个html标签代表整个网页, html标签中一个head标签和一个body标签。

head负责网页头部的显示,body负责网页主体内容的显示。
结构如下

DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <title>Titletitle>
head>
<body>

body>
html>

3… html语法(标签语法)

html就是通过不同的标签给网页提供不同的内容,标签分为两种:

1)双标签

<标签名 属性名1=“属性值1” 属性名2=“属性值2” …>标签内容

2)单标签

<标签名 属性名1=“属性值1” 属性名2=“属性值2” …> 或者 <标签名 属性名1=“属性值1” 属性名2=“属性值2” …/>

4.一些主要标签

  1. 标题,有1~6级
  2. 段落文本标签
  3. 行标签、

四、选择器

1. css语法

选择器{属性1:属性值1; 属性2:属性值2; …}

2. 选择器 - 选中目标标签

1)元素选择器:

直接将标签名作为一个选择器,选中指定的所有标签
p{} - 选中所有的p标签

2)id选择器:

在id属性值前面加#作为一个选择器,选中id属性值为指定值的标签(id属性在整个网页中是唯一的)
#p2{} - 选中id属性值为p2的标签

3)class选择器:

在class属性值前加.作为一个选择器,选中class属性值为指定值的所有标签
(不同的标签可以有相同的class值; 同一个标签可以有多个不同的class值)
.c1{} - 选中所有class属性值为c1的标签
.c1.c3{} - 选中class属性值同时为c1和c3的标签

4)后代选择器:

多个选择器用空格隔开作为一个选择器

5)子代选择器:

多个选择器用>隔开作为一个选择器

你可能感兴趣的:(python爬虫,python,爬虫,css)