爬虫基础之CSS学习不完全总结

简单学习一下:HTML中,常用的布局方式有三种:标准流、浮动、定位。

标准流是网页中默认的布局方式,即顺序布局。

HTML元素:块级元素和内联元素。

块级元素有:div、H1-H6、有序无序列表(ol、ul、li)、table表格、form表单、p段落 等等。

内联元素有:a超链接、span、img、input表单元素 等等。

二者的区别:块级元素总是单独一行。内联元素和相邻的内联元素在同一行,如果一行宽度不够时,才会被挤到另一行。

如果用CSS来提取页面内容,一般通过ID和HTML元素定位。

当然上述内容在爬虫时用不到。爬虫时主要是能定位到相应元素。在此总结几个常用的CSS语法。

* 选取所有节点;#video 选取id=“video”的节点;.video 选取class=“video”的节点;body div选取body下面的所有div节点。

你可能感兴趣的:(爬虫基础之CSS学习不完全总结)