python爬虫之JS逆向——爬虫基础

目录

一、http协议

二、前端三剑客

1 HTML

标签

标签举例

2 CSS

CSS的引入方式

选择器

属性操作

3 JS基础

JS的引入方式

JS的基本语法

变量赋值

数据类型

运算符

分支语句

循环语句

函数

JS的内置方法

字符串的内置方法

数组的内置方法

内置高阶方法

4 JS进阶

JSON序列化

DOM对象

查找标签

操作标签

jQuery

Ajax请求


一、http协议

1.什么是请求头、请求体,响应头、响应体
2.URL地址包括什么
3.get请求和post请求到底是什么
4.Content-Type是什么

答:
1、请求头(Request Headers): 请求头是HTTP请求的一部分,包含了关于请求、响应或者其他的发送信息。
这些信息包括客户端希望从服务器接收什么样的信息,例如请求的URL、HTTP版本、客户端的类型、优先级、认证信息等。
请求头不包含任何的数据,它们只是提供了请求的元数据;
请求体(Request Body): 请求体是HTTP请求中的数据部分,通常用于POST、PUT、PATCH等请求方法,用来发送与请求相关的数据。
请求体的内容取决于请求的类型和目的。
例如,在提交表单时,请求体可能包含了表单字段;在上传文件时,请求体包含了文件数据;
响应头(Response Headers): 响应头是HTTP响应的一部分,包含了关于响应的信息,如内容类型、服务器类型、状态码(例如200表示成功,404表示未找到资源)以及其他与响应相关的元数据。
响应头不包含任何的数据,它们只是提供了响应的元数据;
响应体(Response Body): 响应体是HTTP响应中的数据部分,包含了服务器返回给客户端的资源或数据。
响应体的内容可以是HTML文档、JSON对象、二进制文件等,具体取决于请求的类型和目的。
2、协议 主机 端口 路径 查询字符串 片段标识符
http://example.com:8080/pages/about.html?id=123&name=John#section1
在这个例子中,http 是协议,example.com 是主机,8080 是端口(如果不是默认端口),/pages/about.html 是路径,id=123&name=John 是查询字符串,而#section1 是片段标识符。
3、GET请求:
用途:主要用于请求服务器发送资源或数据。它也可以用来提交数据给服务器,但提交的数据显示在URL中,并且通常用于读取操作。
特点:
数据在URL中可见,安全性较低。
数据量有限制(具体限制取决于浏览器和服务器)。
不适合提交大量数据。
可以在URL中保存较长时间。
POST请求:
用途:通常用于向服务器提交数据,如表单数据。它用于写操作。
特点:
数据不会在URL中暴露,安全性更高。
理论上没有数据量的限制(尽管实际使用中仍受浏览器和服务器限制)。
适合提交大量数据。
通常不能在URL中保存较长时间。
4、content-type是在请求头/响应头中标明请求体中的数据是以何种方式组织的
请求头通常有:json({"key":"value",})/from(key=value&)
响应头通常有:json({"key":"value",})/html(123<\a>)/plain("字符串")/...

二、前端三剑客

1 HTML

标签

HTML:超文本标记语言

块级标签(inline):
1.独占一行
2.可设置长宽

内联标签(inline):
1.不独占一行,按内容占比
2.不可设置长宽

嵌套规则:
1.块级标签可以嵌套块级,也可以嵌套内联
2.内联只能嵌套内联

特殊情况:p标签例外

标签举例

块级标签:
标题1-6:

...

段标签:


div标签:

内联标签:
换行标签:

加粗标签:
倾斜标签:
span标签:

超链接标签:<

你可能感兴趣的:(Python自学,第一阶段—爬虫,python,爬虫,javascript)