爬虫和算法笔记

爬虫

安装第三方的包requests

pip install requests

爬虫是通过http 请求网页的数据

http 的请求方式有哪几种呢

get/ post/ put /delete

执行程序的基本操作

基本操作: a=10  print('a') a+b=100,可以把这些基本操作的时间单位看作1,o(1)

顺序

a=10

a+b=200

顺序操作就是把时间单位相加,时间单位就是2,0(n)

分支(判断)

if a>10:

    print(10)

else:

    b=100

    a+b=200

    print(a)

时间单位取分支的最大值,时间单位为3,0(n)

循环

for i in range(n):

    for i in range(n):

    a+b = 100

    print(a)

n*n*(1+1)==n^2

时间单位是按照乘法计算,时间单位是200,o(n^2)

mysql 什么时候要加索引

经常用where 条件做查询字典

经常用某个字段来排序

经常用某个字段来分组

explain 是分析MySQL语句的工具,在显示结果中,去查看rows字段,就可以知道有没有用到索引

like 如果是以%开头用不到索引

like如果以关键字开头,可以用到索引

like 如果以%开头,以%结尾用不到索引

列表操作方法中这些方法的时间复杂度需要记住

index[]

append()

pop()

pop(i)

insert(0,i)

计算机里的数据结构只有: int\ float\ char

像python中的list,tuple,dict,set 都是在这三个数据类型基础上做的一层封装

内存中的最小存储单位是 字节

int类型的长度是4个字节

tinyint 类型长度是1个字节

smallint 类型长度是2个字节

bigint 的类型长度是8个字节

一个字节占一个字符

你可能感兴趣的:(爬虫和算法笔记)