此博客仅为我业余记录文章所用,发布到此,仅供网友阅读参考,如有侵权,请通知我,我会删掉。
本文章纯野生,无任何借鉴他人文章及抄袭等。坚持原创!!
你好。这里是Python爬虫从入门到放弃系列文章。我是SunriseCai。
本文章是我平时学习Python中常用到的一些知识点,不可做为Python的系统学习。
这个比较简单,建议点击链接直达去查看用法。
数据结构 | 特征 |
---|---|
列表list | 可变,有序 |
元组tuple | 不可变,不可增删改 |
字典dict | 以键值对存在 |
集合set | 可变, 无序 |
定义:
占位符 | 表示类型 |
---|---|
%s | 字符串 |
%d | 整数 |
%f | 浮点数 |
format() | 把%替换为{}来实现格式化输出 |
占位符%示例:
name = input('输入你的名字:') # SunriseCai
age = input('输入你的年龄:') # 20
weight= input('输入你的体重:') # 65.432
print('你的名字是%s,年龄是%d,身高是%.2f公斤' % (name, int(age), float(weight)))
# 你的名字是SunriseCai,年龄是20,体重是65.43公斤
# %.2f意思是取2位小数
format()格式化示例:
name = input('输入你的名字:') # SunriseCai
age = input('输入你的年龄:') # 20
weight = input('输入你的工资:') # 65.432
print('你的名字是{},年龄是{},体重是{}公斤'.format(name, age, weight))
# 你的名字是SunriseCai,年龄是20,体重是65.432公斤
Python 编程中 if 语句用于控制程序的执行,基本形式为:
if 判断条件 1:
执行语句 A
elif 判断条件 2:
执行语句 B
else:
执行语句 C
理解起来就是:如果满足条件1则执行A,不满足条件1但满足条件2则执行B,两个都不满足就执行C。
示例:
num = 10
if num > 10: # 判断num
print('我大于10')
elif num < 10: # num小于10就输出
print('我小于10')
else: # 上面都不满足就输出
print('我等于10')
# 最终输出 我等于10
这里引用自菜鸟教程的Python 循环语句。
循环类型 | 描述 |
---|---|
while循环 | 在给定的判断条件为true时执行循环,否则推出循环体 |
for 循环 | 重复执行语句 |
while 循环示例:
while True:
string = input('输入字符串:')
if string == 'end':
break # 退出循环
print(string)
for 循环示例:
for i in range(100):
print('Hello World')
方法 | 描述 |
---|---|
Python join() | 用于将序列中的元素以指定的字符连接生成一个新的字符串。 |
Python strip() | 用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。 |
Python split() | 指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串 |
示例:
string = ['SunriseCai', 'SunriseCai', 'SunriseCai']
print('--'.join(string)) # SunriseCai--SunriseCai--SunriseCai
string = '%#SunriseCai%#'
print(string.strip('%#')) # SunriseCai
string = '%#SunriseCai%#'
print(string.split('%#')) # ['', 'SunriseCai', '']
Python中常用try/except语句取捕捉异常。
常见用法:
try:
执行语句 A
except Exception as e:
执行语句 B
# raise NameError # 一旦raise执行,raise后面的语句都不再执行
finally:
执行语句 C
示例:
try:
print(1 / 0) # 1除以0 会报错
except Exception as e:
print(e)
finally:
print('SunriseCai')
# division by zero
# SunriseCai
模块调用的方法:
方法 | 作用 |
---|---|
import module | 导入模块 |
import module as xx | 将导入模块更名为xx |
from module import xx | 导入模块的xx函数 |
from module import xx as bb | 将导入的模块函数xx更名为bb |
import time
time.sleep(10) # 此处Python程序会休眠10秒
import time
print(time.time()) # 1578838874.4708762
import time
stamp = time.time()
print(time.strftime('%Y-%m-%d', time.localtime(stamp))) # 2020-01-12
import time
stamp = time.time()
print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(stamp))) # 2020-01-12 22:20:20
方法 | 描述 |
---|---|
os.listdir(path) | 返回path指定的文件夹包含的文件或文件夹的名字的列表。 |
os.path.exists(path) | 判断该文件(文件夹)存在与否 |
os.makedirs(path) | 递归文件夹创建函数 |
os.removedirs(path) | 递归删除目录。 |
os.rmdir(path) | 删除path指定的空目录,如果目录非空,则抛出错误 |
os.remove(path) | 删除路径为path的文件。如果path 是一个文件夹,将抛出错误 |
一般是os的这两个方法os.path.exists(path) 和 os.makedirs(path) 用的最多。判断文件存在与否,然后再判断下一步文件是否需要创建。
函数 | 描述 |
---|---|
json.dumps | 将 Python对象编码成 JSON 字符串 |
json.loads | 将已编码的 JSON 字符串解码为 Python 对象 |
以上,是在Python爬虫中常用的很少一部分知识点。
会用到的知识点和模块有很多很多,这里只记一些用的最多的。
最后来总结一下本章的内容:
下一篇文章,名为 《Python爬虫从入门到放弃 03 | Python爬虫中的高级用法》。