Python中的OS模块、request模块、beautifulsoup4模块

os模块

提供了与系统、目录操作相关的功能,不受平台限制

Os.remove() 删除文件
Os.makedirs() 创建多级目录
Os.rmdir() 删除单级目录
Os.rename() 重命名文件
Os.path.isfile() 判断是否为文件
Os.path_isdir() 判断是否为目录
Os.path.join() 连接目录,path1连接path2为path1/path2
Os.path.splitext() 将文件分割成文件名与扩展名,a.txt a .txt

request模块

简洁且简单的处理HTTP请求的工具;支持非常丰富的链接访问功能,包括URL获取,Http会话,Cookie记录等。

pip install request
Request网页请求
get() 与HTTP中的get()方式相同
post() 与HTTP中的post()方式相同,用于传递用户数据

get()和post()之间的区别:

  • GET请求的参数是放在URL里的,POST请求参数是放在请求body里的;
  • GET请求的URL传参有长度限制,而POST请求没有长度限制;
  • GET请求的参数只能是ASCII码,所以中文需要URL编码,而POST请求传参没有这个限制;
Request对象属性

Status_code:发送请求的返回状态,200表示连接成功;400表示连接失败;404表示网页不存在
Text:Http相应内容的字符串形式,即URL对应的页面内容

HTTP协议中提供了好多状态码,列举我们常用的:

200 200 返回正常
304 服务端资源无变化,可使用缓存资源
400 请求参数不合法
401 未认证
403 服务端禁止访问该资源
404 服务端未找到该资源
500 服务端异常

beautifulsoup4模块

用来解析HTML或XML。

pip install beauitfulsoup4

步骤:
(1)创建BeautifulSoup对象;

bs = BeautifulSoup(url,html_parser,enoding)
(url: 需要查询网页的URL;html_parser:指定解析器;noding:指定编码格式(和网页编码格式一致))

(2)查询节点(find,找到第一个满足条件的节点;find_all,找到所有满足条件的节点)。


"No matter how bad things get, there's something good out there, just over the horizen" --《绿灯侠》

你可能感兴趣的:(Python3.7)