关于 urllib 与 urllib2的区别

如果你用过 Python2.x 里的urllib2库,可能会发现 urllib2 与 urllib 有些不同,在 Python3.x 里,urllib2改名为 urllib,被分成一些子模块urllib.requeseturllib.parseurllib.error。尽管函数名称大多和原来一样,但是在用新的 urllib 库时需要注意哪些模块被移动到子模块里了。

urllib 是 Python 的标准库,即不需要额外安装,包含了从网络请求数据,处理 cookie,甚至改变像Request Headers(请求头)和 User-Agent(用户代理)这些元数据的函数。

urlopen 用来打开并读取一个从网络获取的远程对象。因为它是一个非常通用的库(它可以轻松读取 HTML 文件、图像文件,或其他任何文件流),所以我们在日常中会频繁的使用它。

你可能感兴趣的:(爬虫学习)