python 爬虫基础 -- 综合示例

python 爬虫基础 – 综合示例

题目:爬取某网站提供ip地址,并测试其是否可用

技术list:

  • requests
  • re
  • BeautifulSoup
  • telnetlib 用以测试ip地址是否可用

  1. 打开待爬取数据的网站,按F12,查看我们要截取的数据的格式
    python 爬虫基础 -- 综合示例_第1张图片每一行数据中,我们只关心ip地址及其端口号。

  2. 编写可能用到的正则表达式

ex = '(?P.*?)(?P.*?)(?P.*?)(?P.*?)(?P
  1. 整体代码
def ip_test():
   # 编写格式解析的正则表达式
    ex = '(?P.*?)(?P.*?)(?P.*?)(?P.*?)(?P

以上示例,综合运用到了之前学习的几部分内容,爬取的ip地址,可以为之后的代理所用。

你可能感兴趣的:(python,python,爬虫)