"""获取表格中指定的列的数据,并保存到指定的文件中"""
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import time
a_url = 'http://31f.cn/'
html = requests.get(a_url)
pagesource = html.text
soup = BeautifulSoup(pagesource, 'html.parser')
trs = soup.find('table', class_='table table-striped').find_all('tr') # 查找列表中所有行
time_count = time.strftime('%Y%m%d%H%M%S', time.localtime(time.time())) # 获取当前时间,并格式化时间
file_path = "/Users/自己的路径/agent_id_" + str(
time_count) + ".txt" # 存储的路径,文件名以当前时间来命名
f = open(file_path, "w") # 没有就创建一个proxy_agent_id.txt的文件,赋予写权限
# 将查找出来的ip和端口号保存到文件中
for x in range(1, len(trs)):
tr = trs[x] # 取出第x行数据
tds = tr.findAll("td") # 在第x行中查找每列的值
td_temp = tds[1].contents[0] + "\t" + tds[2].contents[0] + "\n" # 取出第2列和第3列的值
f.write(td_temp) # 将取出来的值存放到file_path对应文件中
print('打印IP地址和端口号:\n', td_temp)
f.close() # 关闭文件