python+selenium小结17:获取表格中指定的列的数据,并保存到文件中

"""获取表格中指定的列的数据,并保存到指定的文件中"""

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import time

a_url = 'http://31f.cn/'
html = requests.get(a_url)
pagesource = html.text
soup = BeautifulSoup(pagesource, 'html.parser')

trs = soup.find('table', class_='table table-striped').find_all('tr')  # 查找列表中所有行
time_count = time.strftime('%Y%m%d%H%M%S', time.localtime(time.time()))  # 获取当前时间,并格式化时间
file_path = "/Users/自己的路径/agent_id_" + str(
    time_count) + ".txt"  # 存储的路径,文件名以当前时间来命名
f = open(file_path, "w")  # 没有就创建一个proxy_agent_id.txt的文件,赋予写权限
# 将查找出来的ip和端口号保存到文件中
for x in range(1, len(trs)):
    tr = trs[x]  # 取出第x行数据
    tds = tr.findAll("td")  # 在第x行中查找每列的值
    td_temp = tds[1].contents[0] + "\t" + tds[2].contents[0] + "\n"  # 取出第2列和第3列的值
    f.write(td_temp)  # 将取出来的值存放到file_path对应文件中
    print('打印IP地址和端口号:\n', td_temp)
f.close()  # 关闭文件

 

你可能感兴趣的:(python,python+selenium)