bs 解析 table

BeautifSoup 解析 html 中的 table 标签

  最近写一个爬虫,爬下来需要解析其中的 tables 标签,将其中的 td 标签中的内容全部提取出来,并且展示出类似表格的形式,一时想不出来,在网上找到了这样一段代码,发现很实用,所以采用一下。
例如:

test.html
英语 数学
77 82
化学 物理
20 13

要找出各个学科对应的分数,就可以这样写:

# -*- coding: utf-8 -*- 
form bs4 import BeautifulSoup as bs
test = bs(open("test.html"), "lxml")
tables = test.find_all("table", id="subject")
for table in tables:
    for tr in table.find_all("tr"):
        for td in tr.find_all("td"):
            print td.get_text().strip(), "  ",
        print

最后效果如下:


test.png

一时间也想不出有好的办法了。。。先这样吧。。。

你可能感兴趣的:(bs 解析 table)