(2019-03-21)beautifulsoup进一步获取tag内容

如图,目的得到颜色加深出的src连接内容

首先得到

movies = soup.find("img",alt="绿皮书")

print(movies)

结果如下:

或者:

movies = soup.find("img",class_="board-img")

print(movies)同样能得到相同的结果,可见该选择器选择方法非常简便。

接下来是得到连接的内容,网页上显示为src,所以直接使用:

link = movies.get('src')

print(link)

得到的结果却是:None。回头看上面的结果可以看出,打印的网页内容实际上是data-src,所以改为:

link = movies.get('data-src')

print(link)

结果如下:

总结:

想要得到某个标签:

movies = soup.find_all("标签名",attrs="xxx")#attrs是某个属性,xxx是属性值。

想要得到某个标签下的内容:

1.得到某个属性的值:link = movies.get('属性名')

2.得到标签的文本内容:text = movies.string(但有些标签可能没有内容,只有键值对。)

你可能感兴趣的:((2019-03-21)beautifulsoup进一步获取tag内容)