爬取中国大学的排名

爬取中国大学的排名

  • 进入目标网址,选中目标信息,右键点击检查查看源代码,可以发现所有的大学都封装在标签tbody之下,并且每一个大学都封装在同名标签tr之下。所以可以用for循环遍历所有的tr,提取目标信息。

爬取中国大学的排名_第1张图片

  • 用bs4解析网页,之后用soup.<标签>访问目标标签,之后用string提取信息。
  • 以下附上实现的代码
import requests
from bs4 import BeautifulSoup
import bs4
r = requests.get('http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html')
#以下为对请求回的信息进行'utf-8'编码
r.encoding = 'utf-8'
demo = r.text
soup=BeautifulSoup(demo,'html.parser')

for i in soup.tbody.find_all('tr'):
    print(i.contents[0].string,
       i.contents[1].string,
       i.contents[2].string,
       i.contents[3].string)

爬取中国大学的排名_第2张图片

你可能感兴趣的:(Python)