[python 爬虫精进] 第2关-参考答案

import requests
from bs4 import BeautifulSoup as bs

url = 'https://wordpress-edu-3autumn.localprod.oc.forchange.cn/'
res = requests.get(url)
soup = bs(res.text,'html.parser')
divs = soup.find_all('article')
for item in divs:
    date = item.find('time').text
    title = item.find('h2').text
    url = item.h2.a.attrs['href']
    print(date,'\n',title,'\n',url)`

运行结果如下:

2018-12-18 
 未来已来(四)——Python学习进阶图谱 
 https://wordpress-edu-3autumn.localprod.oc.forchange.cn/all-about-the-future_04/
2018-12-18 
 未来已来(三)——同九义何汝秀 
 https://wordpress-edu-3autumn.localprod.oc.forchange.cn/all-about-the-future_03/
2018-12-18 
 未来已来(二)——拥抱AI 
 https://wordpress-edu-3autumn.localprod.oc.forchange.cn/all-about-the-future_02/
2018-12-18 
 未来已来(一)——技术变革 
 https://wordpress-edu-3autumn.localprod.oc.forchange.cn/all-about-the-future_01/

你可能感兴趣的:([python 爬虫精进] 第2关-参考答案)