网页的解析之正则表达式

在爬虫入门到精通第四讲中,我们了解了如何下载网页,这一节就是如何从下载的网页中获取我们想要的内容

html = u"""




文章的标题


h1文字