python爬虫第1关HTML基础

1.html标签
python爬虫第1关HTML基础_第1张图片
python爬虫第1关HTML基础_第2张图片
python爬虫第1关HTML基础_第3张图片
python爬虫第1关HTML基础_第4张图片
2.例子
(1)


  
       
      这个书苑不太冷1.0
  
  
      

这个书苑不太冷

吴枫推荐的书:

《奇点遗民》

本书精选收录了刘宇昆的科幻佳作共22篇。《奇点遗民》融入了科幻艺术吸引人的几大元素:数字化生命、影像化记忆、人工智能、外星访客……刘宇昆的独特之处在于,他写的不是科幻探险或英雄奇幻,而是数据时代里每个人的生活和情感变化。透过这本书,我们看到的不仅是未来还有当下。

样式为:
python爬虫第1关HTML基础_第5张图片
(2)


  
       
      这个书苑不太冷2.0
  
  
      

这个书苑不太冷

吴枫推荐的书:

点这里看看

《奇点遗民》

本书精选收录了刘宇昆的科幻佳作共22篇。《奇点遗民》融入了科幻艺术吸引人的几大元素:数字化生命、影像化记忆、人工智能、外星访客……刘宇昆的独特之处在于,他写的不是科幻探险或英雄奇幻,而是数据时代里每个人的生活和情感变化。透过这本书,我们看到的不仅是未来还有当下。

样式为:
python爬虫第1关HTML基础_第6张图片
python爬虫第1关HTML基础_第7张图片
(3)


  
       
      这个书苑不太冷3.0
      
  
  
  
      

这个书苑不太冷

吴枫喜欢的书:

点这里看看

《奇点遗民》

本书精选收录了刘宇昆的科幻佳作共22篇。《奇点遗民》融入了科幻艺术吸引人的几大元素:数字化生命、影像化记忆、人工智能、外星访客……刘宇昆的独特之处在于,他写的不是科幻探险或英雄奇幻,而是数据时代里每个人的生活和情感变化。透过这本书,我们看到的不仅是未来还有当下。

样式为:
python爬虫第1关HTML基础_第8张图片
其中

python爬虫第1关HTML基础_第9张图片
常见html属性与用法
python爬虫第1关HTML基础_第10张图片
3.获取网页源代码并保存到本地
获取这个书苑不太冷5.0的网页源代码,并且保存文件到本地。

import requests
res=requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')
content=res.text
f=open('5.txt','w')
f.write(content)
f.close()

最后再教你一招,做一个本地的网页:
把刚才请求到的HTML源文件复制粘贴,在vscode中保存为后缀为.html 的文档,它就是一个保存在你本地中的网页了。

你可能感兴趣的:(python基础及爬虫)