本地下载《三国演义》
本地下载 .jpg 图片
本地下载 歌曲
Robots 协议
- 练习:下下下载 http状态码
- 练习:下下下载 网页源代码
互联网中不同网页的相互连接就像一张复杂的数据结构--图。
如果把每个网页当成一个结点,把这些超链接(Hyperlinks)当成连接的弧。
我们使用图的遍历算法就可以得到任何一个网页。
世界上第一个网络爬虫是由麻省理工的学生 马休·格雷在1993年敲出,TA叫ta "互联网漫游者" (WWW Wanderer)。
爬虫是什么 ??
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
爬虫可以做什么 ?
个人,可以去工作呀拿一份工资。如果您喜欢编程这真是太好啦,不是所有的爱好都有一个副作用给你赚钱。