爬虫实践一下。
了解一下爬虫基础知识,来实战,感觉还是很有灵魂的。
我是一边错误,一边修改,一边写。虽然很艰辛,但是学习到了很多。
开始
刚开始,整理了一些信息,发现只要最后的数字不一样,就可以认为这个是id,,后面我们要通过这些网址获取信息
这个我们要先准备我们想要的信息。
复制就好了
初步的爬虫就好了。
接下来我们要开始秀起来了。哈哈哈,其实就是个小实验,
笑话大全和糗事是一样的准备哟。
这里我们用for循环,设置读取1到4的页的信息,以str的形式存到i
通过定位和读取里面的信息
通过网址笑话大全的地址进去点击检查,会看到源代码。
大部分获取到了,还有一小部分没有获取成功,我也不知道为什么,因为我修改后,就显示没有错误。那位大神研究出来了,记得拉小弟一把。