Python爬虫入门

正式上手,本文章吸取了一些其他简友的思想。
本次内容:很多网络小说都始发于起点中文网,大部分小说特别是一些比较火的小说看的时候都需要付费。既然有收费,那就一定有盗版免费的小说出现,而有些网站(盗版小说)只能在线观看,不能下载,本次内容就是将只能观看不能下载的小说爬下来。

下面列出本次爬取得网站以及书的内容。
小说网站-笔趣看:URL:http://www.biqukan.com/

笔趣看是一个盗版小说网站,这里有很多起点中文网的小说,该网站小说的更新速度稍滞后于起点中文网正版小说的更新速度。并且该网站只支持在线浏览,不支持小说打包下载。因此,本次实战就是从该网站爬取并保存一本名为《一念永恒》的小说,该小说是耳根正在连载中的一部玄幻小说。PS:本实例仅为交流学习,支持耳根大大,请上起点中文网订阅。

下面是本次爬取得代码:

from bs4 import BeautifulSoup
import requests


if __name__ == '__main__':
    target = 'https://www.biqukan.com/1_1094/5403177.html'
    req = requests.get(url=target)
    html = req.text
    bf = BeautifulSoup(html)
    texts = bf.find_all('div',class_='showtxt')
    print(texts)

ps:本次爬起貌似没有成功。立个flag,下周之内,一定爬取成功,并更改此次代码。

你可能感兴趣的:(Python爬虫入门)