入门级爬虫,3500章的小说大概是用了20分钟,还可以吧,中间没有发生堵塞和timeout估计是这家网站没做反爬。
import requests
from pyquery import PyQuery as pq
def get_content(a):
response=requests.get(a)
response.encoding = 'gbk'
doc = pq(response.text)
text=doc('#content.showtxt')
bookname=doc('div.bookname h1')
c=str(bookname)
a=str(text)
b=a.replace("
","\n").replace('
','\n').replace('
请记住本书首发域名:www.biqugexsw.com。笔趣阁小说网手机版阅读网址:m.biqugexsw.com
入门级爬虫,3500章的小说大概是用了20分钟,还可以吧,中间没有发生堵塞和timeout估计是这家网站没做反爬。