【Python】爬虫-----数据解析之CSS解析

如何使用CSS解析数据?

1.导入所需模块

import parsel

2.把要解析的数据转化为Selector对象

selector = parsel.Selector(要解析的内容)

3.调用css函数输入解析规则

定位class里的h1,并拿到它里面的内容:

selector.css('.bookname h1::text').get()

定位id,并拿到它里面的内容:

selector.css('#content::text').getall() #getall()返回的是一个列表


用CSS解析网页文本案例

import requests
import parsel

url = "https://www.biquge.biz/58_58780/161880.html"
respond = requests.get(url).text
#print(respond)
selector = parsel.Selector(respond)
novle = selector.css('.bookname h1::text').get()
content = selector.css('#content::text').getall()
content = '\n'.join(content)
print(novle)
print(content.encode('gbk','ignore').decode('gbk','ignore'))

你可能感兴趣的:(Python记录册,python,爬虫,css)