selenium:周杰伦歌词

爬虫练习1:周杰伦歌评

爬取QQ音乐前30条热评*,顺便看看怎么发CSDN博客*

import time
import re
from selenium import webdriver 

driver = webdriver.Chrome()
driver.get('https://y.qq.com/n/yqq/song/000xdZuV2LcQ19.html') 
time.sleep(2)

button = driver.find_element_by_class_name('js_get_more_hot') 【点击加载更多】
button.click() 
time.sleep(2)

pageSource = driver.page_source
#转换为str格式后再使用正则表达式提取
pattern = re.compile(r'

(.*?)

'
, re.S|re.M) results = re.findall(pattern, pageSource) for result in results[0:30]: #前30个元素为评论 result1 = re.sub(r'','',result) #主要为删除emoji表情数据 print(result1.strip()) print('-----------------') driver.close()

纯粹记录一下学习过程

你可能感兴趣的:(selenium:周杰伦歌词)