python 将百度搜索风云榜的关键内容提取并写入txt文件和读取验证

 

# -*- coding:UTF-8 -*-
from bs4 import BeautifulSoup
import requests,sys
import codecs

##今日娱乐名人排行榜--百度搜索风云榜  http://top.baidu.com/buzz?b=618&fr=topindex
target='http://top.baidu.com/buzz?b=618&fr=topindex'

req=requests.get(url=target)
##很重要,视你得到的网页编码
req.encoding='gb2312'

##审查元素后找到人名所在的div
html=req.text
bf=BeautifulSoup(html)
texts=bf.find_all('a',class_='list-title')

##创建或打开要写入的文件
f = codecs.open("name.txt",'w','utf-8') 

##将娱乐名人排行榜的内容存入文件
for text in texts:
##    print(text.string)
    f.write(str(text.string+'\r\n')) 
f.close()


##读取文件验证写入的内容
file =  codecs.open('name.txt','r','utf-8')
lines = file.readlines()
names=[]
for line in lines:
    names.append(line.strip('\r\n'))

print(names) #2.x请将此行改为 print names

 

 

 

结果

 

python 将百度搜索风云榜的关键内容提取并写入txt文件和读取验证_第1张图片python 将百度搜索风云榜的关键内容提取并写入txt文件和读取验证_第2张图片

 

 

 

你可能感兴趣的:(教程)