错误类型分析:
IndexError: list index out of range
1
情况一:
list[index]中的index下标超出范围了,所以出现了访问越界;
情况二:
list本身就是一个空的,没有一个元素,所以当访问到list[0]的时候,就会出现该错误。
实例代码分析:
import re
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = 'http://www.360doc.com/content/15/0408/11/22483181_461495582.shtml'
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'lxml')
p = soup.find_all('p')
for i in p[7:-9]:
if ':' in i.get_text():
result = re.findall('、(.*?): ', i.get_text()) //list出现问题
name = result[0].replace('二队队长', '').replace('"神汉"', '').replace('地主', '').strip()
with open('name.txt', 'a+') as f:
f.write(name + '\n')
f.close()
解决办法:
在加注释的后面加一句print (result)
将list的结果打印出来看是都list为空。
结果发现list为空,后来发现是result = re.findall('、(.*?): ', i.get_text())里边的标点符号有问题,中文的:打成了英文的:,因此导致result为空。
result = re.findall('、(.*?):', i.get_text())
即解决了该问题。