p.s.高产量博主,点个关注不迷路!
今天更博比较晚,简单的写一个常见错误的处理吧:
首先展示一下我们的错误代码(一段xpath处理本地HTML文件的代码) :
from lxml import etree
tree = etree.parse('xpathDemo.html')
print(tree)
这是我们对应读取的HTML源代码:
XpathDemo
- 北京
- 北京
- 深圳
- 武汉
这是错误的信息:
lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 4 and head, line 6, column 8
它是什么意思呢?它的意思是说,我们读取的HTML文件的第四行,meta标签出错了,而且是语法错误,那我们回到上面找一找HTML文件的源码,第四行是:
它有什么错误呢,其实是它少了一个/线,因为根据HTML代码的规范性,标签都要求是一对出现的,这种单标签需要补一个斜线,但是我们常用的IDE生成这一行代码的时候往往都不会自动补全一个斜线,因此我们需要自己手动添加:
这样就不会报错了,以后报这种错误,直接在中加斜线即可!