在上一节中已经部署了Selenium+chromedriver的开发环境,在真正的开发之前,还需要学会利用浏览器来查找网页元素;
因为Selenium是通过程序来自动操控网页的控件元素,比如单击某个按钮、输入文本框内容等,若网页中有多个同类型的元素,好比有多个按钮,想要Selenium精准地单击目标元素,需要将目标元素的具体信息告知Selenium,让它根据这些信息在网页上找到该元素并进行操控。
网页的元素信息是通过浏览器的开发者工具来获取。以Google Chrome为例,在浏览器上访问(https://www.qq.com/),然后按快捷键F12打开Chrome的开发者工具(部分电脑要用 fn +12 ),
可以看到,开发者工具的界面共有9个标签页:
分别是Elements、Console、Sources、Network、Performance、Memory、Application、Security和Audits。
开发者工具以Web开发调试为主,如果只是获取网页元素信息,只需熟练掌握Elements标签页即可。
Elements标签页允许从浏览器的角度查看页面,也就是说,可以看到Chrome渲染页面所需要的HTML、CSS和DOM(Document Object Model)对象。
此外,还可以编辑内容更改页面显示效果,它一共分为两部分,左边是当前网页的HTML内容,右边是某个元素的CSS布局内容,查找元素信息以左边的HTML内容为主。
在查找控件信息之前,首先了解HTML的相关知识;
HTML是超文本标记语言,这是标准通用标记语言下的一个应用,“超文本”就是指页面内可以包含图片、链接,甚至音乐、程序等非文字元素。
超文本标记语言的结构包括“头”部分(Head)和“主体”部分(Body),其中“头”部分提供关于网页的信息,“主体”部分提供网页的具体内容。通过一个简单HTML来进一步了解:
#声明为HTML5标准的文档
#元素是html也没的根元素
#包含了文档部分的元(meta)数据
#提供主要页面的元信息,主要是描述和关键词
#元素描述了文档的标题
编程技术圈
#元素包含了可见的页面内容
#定义一个一级(h1)标题
我的一级标题
#定义一个段落(p标签)
我的第一个段落
一个完整的网页必定以为开头和结尾。
一、整个HTML可分为两部分:
(1)
是对网页的描述、图片和JavaScript的引用。 元素包含所有的头部标签元素,在元素中可以插入脚本(scripts)、样式文件(CSS)及各种meta信息,该区域可添加的元素标签有