python爬虫入门-selenium学习方法分享

文章目录

  • 前言
  • 简介
  • 安装
    • cmd
    • pycharm导入
    • 常见的坑
  • 简单演示
  • 学习推荐
    • 文档推荐
    • 视频推荐

前言

这篇博客是本人对自己自学selenium的一些总结,希望通过自己的分享能帮上刚开始自学的朋友们;同时也请已经掌握selenium的大佬们指出当中的不足。
在使用selenium之前,最好确认自己已经有了一些html、css等基础知识。

简介

曾经看到的名字由来:Selenium的中文名为“硒”,是一种化学元素的名字,它对汞 (Mercury)有天然的解毒作用,实验表明汞暴露水平越高,硒对汞毒性的拮抗作用越明显,所以说硒是汞的克星。大家应该知道Mercury测试工具系 列吧(QTP,QC,LR,WR…),他们功能强大,但却价格不菲,大家对此又爱又恨!故thoughtworks特意把他们的Web开源测试工具命 名为Selenium,以此帮助大家脱离汞毒。
其实对于python做爬虫而言,selenium真的是非常好用的一个工具,在此就简单分享一点我的学习方法。

安装

cmd

pip install selenium

pycharm导入

from selenium import webdriver

个人建议此种用法,对新手而言,pycharm的导入模块真的比命令行安装友好很多;不过,得注意修改pip源,否则导入的网速过慢可能会超时;具体操作请见 https://mp.csdn.net/mdeditor/86620014#

常见的坑

获取浏览器对象时出现问题

browser = webdriver.Chrome()

注意chromedriver与Chrome之间的版本匹配,火狐那些也同理。

在这借用别人的一张图
python爬虫入门-selenium学习方法分享_第1张图片
具体的对应关系可去官网查询
https://docs.seleniumhq.org/download/
各种版本的geckodriver下载:
https://github.com/mozilla/geckodriver/releases
各种版本的chromedriver下载:
http://chromedriver.storage.googleapis.com/index.html
将相应版本的驱动放到python安装目录的scripts中python爬虫入门-selenium学习方法分享_第2张图片

简单演示

browser = webdriver.Chrome()
browser.get('https://www.taobao.com/')
python爬虫入门-selenium学习方法分享_第3张图片
这样就成功启动浏览器打开指定页面,之后关于页面元素的操作,需要有一定的HTML、CSS基础才好,不熟悉的朋友可以去看看我的另外几篇博客 https://blog.csdn.net/weixin_44112790/article/details/86620142

学习推荐

文档推荐

建议编程基础不错或者学习能力强的新手优先尝试这种自学方法。
python爬虫入门-selenium学习方法分享_第4张图片
在此推荐一个中文手册 https://selenium-python-zh.readthedocs.io/en/latest/installation.html
这里面使用方法、代码实例已经比较详细,建议新手学习的时候,根据自己想要实现的操作查询响应的代码;一定要注意方法调用的参数返回结果

视频推荐

建议刚学完python基础或者有其他面向对象编程语言基础的朋友优先尝试这种入门学习方法,我自己就是在学完javaSE之后简单看了下python基础就跟着视频学了,感觉效果不错。
https://www.bilibili.com/video/av18202461/?p=13
这个视频讲解的非常详细,不过随着版本的变化,可能有些地方也会有变化,学习时注意弹幕中的提醒。

你可能感兴趣的:(爬虫,#,入门推荐,python,爬虫)