关于使用python 动态爬虫Selenium 下载文件,文件类型的设置

本文主要用来保存自己在使用selenium 进行文件下载是遇到的坑,

使用selenium 对火狐浏览器自动下载文件时的设置如下,
fp = webdriver.FirefoxProfile()
fp.set_preference(“browser.download.folderList”,2) #0 表示默认目录,2表示自定义目录
fp.set_preference(“browser.download.manager.showWhenStarting”,False) #是否显示下载器
fp.set_preference(“browser.download.dir”,filedir) #自定义目录
fp.set_preference(“browser.helperApps.neverAsk.saveToDisk”, “application/vnd.openxmlformats-officedocument.spreadsheetml.sheet”)#下载文件类型
对于大多数下载不成功的文件,或者程序执行完但是没有下载下来文件的,主要是这里,文件类型设置失败,下面的代码可以下载大多数类型文件

fp.set_preference(“browser.helperApps.neverAsk.saveToDisk”, “application/octet-stream, application/vnd.ms-excel, text/csv, application/zip,application/x-msdownload,application/vnd.openxmlformats-officedocument.spreadsheetml.sheet”)#下载文件类型

你可能感兴趣的:(python爬虫,python3,selenium,自动下载文件,爬虫)