爬虫selenium(python)一点 坑

1.对于多层嵌套的 window  ,就是 在外层body里面 加入iframe 形成嵌套的window ,

那么要想对 内层上的元素定位 ,就要先将window_handle 切换到内层window即

param["browser"].switch_to_default_content()
param["browser"].switch_to_frame("rightFramebooking")
可以自行百度如何定位iframe

2.有个网站贼复杂,所以放弃post模拟登陆,直接用selenium,登陆后获取selenium的cookies放在request的cookie里,

一开始用mac开发很顺利,然而后来在window环境下测试却发现用selenium返回的cookie 不行了会被302

仔细对比请求头发现,原来 cookie 的结构不止name-value那么简单,我 的坑就跟 path有关,即 在path:/下有个id和

path:/XXXX/的同名id 被覆盖了,在mac里 :/XXXX会把:/的覆盖,而windows则正相反,从而导致 一个验证出错.


你可能感兴趣的:(爬虫)