公司每天要做工作汇报,汇报使用的网页版, 所以又想起 selenium 这个老朋友了。
再次上手,发现很多接口都变了, 怎么说呢, 应该是易用性更强了, 不过还是得重新看看, 我这里是python3。
pip安装得现在最新(20231128)版本(4.15.2), 下面做下操作记录。
引入模块
# selenium 导入
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
options =Options()
# 为了防止频繁启动终端,可以端口远程一个的方案
# /opt/google/chrome/chrome --remote-debugging-port=9527
crom_url = '127.0.0.1:9527'
options.add_experimental_option("debuggerAddress", crom_url)
epth = './3ds/chromedriver_linux64/chromedriver'
# 这里不太一样, 加了个ChromeService抽象层, 我认为更加合理
service = webdriver.ChromeService(executable_path=epth)
driver = webdriver.Chrome(service=service, options=options)
等待页面打开
while True:
driver.get("网址")
try:
WebDriverWait(driver, 60, 0.5).until(EC.presence_of_element_located([By.ID, "workBox"]))
break
except:
continue
新版本的定位器不一样了, 我写了个定位发送内容得功能。
def send_tkey(loc:list, ctx, clear=True):
time.sleep(random.random())
obj = None
if isinstance(loc[0], list):
for l in loc:
if len(l) == 2: l.append(0)
if obj is None:
obj = driver.find_elements(*l[:2])[l[2]]
else:
obj = obj.find_elements(*l[:2])[l[2]]
else:
if len(loc) == 2: loc.append(0)
obj = driver.find_elements(*loc[:2])[loc[2]]
if clear:
obj.clear()
time.sleep(random.random())
for e in ctx:
if isinstance(e, list):
obj.send_keys(*e)
else:
obj.send_keys(e)
time.sleep(random.random())
使用方法:
# 前面是定位器参数, 输入内容
send_tkey([[By.CLASS_NAME,'class1'],[By.TAG_NAME,'input']],'工作内容!',False)
定位器的基本用法
driver.find_elements(By.CLASS_NAME,'class1')[0].find_element(By.TAG_NAME,'input').send_keys(Keys.ENTER)
driver.find_elements(By.CLASS_NAME,'class1')[0].find_element(By.TAG_NAME,'input').click()
PS: 写这类工具,如果不急, 一定要多加延时控制,有一定的反“反爬机制”, 也对服务器有好一点,大家好。