python使用selenium webdriver从隐藏元素中获取文本

python使用selenium webdriver从隐藏元素中获取文本

由于webdriver spec的定义,Selenium WebDriver 只会与可见元素交互,所以获取隐藏元素的文本总是会返回空字符串。 
可是,在某些情况下,我们需要获取隐藏元素的文本。这些内容可以使用element.attribute('attributeName'), 通过textContentinnerTextinnerHTML等属性获取。

  • innerHTML 会返回元素的内部 HTML, 包含所有的HTML标签。 
    例如,
    Hello

    World!

    innerHTML会得到Hello

    World!

  • textContent 和 innerText 只会得到文本内容,而不会包含 HTML 标签。 
    • textContent 是 W3C 兼容的文字内容属性,但是 IE 不支持
    • innerText 不是 W3C DOM 的指定内容,FireFox不支持

 示例


 
   
   
   
   
  1. from selenium import webdriver
  2. DEMO_PAGE = '''data:text/html,
  3. Demo page for how to get text from hidden elements using Selenium WebDriver.

  4. Demo div

    with a hidden paragraph inside.



    '''
  5. driver = webdriver.PhantomJS()
  6. driver.get(DEMO_PAGE)
  7. demo_div = driver.find_element_by_id( "demo-div")
  8. print demo_div.get_attribute( 'innerHTML')
  9. print driver.execute_script( "return arguments[0].innerHTML", demo_div)
  10. print demo_div.get_attribute( 'textContent')
  11. print driver.execute_script( "return arguments[0].textContent", demo_div)
  12. driver.quit

输出


 
   
   
   
   
  1. Demo div

    "display:none"> with a hidden paragraph inside.



  2. Demo div

    "display:none"> with a hidden paragraph inside.



  3. Demo div with a hidden paragraph inside.
  4. Demo div with a hidden paragraph inside.

 

你可能感兴趣的:(selenium)