python使用execjs利用jsdom来执行含有document的js代码方案及设置环境变量

先说一下环境:win7 64位,python3.8.10。

python使用execjs执行含有document的js代码时,会出现报错:

execjs._exceptions.ProgramError: TypeError: 'document' 未定义

原因是纯js代码中是不包含浏览器里对象的(如document、window等),这时就需要一个叫做jsdom的库。全局安装命令为:

npm i jsdom -g

 

首先需要安装npm,npm是nodejs 下的包管理器。

1、登录网址Node.js

下载后安装

结果出现如下问题,需要最低Windows8.1才可以。

尝试下载一个早一点版本的,历史版本下载网址Previous Releases | Node.js 

 下载并解压,我的路径是(C:\Users\Administrator\Downloads\node-v13.14.0-win-x64\node-v13.14.0-win-x64),其中node_modules是模块,node.exe是nodejs程序,npm.cmd是包管理器。

 cmd进入此目录,运行node -v和npm -v,可以。

 现在,cmd进入npm的路径下安装jsdom。

npm i jsdom -g

 结果报错,看起来还是版本的问题:

经各种查询研究,jsdom的19.0.0的版本可以。通过下面网址可以看jsdom的各个版本。

https://www.npmjs.com/package/jsdom?activeTab=versions

https://www.npmjs.com/package/jsdom/v/19.0.0?activeTab=readme

安装指定版本(-g是指全局安装)的命令如下:

npm i [email protected] -g

安装完成后,cmd进入node路径下运行node

 依次输入命令,可以看到有识别window和document的环境了。


  1. const jsdom=require("jsdom");

  2. const {JSDOM}=jsdom;

  3. const dom = new JSDOM('

    Hello world

    ');

  4. dom.window

  5. dom.window.document

退出node的方式是快捷键:ctrl+c,好像要按两遍。

至此,jsdom已经在本机安装成功,接下来就要使用python、execjs来使用它。在下节讲。

备注:要将node和npm添加至环境变量,我的电脑-右键-属性-高级系统设置-然后下图操作

编辑后,里面应该有内容,在已有内容的最后先加一个英文的;,然后把node和npm的路径C:\Users\Administrator\Downloads\node-v13.14.0-win-x64\node-v13.14.0-win-x64填入即可

========================

安装好了jsdom后,就可以编程了,直接上代码:


  1. import execjs#pip3.exe install PyExecJS

  2. print(execjs.get().name)

  3. js='''

  4. const jsdom = require("jsdom");

  5. const { JSDOM } = jsdom;

  6. const dom = new JSDOM(`

    Hello world

    `);

  7. window = dom.window;

  8. document = window.document;

  9. XMLHttpRequest = window.XMLHttpRequest;

  10. function signature(a,b){

  11. return a+b;

  12. }

  13. '''

  14. ctx = execjs.compile(js,cwd='C:/Users/Administrator/Downloads/node-v13.14.0-win-x64/node-v13.14.0-win-x64/node_modules/npm/node_modules')

  15. result = ctx.call('signature',2,3)

  16. print(result)

因为安装jsdom的时候是全局安装,所以代码中需要cwd='包的路径'。注意:这里指的是npm中的node_modules的路径,并不是jsdom中的node_modules的路径。如图:

 下面来个更复杂的,使用jsdom来定位一段xml代码中的指定元素并且获取相应的内容。


  1. import execjs#pip3.exe install PyExecJS

  2. js='''

  3. const jsdom = require("jsdom");

  4. const { JSDOM } = jsdom;

  5. const dom = new JSDOM(`

  6. This is a text, about something, that happened on

  7. 17.November 2023

  8. . It is a very important date.

  9. `,{contentType: "application/xml"});

  10. window = dom.window;

  11. document = window.document;

  12. XMLHttpRequest = window.XMLHttpRequest;

  13. const dateEl = document.evaluate("PARAGRAPH/DATE", document, null, 9, null).singleNodeValue;

  14. const date = dateEl.getAttribute("ISO");

  15. function signature(){

  16. return date;

  17. }

  18. '''

  19. ctx = execjs.compile(js,cwd='C:/Users/Administrator/Downloads/node-v13.14.0-win-x64/node-v13.14.0-win-x64/node_modules/npm/node_modules')

  20. result = ctx.call('signature')

  21. print(result)

结果输出:20131117 。

其他的还没有研究,jsdom一般应该是在逆向js中编程使用吧。

你可能感兴趣的:(python,javascript,开发语言)