先说一下环境:win7 64位,python3.8.10。
python使用execjs执行含有document的js代码时,会出现报错:
execjs._exceptions.ProgramError: TypeError: 'document' 未定义
原因是纯js代码中是不包含浏览器里对象的(如document、window等),这时就需要一个叫做jsdom的库。全局安装命令为:
npm i jsdom -g
首先需要安装npm,npm是nodejs 下的包管理器。
1、登录网址Node.js
下载后安装
结果出现如下问题,需要最低Windows8.1才可以。
尝试下载一个早一点版本的,历史版本下载网址Previous Releases | Node.js
下载并解压,我的路径是(C:\Users\Administrator\Downloads\node-v13.14.0-win-x64\node-v13.14.0-win-x64),其中node_modules是模块,node.exe是nodejs程序,npm.cmd是包管理器。
cmd进入此目录,运行node -v和npm -v,可以。
现在,cmd进入npm的路径下安装jsdom。
npm i jsdom -g
结果报错,看起来还是版本的问题:
经各种查询研究,jsdom的19.0.0的版本可以。通过下面网址可以看jsdom的各个版本。
https://www.npmjs.com/package/jsdom?activeTab=versions
https://www.npmjs.com/package/jsdom/v/19.0.0?activeTab=readme
安装指定版本(-g是指全局安装)的命令如下:
npm i [email protected] -g
安装完成后,cmd进入node路径下运行node
依次输入命令,可以看到有识别window和document的环境了。
const jsdom=require("jsdom");
const {JSDOM}=jsdom;
Hello worldconst dom = new JSDOM('
dom.window
dom.window.document
退出node的方式是快捷键:ctrl+c,好像要按两遍。
至此,jsdom已经在本机安装成功,接下来就要使用python、execjs来使用它。在下节讲。
备注:要将node和npm添加至环境变量,我的电脑-右键-属性-高级系统设置-然后下图操作
编辑后,里面应该有内容,在已有内容的最后先加一个英文的;,然后把node和npm的路径C:\Users\Administrator\Downloads\node-v13.14.0-win-x64\node-v13.14.0-win-x64填入即可
========================
安装好了jsdom后,就可以编程了,直接上代码:
import execjs#pip3.exe install PyExecJS
print(execjs.get().name)
js='''
const jsdom = require("jsdom");
const { JSDOM } = jsdom;
Hello worldconst dom = new JSDOM(`
window = dom.window;
document = window.document;
XMLHttpRequest = window.XMLHttpRequest;
function signature(a,b){
return a+b;
}
'''
ctx = execjs.compile(js,cwd='C:/Users/Administrator/Downloads/node-v13.14.0-win-x64/node-v13.14.0-win-x64/node_modules/npm/node_modules')
result = ctx.call('signature',2,3)
print(result)
因为安装jsdom的时候是全局安装,所以代码中需要cwd='包的路径'。注意:这里指的是npm中的node_modules的路径,并不是jsdom中的node_modules的路径。如图:
下面来个更复杂的,使用jsdom来定位一段xml代码中的指定元素并且获取相应的内容。
import execjs#pip3.exe install PyExecJS
js='''
const jsdom = require("jsdom");
const { JSDOM } = jsdom;
const dom = new JSDOM(`
This is a text, about something, that happened on
. It is a very important date.
`,{contentType: "application/xml"});
window = dom.window;
document = window.document;
XMLHttpRequest = window.XMLHttpRequest;
const dateEl = document.evaluate("PARAGRAPH/DATE", document, null, 9, null).singleNodeValue;
const date = dateEl.getAttribute("ISO");
function signature(){
return date;
}
'''
ctx = execjs.compile(js,cwd='C:/Users/Administrator/Downloads/node-v13.14.0-win-x64/node-v13.14.0-win-x64/node_modules/npm/node_modules')
result = ctx.call('signature')
print(result)
结果输出:20131117 。
其他的还没有研究,jsdom一般应该是在逆向js中编程使用吧。