Node js 和 python 混合编程的功臣--child_process
众所周知,当node 作为服务端时,JavaScript也能够操作本地文件,创建线程,来帮助我们执行一些之前在浏览器中不能执行的动作。但是如果服务端已经有了处理数据的python脚本,我们就没有必要用js实现了,将二者结合起来,岂不是更方便?所以node js 怎么将python调用起来,实现node js 和python的混合编程呢?接下来我们将深入研究几种node js 调用python的方法以及对应的传参方式。
在node 作为服务端时,它的child_procee模块可以起一个进程,使其具有了调用其他语言程序的功能。究其原因,是child_process 模块提供了衍生子进程的功能,子进程与Node.js 的父进程之间建立了 stdin、stdout 和 stderr 的管道,使数据能够以非阻塞的方式在管道中流通,从而实现了两个不同语言程序之间的通信。
node js调用python的两种常用方法是exec 和spawn。其对应的入参形式也有区别。详细功能以及child_process模块的其他功能可以参考其官网child_process官网链接。我们这里只把它们的区别写出来。
示例
先把两个例子写出来,然后再比较他们之间的区别和原理。
假设我们要执行的python脚本名称叫做textPython.py,建它放在python文件夹下面,然后我们在python同级目录下面创建一个js脚本,命名为exampleNodeCallPython.js。
首先要引入创建子进程的模块child_process,同时还需要一个path模块,利用它来获取python脚本的路径。如下:
const cp = require("child_process");
const path = requier("path");
const scriptFileName = path.join(__dirname,"python",' textPython.py');
scriptFileName就是我们要执行的python脚本路径名称。试着在命令行中直接执行scriptFileName 代表的字符串,发现python 脚本被调用了起来。
接下来用node js来运行它,在windows上,可以用下面两种方法执行。
方法1:利用child_process的spawn启一个cmd 进程,向它传入要执行的命令。其中inputPara 是node js向python脚本传入的参数。
代码如下:
const pyPid = cp.spawn("cmd.exe",['/c',"python",scriptFileName,inputPara]);
pyPid.stdout.on('data',(data)=>{
console.log(data);
});
pyPid.stderr.on('data',(data)=>{
console.log(data);
});
pyPid.on('exit',(data)=>{
console.log(data);
});
方法2:使用child_process的exec,向其传入要运行的命令。
cp.exec("python" + " " + scriptFileName + " " + inputPara, function(err,data){
console.log(data);
});
child_process.exec和child_process.spawn的区别
接下来我们来看一下这两个的区别,首先从node官方解释看,exec是在spawn基础上实现的,调用exec,node会衍生一个 shell 并在 shell 上运行命令,然后当执行完成时会将stdout 和 stderr 传入到到回调函数。其中shell在 Windows 上默认为 process.env.ComSpec。而对于spawn 我们可以设置它的shell选项为cmd.exe 然后将要执行的命令传入进去。
因此,在windows上,他们第一个区别是exec可以不用传入shell ,它使用默认的。而spawn指定shell,在windows上,我们可以传入cmd.exe。
第二个区别:exec 运行python脚本的标准输出,要等到整个python脚本运行完成后,才会返回给回掉函数。而spawn运行时,可以对其生成的进程的stdout进行监听,这样可以实时的查看python脚本的标准输出。不用等到python脚本执行完毕才能查看运行结果。
第三个区别:最后的也是最重要的一个,当我们通过node js 调用python时,总要给它传入一些参数,好让python 根据不同入参来运行。如果我们向python脚本传入的参数是JSON字符串时,exec和spawn就有一个重要的区别。
JSON字符串通过spawn方法传入python脚本后,在python脚本中通过json.loads方法可将其转换为python中的字典对象,能够直接使用。但是当通过exec 传入python脚本时,传入后会删除字符串中的引号,无法通过json.loads将其转换为python中的字典对象。在通过exec传入时,需要利用正则表达式,对引号加上转义,保留JSON字符串中的引号,这样才可以在python脚本中通过json.loads将其转换为字典对象来使用。
在node js中利用正则表达式对json字符串中的引号进行转义。
jsonobj.replace(/\"/g,"\\\"");
Node js中的数据对象在python脚本中仍作为数据对象
在js中,我们可以通过JSON.stringify()将JS对象转换为JSON,然后将JSON按照上面说的方法传入到python脚本中,在python中调用json.loads将JSON转换为python中的数据对象,然后可以直接使用。