Node.js child_process模块中的spawn和exec方法

Node.js的child_process模块中有两个方法spawn和exec,这两个方法都可以被用来开启一个子进程来执行其他的程序。一些Node.js的新手常常对这个两个方法感到很困惑:既然两个方法的功能一样,那么究竟应该选择哪个方法。在本文中,我们将一起来探索spawn和我exec方法的不同之处,以便你在将来能够选择正确的方法。

child_process.spawn会返回一个带有stdout和stderr流的对象。你可以通过stdout流来读取子进程返回给Node.js的数据。stdout拥有’data’,’end’以及一般流所具有的事件。当你想要子进程返回大量数据给Node时,比如说图像处理,读取二进制数据等等,你最好使用spawn方法。

child_process.spawn方法是“异步中的异步”,意思是在子进程开始执行时,它就开始从一个流总将数据从子进程返回给Node。

spawn从定义来看,有3个参数。

child_process.spawn(command, args, options)
  • command: 只执行的命令
  • args: 参数列表,可输入多的参数
  • options: 环境变量对象

其中环境变量对象包括7个属性:

  • cwd: 子进程的当前工作目录
  • env: 环境变量键值对
  • stdio: 子进程 stdio 配置
  • customFds: 作为子进程 stdio 使用的文件标示符
  • detached: 进程组的主控制
  • uid: 用户进程的ID.
  • gid: 进程组的ID.

下面是一个例子,比如说我们想从一个URL下载文件,我们选择使用curl工具,此时,我们就可以在Node中使用spawn运行curl工具,下面是具体代码:

// 使用curl下载文件的函数
var download_file_curl = function(file_url) {

  // 提取文件名
  var file_name = url.parse(file_url).pathname.split('/').pop();
  // 创建一个可写流的实例
  var file = fs.createWriteStream(DOWNLOAD_DIR + file_name);
  // 使用spawn运行curl
  var curl = spawn('curl', [file_url]);
  // 为spawn实例添加了一个data事件
  curl.stdout.on('data', function(data) { file.write(data); });
  // 添加一个end监听器来关闭文件流
  curl.stdout.on('end', function(data) {
    file.end();
    console.log(file_name + ' downloaded to ' + DOWNLOAD_DIR);
  });
  // 当子进程退出时,检查是否有错误,同时关闭文件流
  curl.on('exit', function(code) {
    if (code != 0) {
      console.log('Failed: ' + code);
    }
  });
};

child_process.exec方法会从子进程中返回一个完整的buffer。默认情况下,这个buffer的大小应该是200k。如果子进程返回的数据大小超过了200k,程序将会崩溃,同时显示错误信息“Error:maxBuffer exceeded”。你可以通过在exec的可选项中设置一个更大的buffer体积来解决这个问题,但是你不应该这样做,因为exec本来就不是用来返回很多数据的方法。对于有很多数据返回的情况,你应该使用上面的spawn方法。那么exec究竟是用来做什么的呢?我们可以使用它来运行程序然后返回结果的状态,而不是结果的数据。

child_process.exec方法是“同步中的异步”,意思是尽管exec是异步的,它一定要等到子进程运行结束以后然后一次性返回所有的buffer数据。如果exec的buffer体积设置的不够大,它将会以一个“maxBuffer exceeded”错误失败告终。

和上面一样,我们现在还是想要从一个URL下载文件。不同的是,我们现在要使用wget方法而不是curl方法,此时我们就需要使用exec方法在Node中执行wget命令,同时在子进程运行完毕后返回结果信息。下面是具体代码:

// 使用wget下载文件的函数
var download_file_wget = function(file_url) {

  // 提取文件名
  var file_name = url.parse(file_url).pathname.split('/').pop();
  // 组合wget命令
  var wget = 'wget -P ' + DOWNLOAD_DIR + ' ' + file_url;
  // 使用exec执行wget命令

  var child = exec(wget, function(err, stdout, stderr) {
    if (err) throw err;
    else console.log(file_name + ' downloaded to ' + DOWNLOAD_DIR);
  });
};

现在,你应该已经很清楚spawn和exec之间的区别了。总结一下:当你想要从子进程返回大量数据时使用spawn,如果只是返回简单的状态信息,那么使用exec。

你可能感兴趣的:(Node.js child_process模块中的spawn和exec方法)