记一次 Electron + DLL/SO(node-ffi) + sqlite3 项目实践

背景

这是一个全栈项目,后端使用 node 。项目需要提供B端与C端两个版本:

  • B端要求支持多实例环境
  • C端要求跨平台离线独立运行

项目中一些复杂的数据处理功能由 C语言 编译而成的 动态链接库(DLL) (在 Linux 下叫做 Shared Library , 简称 SO ,以下统称 DLL),及 python 封装的接口以 http 形式提供服务。在C端版本中,由于需要满足离线独立运行的需求,python 服务被打包成 可执行程序node 通过执行命令行方式调用。

根据以上要求,我们做了以下技术选型。

技术选型

  1. node 版本

    选用了当时的 LTS 版本 10.15.3,但由于后来为了和 Electron 中内置的 node 版本保持统一,修改为了 10.11.0

    虽然 10.15.3 与 10.11.0 感觉版本相差不多,但确实有一些特性不同。例如 fs.mkdir , 10.15.3 支持 recursive 选项,但 10.11.0 不支持,导致迁移到 Electron 时,运行结果不符预期。因此如果同时要开发 B 端与 C 端,为了更方便迁移,最好一开始便确定好 node 的具体版本。

  2. 数据库

    由于需要支持C端 离线独立运行 的需求,数据库选用了 sqlite

    sqlite 是单文件数据库,npm 包 sqlite3 ,是对 sqlite3 引擎的一层封装。一个数据库文件、一个包含数据库引擎的 npm 包,使得C端打包成离线独立运行程序成为可能。

  3. DLL 的载入与调用

    node 中,DLL 的调用,主要借助以下两个 npm 包:

    • ffi : 实现 node 加载并调用 DLL
    • ref : 提供强大的内存指针操作
  4. C 端应用构建与打包

    Electron 是由 Github 开发,用 HTML,CSS 和 JavaScript 来构建跨平台桌面应用程序的一个开源库。Electron 通过将 Chromium 和 Node.js 合并到同一个运行时环境中,并将其打包为 Mac,Windows 和 Linux 系统下的应用来实现这一目的。

    Electron 对前端开发者的友好,及对跨平台的支持,使得我们决定使用 Electron 来对 B 端版本进行一次包装,最大程度复用 B 端代码。主要用到了这几个依赖:

    • [email protected] : 4.x 版本的 electron 内置的 node 版本是 10.x ,可以与 B 端所用 node 版本匹配
    • electron-builder : 用于 electron 打包

开发环境搭建及问题排查

  1. 依据 DLL位数 确定开发环境

    DLL位数 对开发环境搭建有很大的影响。以本项目为例,某 DLL windows 平台上只提供了 32 位版本,导致我们在开发时,必须选用 32 位 node。万幸的是,不需要系统也为 32 位。

    此处推荐使用 nvm 对 node 版本进行管理,当切换了 node 版本后,类似于 ffi ref sqlite3 node-sass 这样的原生模块都需要重装,借助 node-gyp 或同类工具进行重新编译。

    参考:native module on node.js

  2. 安装 ref ffi sqlite3 等原生模块依赖时,需要借助 node-gyp 来针对当前系统平台进行编译。因此 node-gyp 的安装前置条件必须满足

    参考:github: node-gyp#Installation

    以下为本项目中实践步骤

    • Linux

      • 安装 python v2.7
      • 安装 make
      • 安装 gcc gcc-c++

        • gcc 版本需要与使用的 DLL 依赖的 gcc 版本保持一致,gcc-c++ 需要与 gcc 版本保持一致
    • Windows

      • npm install --global --production windows-build-tools

        • windows-build-tools 能够帮助我们方便地配置好编译 node 原生模块需要的环境
        • 本项目中还使用了参数 --vs2015 ,默认情况安装的是 VS2017 ,一开始遇到了一些问题,后来换成 VS2015 过程要顺畅一些,这个选项可看情况选择
      • npm config set msvs_version 2015 ,如果安装的是 VS2017 ,则值设置为 2017
      • npm config set python python2.7的安装路径
  3. Electron 开发环境

    Electron 开发环境与第 2 点要求一致,不同的是,我们使用的 node 是 Electron 内置的 node ,而非系统安装的 node 。因此需要为 Electron 环境重新编译 node 原生模块。

    这一步可以借助npm包 electron-rebuildelectron-builder 完成

本项目使用的是第二种方式:

  • 安装依赖 electron-builder
  • 添加 "postinstall": "electron-builder install-app-deps" 到 npm scripts 中,这样每次安装依赖时,将会自动为我们进行原生模块编译

Electron 版本选择扩展资料:

    1. 安装依赖(其中一些问题也可能出现在 Electron 打包中)

      npm install

    DLL 的使用

    相比起环境配置, DLL 的使用要更简单。ffi 结合 ref ,基本使用可参考 ffi 官方示例 ref 官方示例

    常见问题

    1. DLL 依赖于其他 DLL

      这个问题比较常见,我们尝试过两种方案

      1. 使用 ffi.DynamicLibrary 引入依赖

        let { RTLD_NOW, RTLD_GLOBAL } = ffi.DynamicLibrary.FLAGS;
        // 有多个则执行多次 ffi.DynamicLibrary 来引入多个
        ffi.DynamicLibrary(
            '/path/to/.dll/or/.so',
            RTLD_NOW | RTLD_GLOBAL
        );
      2. 使依赖可全局访问,详情见下文
    2. 遇到错误码为 126 的 win error

      这个表示无法找到 DLL ,可能是路径错误,也可能是其依赖未引入或无法被程序在全局路径访问。开发与部署环境有差异时,很容易遇到这种问题。

      那么我们可以怎样确定缺少的依赖是哪一个呢? Linux 提供了 ldd 支持我们查看程序运行所需的 DLL ,若无法找到某个依赖,其对应的地址将为 not found 。 Windows 自带的 CMD 不支持该命令,但 Git Bash 等工具为我们集成了该功能。另外 Windows 下也可以使用 Dependency Walker 等工具获取依赖。

    3. 想合并多个库到一个对象上

      ffi.Library 第三个参数支持传入一个对象,若传入这个对象, ffi 会将该库新增的方法添加到这个对象上,同名将被覆盖,最终返回这个对象,没有传这个参数时,会返回一个新的对象。可以这样做,但一般来说没有这种需求。

    4. 使用 ffi 读取复杂数据结构

      举一个简单的例子——读取字符串数组

      function readStringArray (buffer, total) {
          let arr = [];
          for (let i = 0; i < total; i++) {
              arr.push(ref.get(buffer, ref.sizeof.pointer * i, ref.types.CString));
          }
          return arr;
      }

      参考:Complex data structures with node-ffi

    使 DLL 或其依赖可全局访问

    Windows 环境

    • 共享目录方式
    Win 32 Win 64
    32-bit DLL C:/Windows/System32 C:/Windows/SysWOW64
    64-bit DLL C:/Windows/System32
    
    根据 DLL 位数及操作系统位数的不同,将 DLL 放到以上某个目录即可
    
    
    • 环境变量 PATH

      众所周知, Windows 下 PATH 环境变量非常神奇, DLL 也不例外。将 DLL 所在目录的绝对路径加到 PATH 环境变量中,可以实现 DLL 全局访问。放在 node 里面,可以通过如下方式动态设置:

      process.env.PATH += `${path.delimiter}${xxx}`;

    Linux 环境

    主要是通过命令 ldconfigldconfig 是一个 SO 管理命令,可以使 SO 为系统所共享。 ldconfig 按照一定规则搜寻 SO 并创建链接、缓存,供程序使用。

    以下为搜寻范围:

    • /lib 目录
    • /usr/lib 目录
    • /etc/ld.so.conf 文件中声明的目录
    • 通常情况下, /etc/ld.so.conf 文件中会有一行如下内容:

      include ld.so.conf.d/*.conf

      因此,目录 /etc/ld.so.conf.d 里以 .conf 结尾的文件中声明的目录也在搜寻范围

    • 全局变量 LD_LIBRARY_PATH 中设置的目录

    因此,将 SO 放置到如上所说的目录中,并执行 ldconfig 即可实现 SO 共享。我们可以修改 /etc/ld.so.conf 文件、新增 /etc/ld.so.conf.d/*.conf 文件或修改全局变量 LD_LIBRARY_PATH

    参考:

    一个 Linux 开机脚本配合 ldconfig 应用实践

    项目中文件解析部分依赖了许多 DLL ,其中有部分对图形界面产生了影响,导致用户再次登录时显示黑屏。

    文件解析的 DLL 依赖是通过 node 在程序启动时写了一个文件到 /etc/ld.so.conf.d 下,里面声明了依赖所在路径,linux 开机时会自动加载。而解决黑屏则需要在开机时,自动去除该依赖声明,避免用户无法进入系统桌面。

    因此此处需要用到开机脚本在开机时为我们做一些处理,示例如下:

    新建文件 delete-ldconfig.sh 内容如下:

    #!/bin/bash
    # chkconfig: 5 90 10
    # description: test
    
    rm -f /etc/ld.so.conf.d/test.conf
    ldconfig

    执行如下命令:

    cp ./delete-ldconfig.sh /etc/rc.d/init.d
    cd /etc/rc.d/init.d/
    chmod +x delete-ldconfig.sh
    chkconfig --add delete-ldconfig.sh
    chkconfig delete-ldconfig.sh on

    参考:

    Electron 主进程繁忙阻塞渲染进程问题

    C端进行文件解析测试时,使用了一个 node_modules 目录打包而成的压缩包,体积虽然不算很大,但小文件十分多。调用 DLL 解析时,大致耗时30分钟,后续程序处理又花了较久时间。在此期间,C端应用界面失去响应。

    经过查询,原来在 chromium 中,页面渲染时,UI 进程需要和 main process 不断的进行 sync IPC ,若此时 main process 忙,则 UI process 就会在 IPC 时阻塞。

    所以,不希望渲染进程被阻塞,就需要为主进程减负。如

    • 在大量同步代码中间断地插入异步处理,将执行权暂时交出
    • 使用多进程

    参考:Electron的主进程阻塞导致UI卡顿的问题

    中断同步代码

    在一开始的实现中,文件解析后的结果处理是使用一个 for 循环,无任何异步操作,是一个 CPU 密集型的任务。

    使用以下代码模拟该场景:

    (async () => {
        setInterval(() => {
            console.log('=====');
        }, 60);
        while (true) {
            // 一些处理
        }
    })();

    为了解决这块的阻塞问题,我们可以进行如下改造:

    (async () => {
        setInterval(() => {
            console.log('=====');
        }, 60);
        while (true) {
            await new Promise(resolve => {
                setImmediate(() => {
                    // 一些处理
                    resolve();
                });
            });
        }
    })();

    使用多进程

    在 Electron 中实现多进程有很多选择,如 Web Workers、Node 的 child_process 模块、 cluster 模块、 worker_threads 模块等。

    由于 Electron 项目安装的原生模块是经过重新编译的,且应用运行时,会出现环境变量上的差异,导致某些系统程序无法找到。因此,我们不能直接用 child_process.exec 等类似方式来启动我们子进程。

    此次实践中,我们经过多种尝试,最终决定采用如下方式:

    // 主进程
    const bkWorker = child_process.spawn(process.execPath /* 1 */, ['./app.js'], {
        stdio: [0, 1, 2, 'ipc'], /* 2 */
        cwd: __dirname, /* 3 */
        env: process.env /* 4 */
    });
    bkWorker.on('message', (message) => {
        // ...
    });
    
    // 子进程
    process.send(/* ... */); /* 5 */

    说明:

    1. 指定要执行的程序路径,主进程中, process.execPath 代表的是 electron 程序路径
    2. 启动一个父子进程间的IPC通道方便我们使用 process.send 进行通信
    3. 设置子进程的当前工作目录
    4. 同步父进程的环境变量到子进程

    参考:node文档-child_process.spawn

    spawn 的子进程意外退出重启处理探究

    主进程 index.js

    const { spawn } = require('child_process');
    
    let worker;
    
    function serve () {
        worker = spawn(process.execPath, ['./test1.js'], {
            stdio: [0, 1, 2, 'ipc'],
            cwd: __dirname,
            env: process.env
        });
        worker.on('message', (...args) => {
            console.log('message', ...args);
        });
        worker.on('error', (...args) => {
            console.log('error', ...args);
        });
        worker.on('exit', (code, signal) => {
            console.log('exit', code, signal);
        });
        worker.on('disconnect', () => {
            console.log('disconnect');
        });
        // 基本子进程退出,都会触发 worker.on('close')
        // 因此可以在这里做一些子进程重启之类的事
        worker.on('close', (code, signal) => {
            console.log('close', code, signal);
            // serve();
        });
    
        // 先后触发 worker 的 disconnect exit close 事件, exit 参数为 null SIGTERM
        // setTimeout(() => {
        //     worker.kill();
        // }, 2000);
    }
    
    // process.exit :主进程会马上退出,不会影响子进程,要退出子进程需要另做处理
    // process.abort :不会影响子进程,要退出子进程需要另做处理
    // throw Error :不会影响子进程,要退出子进程需要另做处理
    // setTimeout(() => {
    //     // process.exit();
    //     // process.abort();
    //     // throw new Error('1231');
    // }, 10000);
    
    setInterval(() => {
        console.log(process.pid, '===');
    }, 1000);
    
    serve();

    子进程 test1.js

    process.on('uncaughtException', (error) => {
        console.log('worker uncaughtException', error);
        process.send({
            type: 'error',
            msg: error
        });
    });
    
    process.send('connected');
    
    setInterval(() => {
        console.log(process.pid, '---');
    }, 1000);
    
    // 会触发 worker.on('disconnect') ,主 子 进程都不会退出,但连接中断,不能使用 process.send ,会报错
    // setTimeout(() => {
    //     process.disconnect();
    //     // process.send('hello?');
    // }, 3000);
    
    // process.abort :先后触发 worker 的 disconnect exit close 事件, exit 及 close 参数为 null SIGABRT
    // process.exit :先后触发 worker 的 disconnect exit close 事件, exit 及 close 参数为 0 null
    // setTimeout(() => {
    //     // process.abort();
    //     // process.exit();
    // }, 10000);
    
    // 用 process.on('uncaughtException') 处理
    // setTimeout(() =>{
    //     throw new Error('123');
    // }, 1500);

    打包后程序执行调试技巧

    使用命令行运行程序

    进入打包后程序所在目录,假设程序名为“Test”,则执行命令 ./Test 即可执行程序,并且程序中所有控制台输出都会打印在该终端中。我们可以借助输出信息进行调试。

    asar

    当 windows 打包开启 asar 时,打包后文件资源被归档到一个 asar 档案文件。如果刚好我们需要调试的话,可能需要更改代码后重新打包、安装、运行。但实际上有更方便的方式。

    asar 提供命令行工具,通过命令行,我们可以打包、列出归档文件中的文件列表、解压某个单文件、解压整个档案文件等功能。

    因此,我们的打包后调试过程可以被简化为:

    • 关闭应用,解压打包后 asar 文件
    • 修改代码,然后将修改后的文件整个重新打包,重启应用

    参考:npm-asar

    杂项

    Linux 虚拟机的安装及常用环境搭建

    虚拟机安装:http://note.youdao.com/notesh...

    环境搭建:http://note.youdao.com/notesh...

    VS Code 调试 Electron 配置文件

    {
        "version": "0.2.0",
        "configurations": [
            {
                "name": "Electron",
                "type": "node",
                "request": "launch",
                "cwd": "${workspaceRoot}",
                "program": "${workspaceFolder}/server/index.js",
                "runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron",
                "windows": {
                    "runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron.cmd"
                },
                "args": [
                    "."
                ],
                "outputCapture": "std",
                "env": {
                    "NODE_ENV": "development"
                }
            }
        ]
    }

    使用硬链接管理文件资源引用关系

    文件链接有两种:硬链接与符号链接。

    硬链接直接指向数据,会增加该文件的 inode 计数,数据只会存在一份,所有指向该数据的链接是同步的。在文件系统中, inode 为 0 的数据会被删除。而符号链接是记录的该文件位置,并不会增加文件的 inode 计数,平时我们使用到的快捷方式就是符号链接,目标文件删除,链接并不会消失,但这个链接指向的资源却无法再找到。

    在项目中有这样一个问题:整个系统是围绕着文件资源进行的业务处理,各个模块是串联进行,上游输出是下游输入。但各个流程的资源需要允许用户隔离管理,本模块对某个资源的依赖不影响其他模块的删除。

    如果要做到相互不依赖,可能的办法有:每个环节都存一份文件。但是这种方式,会浪费大量的硬盘空间,数据同步也不好处理。因此最终我们选择使用硬链接来实现该部分需求。

    硬链接操作起来非常简单,在 node 中主要有以下几个操作:

    const fs = require('fs');
    fs.link(existingPath, newPath, callback); // 创建硬链接
    fs.unlink(path, callback); // 删除硬链接
    fs.stat(path[, options], callback).nlink; // 查看 inode 数

    参考:

    postgre 数据导出

    rm -f dlp.sql&&pg_dump -U 用户名 -d 数据库名 -f 文件名.sql -h 服务器host -p 端口 -s

    参考:pg_dump

    错误处理

    事件相关

    • 事件内抛出的错误会被外层捕获

      const { EventEmitter } = require('events');
      const event = new EventEmitter();
      event.on('test', () => {
          // throw new Error('1');
          try {
              throw new Error('2');
          } catch (e) {
              event.emit('error', e);
          }
      });
      event.on('error', (e) => {
          console.log(e); // Error: 2
      });
      try {
          event.emit('test');
      } catch (e) {
          console.log(e); // Error: 1
      }

    同步异步相关

    • Promise 中的错误处理

      await 非常关键,没有 awaittry 无法捕获到 catchthrow 的错误

      (async () => {
          try {
              let res = await new Promise(() => {
                  throw new Error(2);
              }).catch(error => {
                  if (error.message === '1') {
                      return Promise.resolve('haha');
                  } else throw error;
              });
              console.log(res);
          } catch (e) {
              debugger;
          }
      })();

    跨盘符移动文件

    function moveFileCrossDevice (source, target) {
        return new Promise((resolve, reject) => {
            try {
                if (!fs.existsSync(source)) reject(new BEKnownError('源文件不存在'));
                let readStream = fs.createReadStream(source);
                let writeStream = fs.createWriteStream(target);
                readStream.on('end',function(){
                    fs.unlinkSync(source);
                    resolve();
                });
                readStream.on('error', (error) => {
                    reject(error);
                });
                writeStream.on('error', (error) => {
                    reject(error);
                });
                readStream.pipe(writeStream);
            } catch (e) {
                reject(e);
            }
        });
    }

    docker 常用命令

    http://note.youdao.com/notesh...

    你可能感兴趣的:(node.js,electron,sqlite3,dll)