背景
在小米面试的时候被问到这个问题。一直以来都认为 Node.js 是只支持单线程。如果想开启多核支持的话,一般会在 PM2 中设置集群模式。所以,听到 Node.js 原生可以支持多线程的时候真的吃惊不小。
目标
- Node.js 是否支持多线程;
- Node.js 充分利用多核 CPU 的方式;
Node.js 是否支持多线程
查了很多资料,都是说 Node.js 只支持单线程。但是可以开启多进程充分利用多核 CPU。
Node.js 充分利用多核 CPU 的方式
开启多进程
如何开启多进程来充分利用多核 CPU 呢?首先需要一个测试用例,来验证开启多进程的前后效果。一开始想搭建服务器,然后做压力测试,因为没有怎么用过压力测试,还需要再单独学习压力测试的相关概念。为了聚焦问题,暂时就不使用压力测试的方式来验证,而采用了参考资料中的斐波那契数列计算作为测试用例。
测试用例
测试主要是要同时计算几个斐波那契数列,对比前后速度。因为我的个人电脑是双核四线程 CPU,相当于有 4 个逻辑核心。所以为了简化测试环境,用例就设置为计算 4 组斐波那契数列。
function fibonacci (n) {
return n === 0
? 0
: n === 1
? 1
: fibonacci(n - 1) + fibonacci(n - 2)
}
不特意开启多进程支持的正常情况下
首先测试一下正常情况下,没有特意开启多进程支持情况下,4 个斐波那契数列的计算时间。
const seqArr = [44, 42, 43, 44]
function fibonacci (n) {
return n === 0
? 0
: n === 1
? 1
: fibonacci(n - 1) + fibonacci(n - 2)
}
function calculate (seq, taskId) {
return new Promise((resolve, reject) => {
console.log(`Task ${taskId} starts calculating.`)
const start = Date.now()
const result = fibonacci(seq)
console.log(`The result of task ${taskId} is ${result}, taking ${Date.now() - start} ms.`)
return resolve(result)
})
}
;(async function main () {
console.time('main')
const results = await Promise.all(seqArr.map(calculate))
results.forEach((result, index) => console.log(`Task ${index}'s result is ${result}`))
console.timeEnd('main')
})()
将每个计算的过程都封装成一个 Promise 实例,然后使用 Promise.all()
方法希望 4 个斐波那契数列计算能够并发执行。
测试结果为:
Task 0 starts calculating.
The result of task 0 is 701408733, taking 9411 ms.
Task 1 starts calculating.
The result of task 1 is 267914296, taking 3544 ms.
Task 2 starts calculating.
The result of task 2 is 433494437, taking 5784 ms.
Task 3 starts calculating.
The result of task 3 is 701408733, taking 9316 ms.
Task 0's result is 701408733
Task 1's result is 267914296
Task 2's result is 433494437
Task 3's result is 701408733
main: 28058.304ms
根据结果来看,很明显是顺序执行的,当然最终的计算时间也几乎等于四组斐波那契数列的计算时间的和。
Node.js 原生的 cluster
然后再来测试一下使用了 Node.js 原生 cluster 的执行效果。
const cluster = require('cluster')
const numCPUs = require('os').cpus().length
function fibonacci (n) {
return n === 0
? 0
: n === 1
? 1
: fibonacci(n - 1) + fibonacci(n - 2)
}
if (cluster.isMaster) {
const seqArr = [44, 42, 43, 44]
let endTaskNum = 0
console.time('main')
console.log(`[Master]# Master starts running. pid: ${process.pid}`)
for (let i = 0; i < numCPUs; i++) {
const worker = cluster.fork()
worker.send(seqArr[i])
}
cluster.on('message', (worker, message, handle) => {
console.log(`[Master]# Worker ${worker.id}: ${message}`)
endTaskNum++
if (endTaskNum === 4) {
console.timeEnd('main')
cluster.disconnect()
}
})
cluster.on('exit', (worker, code, signal) => console.log(`[Master]# Worker ${worker.id} died.`))
} else {
process.on('message', seq => {
console.log(`[Worker]# starts calculating...`)
const start = Date.now()
const result = fibonacci(seq)
console.log(`[Worker]# The result of task ${process.pid} is ${result}, taking ${Date.now() - start} ms.`)
process.send('My task has ended.')
})
}
[Master]# Master starts running. pid: 1417
[Worker]# starts calculating...
[Worker]# starts calculating...
[Worker]# starts calculating...
[Worker]# starts calculating...
[Worker]# The result of task 1419 is 267914296, taking 6966 ms.
[Master]# Worker 2: My task has ended.
[Worker]# The result of task 1420 is 433494437, taking 11015 ms.
[Master]# Worker 3: My task has ended.
[Worker]# The result of task 1418 is 701408733, taking 14559 ms.
[Master]# Worker 1: My task has ended.
[Worker]# The result of task 1421 is 701408733, taking 14691 ms.
[Master]# Worker 4: My task has ended.
main: 14868.557ms
[Master]# Worker 2 died.
[Master]# Worker 3 died.
[Master]# Worker 4 died.
[Master]# Worker 1 died.
从结果可以看出,四组数列同时开始计算,而整个计算时间,也基本等同于最长的一个数列的计算时间。这说明我们已经开了 4 个进程充分利用了四核 CPU 来同时进行计算。
开启多进程后的潜在问题
- 因为每个进程的内存都是独立的,为了在多进程中共享数据,原来可能存储在内存中的数据,例如 token 等不能再存储在内存中,应该存储在 redis 等缓存中,以便保证不同的进程都可以访问该数据;
参考资料
- Node.js - about;
- Node.js - cluster;
- Node.js 多进程实战;
- 淘宝前端 - cluster 原理;