浅谈NodeJS多进程服务架构基本原理

浅谈NodeJS多进程服务架构基本原理
阅读目录
回到顶部

一：nodejs进程进化及多进程架构原理

NodeJS是基于chrome浏览器的V8引擎构建的，它是单线程单进程模式，nodeJS的单线程指js的引擎只有一个实列。且是在主线程执行的，这样的
优点是：可以减少线程间切换的开销。并且不用考虑锁和线程池的问题。

那么nodejs是单线程吗？如果严格的来讲，node存在着多种线程。比如包括：js引擎执行的线程、定时器线程、异步http线程等等这样的。

nodejs是在主线程执行的，其他的异步IO和事件驱动相关的线程是通过libuv来实现内部的线程池和线程调度的。libuv存在着一个Event Loop,通过 Event Loop（事件循环）来切换实现类似多线程的效果。Event Loop 是维持一个执行栈和一个事件队列，在执行栈中，如果有异步IO及定时器等函数的话，就把这些异步回调函数放入到事件队列中。等执行栈执行完成后，会从事件队列中，按照一定的顺序执行事件队列中的异步回调函数。
nodeJS中的单线程是指js引擎只在唯一的主线程上运行的。其他的异步操作是有独立的线程去执行。通过libuv的Event Loop实现了类似多线程的上下文切换以及线程池的调度。线程是最小的进程，因此node也是单进程的。

理解服务器进程进化

1. 同步单进程服务器

该服务器是最早出现的，执行模型是同步的。它的服务模式是一次只能处理一个请求。其他的请求需要按照顺序依次等待处理执行。也就是说如果当前的请求正在处理的话，那么其他的请求都处于阻塞等待的状态。因此这样的服务器处理速度是不好的。

2. 同步多进程服务器

为了解决上面同步单进程服务器无法处理并发的问题，我们就出来一个同步多进程服务器，它的功能是一个请求需要一个进程来服务，也就是说如果有100个请求就需要100个进程来进行服务。那么这样就会有很大进程的开销问题了。并且相同的状态在内存中会有多种，这样就会造成资源浪费。

3. 同步多进程多线程服务器

为了解决上面多进程中资源浪费的问题，我们就引入了多进程多线程服务器模式，从我们之前一个进程处理一个请求，现在我们改成为一个线程来处理一个请求，线程相对于进程来说开销会少很多，并且线程之间还可以共享数据。并且我们还可以使用线程池来减少创建和销毁线程的开销。
但是多线程也有缺点，比如多个请求需要使用多个线程来服务，但是每个线程需要一定的内存来存放自己的堆和栈的。这样就会导致占用太多的内存。第二就是：CPU核心只能处理一件事情，系统是通过将CPU切分为时间片的方法来让线程可以均匀地使用CPU的资源的。在系统切换线程的过程中也会进行线程上下文切换，当线程数量过多时进行上下文切换会非常耗费时间的。因此在很大的并发量下，多线程还是无法做到很好的伸缩性。Apache服务器就是这样架构的。

4. 单进程单线程基于事件驱动的服务器

为了解决上面的问题，我们出现了单进程单线程基于事件驱动的模式出现了，使用单线程的优点是：避免内存开销和上下文切换的开销。
所有的请求都在单线程上执行的，其他的异步IO和事件驱动相关的线程是通过libuv中的事件循环来实现内部的线程池和线程调度的。可伸缩性比之前的都好，但是影响事件驱动服务模型性能的只有CPU的计算能力，但是只能使用单核的CPU来处理事件驱动，但是我们的计算机目前都是多核的，我们要如何使用多核CPU呢？如果我们使用多核CPU的话，那么CPU的计算能力就会得到一个很大的提升。

5. NodeJS的实现多进程架构

如上第四点，面对单线程单进程对多核使用率不好的问题，因此我们使用多进程，每个进程使用一个cpu，因此我们就可以实现多核cpu的利用。
Node提供了child_process模块和cluster模块来实现多进程以及进程的管理。也就是我们常说的 Master-Worker模式。也就是说进程分为Master(主)进程和 worker（工作）进程。master进程负责调度或管理worker进程，那么worker进程负责具体的业务处理。在服务器层面来讲，worker可以是一个服务进程，负责出来自于客户端的请求，多个worker就相当于多个服务器，因此就构成了一个服务器群。master进程则负责创建worker，接收客户端的请求，然后分配到各个服务器上去处理，并且监控worker进程的运行状态及进行管理操作。

如下图所示：

回到顶部

二：node中child_process模块实现多进程
nodejs 是单进程的，因此无法使用多核cpu，node提供了child_process模块来实现子进程。从而会实现一个广义上的多进程模式，通过child_process模块，可以实现一个主进程，多个子进程模式，主进程叫做master进程，子进程叫做worker(工作)进程，在子进程中不仅可以调用其他node程序，我们还可以调用非node程序及shell命令等。执行完子进程后，我们可以以流或回调形式返回给主进程。

child_process提供了4个方法，用于创建子进程，这四个方法分别为 spawn, execFile, exec 和 fork. 所有的方法都是异步的。

该如上4个方法的区别是什么？

spawn: 子进程中执行的是非node程序，提供一组参数后，执行的结果以流的形式返回。
execFile: 子进程中执行的是非node程序, 提供一组参数后，执行的结果以回调的形式返回。
exec: 子进程执行的是非node程序，提供一串shell命令，执行结果后以回调的形式返回，它与 execFile不同的是，exec可以直接执行一串
shell命令。

fork: 子进程执行的是node程序，提供一组参数后，执行的结果以流的形式返回，它与spawn不同的是，fork生成的子进程只能执行node应用。

2.1 execFile 和 exec

该两个方法的相同点和不同点如下：

相同点：执行的都是非node应用，且执行的结果以回调函数的形式返回。
不同点：execFile执行的是一个应用，exec执行的是一段shell命令。

比如来说：echo是Unix系统的一个自带命令，我们可以直接在命令行中执行如下命令：

echo hello world

如下所示：

如上可以看到，我们在命令行中会打印 hello world. 因此这个我们可以使用 exec 来实现。

1）通过exec来实现：

exec执行shell命令代码如下：

const cp = require('child_process'); console.log(cp); cp.exec('echo hello world', function(err, res) { console.log(res); });

执行如下图所示：

如上我们可以看到，我们的 child_process模块有如下属性：

{ ChildProcess: [Function: ChildProcess], fork: [Function: fork], _forkChild: [Function: _forkChild], exec: [Function: exec], execFile: [Function: execFile], spawn: [Function: spawn], spawnSync: [Function: spawnSync], execFileSync: [Function: execFileSync], execSync: [Function: execSync] }

执行如上exec命令后，结果输出为 hello world.

2) 通过execFile实现

const cp = require('child_process'); cp.execFile('echo', ['hello', 'world'], function(err, res) { console.log(res); });

如上结果也是为 "hello world".

2.2 spawn

spawn是用于执行非node应用的，并且是不能直接执行shell。spawn执行的结果是以流的形式输出的，通过流的方式可以节约内存的。

2.3 fork

在node中提供了fork方法，通过使用fork方法在单独的进程中执行node程序，通过使用fork新建worker进程，上下文都复制主进程。并且通过父子之间的通信，子进程接收父进程的信息，并执行子进程后结果信息返回给父进程。降低了大数据运行的压力。

现在我们来理解下使用fork()方法来创建子进程，fork()方法只需要指定要执行的javascript文件模块，即可创建Node的子进程。下面我们是简单的hello world的demo，master进程根据cpu的数量来创建出相应数量的worker进程，worker进程利用进程ID来标记。

|------ 项目 | |--- master.js | |--- worker.js | |--- package.json | |--- node_modules

如上是我们的简单项目结构，其中 worker.js 代码如下：

console.log('Worker-' + process.pid + ': Hello world.');

master.js 代码如下：

const childProcess = require('child_process'); const cpuNum = require('os').cpus().length; for (let i = 0; i < cpuNum; ++i) { childProcess.fork('./worker.js'); } console.log('Master: xxxx');

然后我们进入项目中的根目录，执行 node master.js 命令即可看到打印信息如下：

如上图可以看到，我们的master创建了4个worker进程后输出 hello world信息。如上就是根据cpu的数量创建了4个工作进程。
回到顶部

三：父子进程间如何通信？
如上创建了4个worker进程后，现在我们需要考虑的是如何实现 master进程与worker进程通信的问题。

在NodeJS中父子进程之间通信可以通过 on('message') 和 send()方法来实现通信，on('message') 是监听message事件的。
当该进程收到其他进程发送的消息时候，便会触发message事件。send()方法则是用于向其他进程发送消息的。

具体如何做呢？

master进程中可以调用 child_process的fork()方法后会得到一个子进程的实列，通过该实列我们可以监听到来自子进程的消息或向子进程发送消息。而worker进程则通过process对象接口来监听父进程的消息或向父进程发送消息。现在我们把master.js 代码改成如下：

const childProcess = require('child_process'); const worker = childProcess.fork('./worker.js'); // 主进程向子进程发送消息 worker.send('Hello World'); // 监听子进程发送过来的消息 worker.on('message', (msg) => { console.log('Received message from worker:' + msg); });

worker.js 代码如下：

// 接收主进程发来的消息 process.on('message', (msg) => { console.log('Received message from master:' + msg); // 子进程向主进程发送消息 process.send('Hi master.'); });

我们继续在命令中执行 node master.js 命令后，看到如下信息被打印了

3.2 Master实现对Worker的请求进行分发

如上只是简单的父进程和子进程进行通信的demo实列，现在我们继续来看一个更复杂一点的demo。我们知道master进程最主要是创建子进程，及对子进程进行管理和分配，而子进程最主要做的事情是处理具体的请求及业务。

进程通信除了使用到上面的send()方法，发送一些普通对象以外，我们还可以发送句柄，什么是句柄呢，句柄是一种引用，可以用来标识资源。
比如通过句柄可以标识一个socket对象等。我们可以利用该句柄实现请求的分发。

现在我们通过master进程来创建一个TCP服务器来监听一些特定的端口，master进程会收到客户端的请求，我们会得到一个socket对象，通过这个socket对象就可以和客户端进行通信，从而我们可以处理客户端的请求。

比如如下demo实列，master创建TCP服务器并且监听8989端口，收到该请求后会将请求分发给worker处理，worker收到master发来的socket以后，通过socket对客户端的响应。

|------ 项目 | |--- master.js | |--- worker.js | |--- tcp_client.js | |--- package.json | |--- node_modules

master.js 代码如下：

const childProcess = require('child_process'); const net = require('net'); // 获取cpu的数量 const cpuNum = require('os').cpus().length; let workers = []; let cur = 0; for (let i = 0; i < cpuNum; ++i) { workers.push(childProcess.fork('./worker.js')); console.log('worker process-' + workers[i].pid); } // 创建TCP服务器 const tcpServer = net.createServer(); /* 服务器收到请求后分发给工作进程去处理 */ tcpServer.on('connection', (socket) => { workers[cur].send('socket', socket); cur = Number.parseInt((cur + 1) % cpuNum); }); tcpServer.listen(8989, () => { console.log('Tcp Server: 127.0.0.8989'); });

worker.js 代码如下：

// 接收主进程发来的消息 process.on('message', (msg, socket) => { if (msg === 'socket' && socket) { // 利用setTimeout 模拟异步请求 setTimeout(() => { socket.end('Request handled by worker-' + process.pid); },100); } });

tcp.client.js 代码如下：

const net = require('net'); const maxConnectCount = 10; for (let i = 0; i < maxConnectCount; ++i) { net.createConnection({ port: 8989, host: '127.0.0.1' }).on('data', (d) => { console.log(d.toString()); }) }

如上代码，tcp_client.js 负责创建10个本地请求，master.js 首先根据cpu的数量，创建多个worker进程，然后创建一个tcp服务器，使用connection来监听net中 createConnection 方法创建事件，当有事件来的时候，就使用worker子进程依次进行分发事件，最后我们通过worker.js 来使用 process中message事件对事件进行监听。如果收到消息的话，就打印消息出来，比如如下代码：

// 接收主进程发来的消息 process.on('message', (msg, socket) => { if (msg === 'socket' && socket) { // 利用setTimeout 模拟异步请求 setTimeout(() => { socket.end('Request handled by worker-' + process.pid); },100); } });

为了查看效果，我们可以在项目的根目录下运行命令 node master.js 启动服务器，然后我们打开另一个命令行，执行 node tcp_client.js 启动客户端，然后我们会看到我们的10个请求被分发到不同的服务器上进行处理，如下所示：

3.3 Worker监听同一个端口

我们之前已经实现了句柄可以发送普通对象及socket对象外，我们还可以通过句柄的方式发送一个server对象。我们在master进程中创建一个TCP服务器，将服务器对象直接发送给worker进程，让worker进程去监听端口并处理请求。因此master进程和worker进程就会监听了相同的端口了。当我们的客户端发送请求时候，我们的master进程和worker进程都可以监听到，我们知道我们的master进程它是不会处理具体的业务的。
因此需要使用worker进程去处理具体的事情了。因此请求都会被worker进程处理了。

那么在这种模式下，主进程和worker进程都可以监听到相同的端口，当网络请求到来的时候，会进行抢占式调度，只有一个worker进程会抢到链接然后进行服务，由于是抢占式调度，可以理解为谁先来谁先处理的模式，因此就不能保证每个worker进程都能负载均衡的问题。下面是一个demo如下：

master.js 代码如下：

const childProcess = require('child_process'); const net = require('net'); // 获取cpu的数量 const cpuNum = require('os').cpus().length; let workers = []; let cur = 0; for (let i = 0; i < cpuNum; ++i) { workers.push(childProcess.fork('./worker.js')); console.log('worker process-' + workers[i].pid); } // 创建TCP服务器 const tcpServer = net.createServer(); tcpServer.listen(8989, () => { console.log('Tcp Server: 127.0.0.8989'); // 监听端口后将服务器句柄发送给worker进程 for (let i = 0; i < cpuNum; ++i) { workers[i].send('tcpServer', tcpServer); } // 关闭master线程的端口监听 tcpServer.close(); });

worker.js 代码如下：

// 接收主进程发来的消息 process.on('message', (msg, tcpServer) => { if (msg === 'tcpServer' && tcpServer) { tcpServer.on('connection', (socket) => { setTimeout(() => { socket.end('Request handled by worker-' + process.pid); }, 100); }) } });

tcp_client.js 代码如下：

const net = require('net'); const maxConnectCount = 10; for (let i = 0; i < maxConnectCount; ++i) { net.createConnection({ port: 8989, host: '127.0.0.1' }).on('data', (d) => { console.log(d.toString()); }) }

如上代码，我们运行 node master.js 代码后，运行结果如下所示：

然后我们进行运行 node tcp_client.js 命令后，运行结果如下所示：

如上我们可以看到进程id为 37660 调度的比较多。

3.4 实现进程重启

worker进程可能会因为其他的原因导致异常而退出，为了提高集群的稳定性，我们的master进程需要监听每个worker进程的存活状态，当我们的任何一个worker进程退出之后，master进程能监听到并且能够重启新的子进程。在我们的Node中，子进程退出时候，我们可以在父进程中使用exit事件就能监听到。如果触发了该事件，就可以断定为子进程已经退出了，因此我们就可以在该事件内部做出对应的处理，比如说重启子进程等操作。

下面是我们上面监听同一个端口模式下的代码demo，但是我们增加了进程重启的功能。进程重启时，我们的master进程需要重新传递tcpServer对象给新的worker进程。但是master进程是不能被关闭的。否则的话，句柄将为空，无法正常传递。

master.js 代码如下：

const childProcess = require('child_process'); const net = require('net'); // 获取cpu的数量 const cpuNum = require('os').cpus().length; let workers = []; let cur = 0; for (let i = 0; i < cpuNum; ++i) { workers.push(childProcess.fork('./worker.js')); console.log('worker process-' + workers[i].pid); } // 创建TCP服务器 const tcpServer = net.createServer(); /* 服务器收到请求后分发给工作进程去处理 */ tcpServer.on('connection', (socket) => { workers[cur].send('socket', socket); cur = Number.parseInt((cur + 1) % cpuNum); }); tcpServer.listen(8989, () => { console.log('Tcp Server: 127.0.0.8989'); // 监听端口后将服务器句柄发送给worker进程 for (let i = 0; i < cpuNum; ++i) { workers[i].send('tcpServer', tcpServer); // 监听工作进程退出事件 workers[i].on('exit', ((i) => { return () => { console.log('worker-' + workers[i].pid + ' exited'); workers[i] = childProcess.fork('./worker.js'); console.log('Create worker-' + workers[i].pid); workers[i].send('tcpServer', tcpServer); } })(i)); } // 不能关闭master线程的，否则的话，句柄将为空，无法正常传递。 // tcpServer.close(); });

worker.js 代码如下：

// 接收主进程发来的消息 process.on('message', (msg, tcpServer) => { if (msg === 'tcpServer' && tcpServer) { tcpServer.on('connection', (socket) => { setTimeout(() => { socket.end('Request handled by worker-' + process.pid); }, 100); }) } });

tcp_client.js 代码如下：

const net = require('net'); const maxConnectCount = 10; for (let i = 0; i < maxConnectCount; ++i) { net.createConnection({ port: 8989, host: '127.0.0.1' }).on('data', (d) => { console.log(d.toString()); }) }

当我们在命令中运行 node master.js 和 node tcp_client.js 执行后，如下图所示：

然后我们进入我们的电脑后台(我这边是mac电脑)，进入活动监视器页面，结束某一个进程，如下图所示：

结束完成后，我们再来看下我们的 node master.js 命令可以看到，先打印某某工作进程被退出了，然后某某工作进程被创建了，如下图所示
：

然后我们再到我们的活动监视器可以看到新的进程号被加进来了，如下图所示：
回到顶部

四：理解cluster集群
如上我们了解了使用 child_process实现node集群操作，现在我们来学习使用cluster模块实现多进程服务充分利用我们的cpu资源以外，还能够帮我们更好地进行进程管理。我们使用cluster模块来实现我们上面同样的功能，代码如下：

master.js 代码如下：

const cluster = require('cluster'); if (cluster.isMaster) { const cpuNum = require('os').cpus().length; for (let i = 0; i < cpuNum; ++i) { cluster.fork(); } // 创建进程完成后输出信息 cluster.on('online', (worker) => { console.log('Create worker-' + worker.process.pid); }); // 监听子进程退出后重启事件 cluster.on('exit', (worker, code, signal) => { console.log('[Master] worker ' + worker.process.pid + ' died with code:' + code + ', and' + signal); cluster.fork(); // 重启子进程 }); } else { const net = require('net'); net.createServer().on('connection', (socket) => { setTimeout(() => { socket.end('Request handled by worker-' + process.pid); }, 10) }).listen(8989) }

如上代码，我们可以使用 cluster.isMaster 来判断是主进程还是子进程，如果是主进程的话，我们使用cluster创建了和cpu数量相同的worker进程，并且通过监听 cluster中的online事件来判断worker是否创建成功。并且使用了 cluster监听了 exit事件，当worker进程退出后，会触发master进程中cluster的online事件来判断worker是否创建成功。如下图我们在命令行中运行命令：

如下所示：

我们现在同样的道理，我们去活动监视器去吧 47575这个端口号结束掉。在看看我们的命令行如下所示：

从上图我们也可以看到 47575 进程结束掉，并且47898进程重启了。如上代码使用 cluster模块实现了child_process集群的操作。

有关更多的cluster中的API可以看这篇文章(http://wiki.jikexueyuan.com/project/nodejs/cluster.html)

我们在下一篇文章会深入学习使用cluster的应用场景demo。基本原理先到这里。

注：我也是在看资料学习的。
相关阅读:
Office Live for Small Business开启您创业的大门
 把时间管理培养成习惯
 面向对象主要概念
 《程序员羊皮卷》中的职场江湖
 时间管理——如何应对外界的干扰
 时间管理——珍惜时间碎片
 对于Office Live平台的思考
 Office Live第一步搭建网络工作环境
 时间管理——专注与放下
 时间管理——寻找精力与效率的平衡点
原文地址：https://www.cnblogs.com/tugenhua0707/p/11141076.html