日志归集:顾名思义,就是把日志归集起来。
在开发 Node 服务的时候,我们经常会打印各种日志,比如 info, error 日志。
如果我们已经将服务已经部署了很多机器上,这个时候如果需要查询昵称为”张三“的日志流水,那就很痛苦了,机器越多越难搞,因为不知道昵称为“张三”的日志流水到底在哪一台,甚至可能还分散在多台服务器。
因此,我们需要做日志归集,这样我们在一台机器上就可以查看所有的日志了。
本文目录:
使用 dgram 实现日志归集
UDP 数据包 和 Unix 数据报
再看 dgram
服务是部署在多台服务器上,每台机器上都会打印日志,最终我们要归集起来到一台机器上展示,那么首先需要把每台服务器上的日志拿到,一般有两种实现方式。
如果整个系统日志输出,我们是使用统一的自定义 logger 组件,比如执行 logger.info(), logger.error() 来输出日志的话。那么我们就很容易收集日志了,直接在 logger 的 info , error, warn 等方法里面收集即可。
比如如下,在 logger 日志对象里面,增加存储到 logList 临时对象里面。
const logList=[];
['info','warn','error'].forEach((type)=>{
this[type] = ()=>{
// do something
logList.push({type:type,data:Array.from(arguments).join(" ")});
}
});
这里我们需要用 logList 数组保存起来,是为了数据能批量发送,在指定的间隔时间(比如 1s),发送一次日志,而不是每执行一次 log,就需要发送一次请求。
有些使用了第三方框架,写日志并不是经过我们自定义的 logger 组件,这个时候,我们可以采取读取文件的方式来收集日志数据。实现如下:
const fsExtra = require('fs-extra');
// 监听文件 path 的变化
fsExtra.watchFile(path, (curr, prev) => {
// 有时候响应不稳定,会触发两次,第二次触发的时候,对象里面的时间戳会相等,所以判断当前时间戳小于等于上一次时间戳可过滤多余的监听。
if (curr.mtime <= prev.mtime) return;
// 为了提高性能,我们采取只读的方式来 open
fsExtra.open(path, 'r', function(error, fd) {
if (error) {
logger.error('open log error', error);
return;
}
// 创建一个缓冲,长度为(当前文件大小-文件上一个状态的大小) 由于这里我们已经明确获取到长度了,所以创建buffer可以使用性能更好的 allocUnsafe
buffer = Buffer.allocUnsafe(curr.size - prev.size);
fsExtra.read(fd, buffer, 0, (curr.size - prev.size), prev.size, function(err, bytesRead, buffer) {
if (err) {
logger.error('read log error', error);
return;
}
const data = buffer.toString();
logList.push({data:data});
});
});
逻辑也比较简单,监听日志文件(如果需要监听文件夹,在可以使用 watch) 。当监听到文件变更的时候,已只读的方式打开文件,然后使用 read 函数读取文件的从起始到结束为止的内容。
UDP 数据包的特点是无连接,结构简单,对系统资源消耗少。缺点是数据不保证正确,且数据包到达先后顺序不保证。
对于我们的日志归集,显然不需要保证正确,且先后顺序影响不大,我们在每一条数据消息里面携带发送消息客户端的时间戳即可。所以我们选择 UDP 数据包。
这里到底使用 udp4 还是 udp6 ,取决于我们服务器,对应我们熟悉的是 IPV4 和 IPV6。这里使用 udp4。
const dgram = require('dgram');
const clientSocket = dgram.createSocket('udp4');
// 原创 udp 日志服务器的 ip 和 port,可能会是配置下发的方式来确定。如果是明确的一台服务器,也可以写死。
let remoteUDPServerIP = 'xxx,xxx,xxx,xxx';
let remoteUDPServerPort = 'xxx';
// 当前 udp 服务的 ip
clientSocket.bind(7777);
setInterval(()=>{
if(logList.length==0) return;
const data = logList.join("\r\n");
logList = [];
clientSocket.send(data, 0, data.length, remoteUDPServerPort, remoteUDPServerIP);
},1000);
开启定时器,扫描存储的日志列表。通常来说,如果我们的日志数据 logList ,是由我们自己定义的 logger 获取的,那么我们需要先用数组存起来,然后定时发送 UDP 数据包到 server 服务器上,达到批量发送的目的,减少发送频率。
但是如果我们是使用读取文件的方式来拿到需要上报的日志的话,我们可以监听到文件变化然后直接上报即可,无需使用定时器发送,因为会在写日志文件的时候,已经做了批量写入了(一般会是 1s 更新一次)。
使用 dgram 创建服务端,然后接受客户端发送的消息,最终写到统一的日志文件里面。
const path = require("path");
const fsExtra = require('fs-extra');
const dgram = require('dgram');
const serverSocket = dgram.createSocket('udp4');
serverSocket.on('message', function(msg, rinfo){
handleMsg(msg,rinfo.address);
});
// 服务端端口
serverSocket.bind(7777);
var fp = "./logs"+path.sep+path.sep+msg.type;
fsExtra.ensureDir(fp);
function handleMsg(msg,address){
try{
msg = typeof msg=="object"?JSON.parse(msg):{msg:msg};
}catch(e){
console.log(e);
}
if(!msg.type) msg.type="info";
// 组装上报参数
let filepath = fp+path.sep+ getDate()+".log";
let content = [];
content.push(getDate(true));
content.push(address);
content.push(typeof msg.msg=="object"?JSON.stringify(msg.msg):msg.msg);
content.push('\r\n');
// 写入日志文件
fs.appendFile(filepath, content.join(" "), err=> {
if(err){
fs.appendFile(".logs/white-error.log", filepath+"\t"+msg, e=>{});
}else{
// report
}
});
}
function getDate(time) {
let date = new Date();
if(time){
let hour = date.getHours();
let minute = date.getMinutes();
let second = date.getSeconds();
let miseconds = date.getMilliseconds();
return [hour, minute, second,miseconds].map(formatNumber).join(':');
}
let year = date.getFullYear();
let month = date.getMonth() + 1;
let day = date.getDate();
let p = [year, month, day].map(formatNumber).join('-');
return p;
}
function formatNumber(n) {
n = n.toString();
return n[1] ? n : '0' + n;
}
这里大伙看下应该能看懂了。创建 7777 端口的服务。然后监听到消息,则立即写入文件。
至此,我们就实现了一个简单的 UDP 数据包的日志归集功能。不管部署多少台服务器。我们只需要在 ./logs/ 目录下就可以查看日志了。执行 tail 命令就可以查看各个服务器归集过来的日志了,当然时间可能会有错乱,但是以每条消息的时间为准即可。
$ tail -f logs/info/2020-04-19.log
UDP,全称 User Datagram Protocol, 即用户数据报协议。UDP 和 TCP 两者的具体差异就不罗列了,有兴趣可以去了解下。主要差异如下:
这里我们主要看和 unix 协议的差异。
Unix domain socket(UDS):是 unix 服务器进程之间本地通信 IPC 的一种。提供了两套协议:字节流套接口(类似 TCP )和数据报套接口(类似 UDP )。
unix 数据报套接口与 UDP 的区别主要在于 UDS 只能做本机 IPC, 而 UDP 可以是本机也可以是远程机器通信。
如果仅仅是本机通信的话,推荐直接使用 UDS。主要优势有以下两个:
UDS 协议的数据报不会出现丢失乱序的情况。
UDS 协议性能更优,不会跑到链路层,不会做数据报校验。
当然如果为了可扩展,后续迁移到不同的机器,也可以使用 UDP 来实现。
UDS 协议可以使用 Node 的 unix-dgram 组件来实现。
由于 UDS 是本机通信,所以不需要端口和 IP, 直接使用文件系统表示的路径名来标识。比如 /path/to/socket 这个系统路径。如果需要创建多个 server, 则指定不同的路径即可。我们来看下具体的使用代码。
服务接收端:
const unix = require('unix-dgram');
const server = unix.createSocket('unix_dgram', function(buf) {
console.log('received ' + buf);
});
server.bind('/path/to/socket');
客户发送端:
const message = Buffer('ping');
const client = unix.createSocket('unix_dgram');
client.send(message, 0, message.length, '/path/to/socket');
也可以自行定义其他 EventsListener,
const unix = require('unix-dgram');
const client = unix.createSocket('unix_dgram');
client.on('error', function(err) {
console.error(err);
});
client.on('connect', function() {
console.log('connected');
client.on('congestion', function() {
/* The server is not accepting data */
});
client.on('writable', function() {
/* The server can accept data */
});
var message = new Buffer('ping');
client.send(message);
});
client.connect('/tmp/server');
使用方式还是比较简单的,相信大伙看看就能懂了。
dgram 是 Nodejs 提供的用于发送 UDP 数据报的模块。
dgram 提供了非常丰富的 api,可以参考文档:http://nodejs.cn/api/dgram.html;
主要功能是可以实现 ”单播”、“广播”和“组播”消息。
单播即单向通信,客户端向服务端发送消息,本文中的日志归集就是单播实现。参考上面实现。
广播顾名思义,就是广撒网,非点对点通信。把数据发送给本地子网上的所有的机器,即广播。要实现广播,首先要获取到广播地址。比如我在终端输入:ifconfig,如下显示的 broadcast 就是广播地址。
拿到了广播地址,则可以在服务端向子网内所有机器发送广播消息了。
const dgram = require("dgram");
const serverUDP = dgram.createSocket("udp4");
serverUDP.on("listening", () => {
console.log("socket正在监听...");
server.setBroadcast(true);
server.setTTL(64);
setTimout(() => {
server.send("大家好啊,我是服务端.", 7778, "192.168.0.255")
}, 1000)
})
serverUDP.on("message", (msg, rinfo) => {
console.log(`msg from client ${rinfo.address}:${rinfo.port}`);
})
server.bind(7777);
这里我创建了一个服务端,监听 7777 端口。向广播地址:192.168.0.255 端口为 7778 的所有客户端发送广播消息,于是属于同一个广播区域段的客户端的 7778 端口都会收到服务端的消息。
默认是单播,需要广播消息,设置 setBroadcast 为 true 即可。
IP_TTL : 表示存活时间,每经过个路由器或者网关都会减少 TTL 数值,如果 TTL 被一个路由器减少到 0,这个数据报将不会继续转发。
组播报文的目的地址使用D类IP地址, D类地址不能出现在IP报文的源IP地址字段。
224.0.0.0~224.0.0.255为预留的组播地址(永久组地址),地址224.0.0.0保留不做分配,其它地址供路由协议使用;224.0.1.0~224.0.1.255是公用组播地址,可以用于Internet;224.0.2.0~238.255.255.255为用户可用的组播地址(临时组地址),全网范围内有效;239.0.0.0~239.255.255.255为本地管理组播地址,仅在特定的本地范围内有效。
下面已 224.1.1.1 组播地址测试。其他代码通广播。
服务端:
const addr = '224.1.1.1';
server.on("listening",()=>{
console.log("socket正在监听中.....");
server.addMembership(addr);
server.setMulticastTTL(64);
setTimout(()=>{
server.send('大家好啊,我是服务端.',7778,addr);
},1000)
})
客户端:
const dgram = require("dgram");
const client = dgram.createSocket("udp4");
const addr = '224.1.1.1';
client.on("listening", () => {
console.log("socket正在监听...");
client.addMembership(addr);
})
client.on("message", (msg, rinfo) => {
console.log(`msg from server:${msg},addr:${rinfo.address}`);
})
client.bind(7778)
到此为止,简易的日志服务系统已经开放完成,在实际中,我们可能不会直接这样使用,一般有两种方式:
使用自研的 node 框架或者统一的日志组件,然后由框架容器或者组件去实现所有的日志收集,上报和展示。
使用统一的日志服务,比如 c++ 开发的日志服务,按照配置和设定的规则,统一收集日志信息,上报和展示。
对于业务开发者来说,可能就只需要在项目里面配置下,就能享受流畅的日志查看了。
然而我们只有在工作中不断跳出仅仅作为使用者的角度,去探索各个系统的实现原理,这样才能游刃有余。
源码 https://github.com/antiter/udp-log
欢迎关注我的微信公众号,一起做靠谱前端!