阿里云SLS日志服务之数据导入与加工处理

一、背景

采集vm虚拟机上的Log日志文本,如果需要经过特殊的加工处理,在本文主要讲述如何在SLS把kafka采集上来的数据经导入并加工后存储。

二、数据流转图

阿里云SLS日志服务之数据导入与加工处理_第1张图片

三、数据导入

阿里云SLS日志服务之数据导入与加工处理_第2张图片
阿里云SLS日志服务之数据导入与加工处理_第3张图片

  • 服务地址:填写kafka集群的地址
  • 数据格式:json字符串(这是因为我们每行的数据格式是json格式存储在本地)
    阿里云SLS日志服务之数据导入与加工处理_第4张图片
    其他配置:
    153/154/155三个Kafka集群节点
{"config.vpc.instance_port.v3":"9092","config.vpc.instance_port.v2":"9092","config.vpc.vpc_id.v1":"vpc-bp102du3yi8x2100kdsxp","config.vpc.instance_ip.v3":"10.xx.xx.155","config.vpc.instance_ip.v2":"10.xx.xx.154","config.vpc.instance_ip.v1":"10.xx.xx.153","group.id":"frontlog","config.vpc.vpc_id.v2":"vpc-bp102du3yi8x2100kdsxp","config.vpc.vpc_id.v3":"vpc-bp102du3yi8x2100kdsxp","config.vpc.instance_port.v1":"9092"}

阿里云SLS日志服务之数据导入与加工处理_第5张图片

  • 丰富的报表
    阿里云SLS日志服务之数据导入与加工处理_第6张图片

四、加工处理

阿里云SLS日志服务之数据导入与加工处理_第7张图片
阿里云SLS日志服务之数据导入与加工处理_第8张图片

  • 下面看一看加工的细节:

对原始的value字段进行加工,这里使用的是grok语法。
配置了两个解析,第二个解析是在第一个解析的基础上,进行二次进一步解析。
上一步解析出字段http_user_agent,
第二个解析,把http_user_agent进一步解析出字段appName和appVersion

由此可见,加工还是比较方便且灵活的。

阿里云SLS日志服务之数据导入与加工处理_第9张图片

  • 加工后的存储目标:

如此,kafka采集上来的Log数据,先经过了导入存储到某个索引,后又加工处理存储到另外一个索引。

所以说,一份数据保存了两份,一份是原始数据,另外一份是加工后的数据。

毫无疑问,会加大你的存储成本。
阿里云SLS日志服务之数据导入与加工处理_第10张图片

  • 加工情况的总体预览:

阿里云SLS日志服务之数据导入与加工处理_第11张图片

五、总结

到此,你应该明白,如果不用复杂的加工处理,不建议你使用本文提及的方案。
直接在sls配置Logtail即可。
本方案把采集的步骤拉长不说, 光是存储成本就翻一番。

你可能感兴趣的:(阿里云,kong,nginx,架构,云原生)