[实战] 用数人云,部署弹性 ELK 集群就五步

摘要:本篇文章介绍了如何通过数人云部署一套标准的 ELK 日志收集系统。第一步,将主机组织成集群;第二步,发布 ElasticSearch 实例;第三步,发布 Kibana 实例;第四步,发布 Logstash 实例到待收集日志的应用 server ;第五步,快速扩展/减少 ElasticSearch , Kibana 实例数(可选)。

在具体介绍部署步骤前,让我们先来了解下 ELK 是什么。 ELK 是 ElasticSearch+Logstash+Kibana 的缩写, ElasticSearch 是一款基于 Lucene 的分布式搜索引擎,大名鼎鼎的 GitHub 就是由它提供的搜索。 Logstash 是一款分布式日志收集系统,是一个应用程序日志、事件的传输、处理、管理和搜索的平台,可以用来统一对应用程序日志进行收集管理,提供 Web 接口用于查询和统计。 Kibana 是一个基于浏览器页面的 ElasticSearch 前端展示工具,内置了各种查询和聚合操作,并拥有图形化展示功能。

我们知道,日志记录了各种重要信息,如应用程序的 log 记录的 error,warn 级别的 log,在量小的情况下,我们当然可以直接 vi+awk+sed+grep 定位原因,而当数量非常大,且需要各种聚合或基于多个异常关键词的组合搜索时,就是 ELK 大显身手的地方!可以说, ELK 是运维界的明星,非常适合应用级的实时监控和核心服务预警。

下面就让我们来看看如何通过数人云部署一套标准的 ELK 日志收集系统吧。

第一步, 将主机组织成集群

首先,需要访问 数人云 注册并登录系统,然后进入主机的准备工作。假设有7台主机,这些主机可以是连接互联网的私有主机,也可以是阿里云、Ucloud、 AWS、Azure、首都在线、华为云等公有云上购买的任意一台云主机。这7台主机之间需要网络互通并能够访问外网。7台主机的规划及配置信息如下:

[实战] 用数人云,部署弹性 ELK 集群就五步_第1张图片
1.jpg

然后,登录账户,在集群管理中,点击创建群组,填写集群名称( elk ),选择 3 Master 集群,点击完成。 添加主机后,如图点击右上角下拉菜单,选择添加主机。

[实战] 用数人云,部署弹性 ELK 集群就五步_第2张图片
2.jpg

点击已有主机下面的按钮 Ubuntu 或者 CentOS ,填写主机名称,并在主机上根据"连接主机"的提示进行操作。

选择主机组件:前 3 台主机( 10.3.10.9 [1-3] )为 Master 节点, 无可选组件;在添加主机 10.3.10.94 时需要将可选组件中的内部代理勾选上。

[实战] 用数人云,部署弹性 ELK 集群就五步_第3张图片
3.jpg

登录到将要添加的主机终端

`ssh [email protected]      `

安装 Docker (若主机已安装 Docker ,这步可跳过)

`curl -sSL https://get.docker.com/ | sh         `

安装 Agent :点击页面按钮,点击“生成命令”生成安装命令并粘贴到主机终端运行。

`sudo -H OMEGA_ENV=prod bash -c "$(curl -Ls https://raw.githubusercontent.com/Dataman-Cloud/agent-installer/master/install-agent.sh)" -s 92a0c8b287d34445b03f8518ce688e66   `

按提示执行以上两步后,点击"完成"即成功添加主机。

需要注意的是,由于数人云默认将加入集群的前3台机器作为 master 节点,为了符合前期规划,请确保主机10.3.10.91, 10.3.10.92, 10.3.10.93 首先被加入到集群中。同时,向同一集群添加的主机应存在于同一网段内,暂不支持跨公网的主机组建集群。此外,由于数人云在主机连接后会向主机上安装基础服务,所以主机需要一段时间进行初始化,依主机所处的网络环境,主机初始化的时间有所不同。

主机添加完成后,检查主机运行是否正常,如图:

[实战] 用数人云,部署弹性 ELK 集群就五步_第4张图片
4.jpg

第二步,发布 ElasticSearch 实例

我们将通过数人云将 ES 的 Docker 镜像以 HOST 模式部署到我们规划的主机 10.3.10.95 和 10.3.10.96 上。具体操作如下:

选择"应用管理"中的"新建应用",如图:

[实战] 用数人云,部署弹性 ELK 集群就五步_第5张图片
5.jpg

新建 ES 应用:

  • 填写应用名称: es

  • 选择集群:elk

  • 添加应用镜像地址:index.shurenyun.com/dataman/jdk7-elasticsearch-1.4.5

  • 填写镜像版本:2015112811

  • 网络模式:HOST 模式

  • 主机选择:10.3.10.95,10.3.10.96

  • 容器目录:容器内的挂载目录 /data/app/elasticsearch

  • 主机目录:主机上的挂载目录 /data (该目录是我们主机数据盘所在的目录)

  • 选择容器规格: CPU:0.8 内存:4096MB

  • 容器个数:2 并且勾选 1 容器: 1 主机

  • 高级设置:

    • 添加应用地址:

      • 应用端口: 9200

      • 类型: 对内

      • 协议: TCP

      • 地址: 10.3.10.94:9998

    • 环境变量

      • Key: CLUSTERNAME

      • Value: dataman-es

    • 环境变量

      • Key: ZOOKEEPER_ADDRESS

      • Value: 10.3.10.91:2181,10.3.10.92:2181,10.3.10.93:2181

填写完成后,点击创建。 如图:

[实战] 用数人云,部署弹性 ELK 集群就五步_第6张图片
6.png
[实战] 用数人云,部署弹性 ELK 集群就五步_第7张图片
7.png

第一次向集群部署 ES 时由于本地没有 Docker 镜像 index.shurenyun.com/dataman/jdk7-elasticsearch-1.4.5,集群需要大约 1-2 分钟去拉取镜像(可能更长时间)。我们可以在 ES 的应用详情页看到相应的状态,以及事件等。

第三步, 发布 Kibana 实例

点击新建应用,新建 Kibana 应用:

  • 填写应用名称: kibana

  • 选择集群:elk

  • 添加应用镜像地址:index.shurenyun.com/dataman/kibana

  • 填写镜像版本:4.1.4

  • 网络模式:网桥模式

  • 选择主机: ALL

  • 容器规格: CPU:0.2 内存:256 MB

  • 容器个数:1

  • 高级设置:

    • 应用地址:

      • 应用端口: 5601

      • 类型: 对内

      • 协议: HTTP

      • 地址: http://10.3.10.94:5601

    • 环境变量:

      • KEY: ELASTICSEARCH_URL

      • VALUE: http://10.3.10.94:9998

注:Kibana 需要通过环境变量 ELASTICSEARCH_URL 来确定 ElasticSearch 的地址,由于添加主机时我们已经设置内部代理的节点为10.3.10.94,并且在添加 ES 应用时将其端口映射到了内部代理端口 9998 , 所以这里我们只需要设置 ELASTICSEARCH_URL=http://10.3.10.94:9998 即可使得 Kibana 发现 ES 实例。

来到 Kibana 的应用详情页,若应用状态为运行中即应用已正常运行。

[实战] 用数人云,部署弹性 ELK 集群就五步_第8张图片
8.png

打开浏览器,访问地址:http://10.3.10.94:5601(可能需要为你的浏览器设置内网代理),看到如下页面,则说明 kibana 应用已经成功运行。

[实战] 用数人云,部署弹性 ELK 集群就五步_第9张图片
9.png

第四步, 发布 Logstash 实例到待收集日志的应用 server

点击新建应用,新建 Logstash 应用:

  • 填写应用名称: logstash

  • 选择集群:elk

  • 添加应用镜像地址:index.shurenyun.com/dataman/logstash

  • 填写镜像版本:2.1

  • 网络模式:网桥模式

  • 选择主机: 10.3.10.97

注:由于上面我们假设应用运行在了主机 10.3.10.97 上,所以这里我们限制 Logstash 在该主机上收集日志

  • 主机/容器目录

    • 数据挂载目录: /var/log/app

    • 容器目录: /var/log/app

注: 这里我们假设用户的应用(待采集日志的应用)日志存储在了主机目录 /var/log/app 下面。

  • 容器规格: CPU:0.3 内存:256 MB

  • 容器个数:1

  • 高级设置:

CMD:

`logstash -e 'input { file { type => "linux-syslog" path => ["/var/log/app/*.log"]}} output { elasticsearch { hosts => "10.3.10.94:9998" }}'`

同样,等待 1-2 分钟后 Logstash 将被部署到应用 server 上并且开始收集日志, 用户可以通过访问 Kibana 的页面来发掘相应的日志信息。

第五步, 快速扩展/减少 ElasticSearch, Kibana 实例数(可选)

为了提高集群的资源利用率,我们可能需要根据负载来扩展或者减少 ElasticSearch , Kibana 等的实例数,在数人云的应用列表页或者应用详情页, 点击扩展按钮,即可快速调整相应应用的实例数。

通过前面的五步实战,大家都尝试了用数人云去部署 ELK 系统,总结来说,使用数人云去部署 ELK 主要有三大优势:第一,部署方便: 用户的应用无需任何改造,只需要提供日志的存储目录;第二,可扩展: 如果日志存储端( ElasticSearch )需要添加更多的实例, 用户只需要向集群中添加更多的机器, 并在应用列表页点击扩展相应的 ELK 即可;第三,安全: 用户应用的所有日志数据都存储在了集群内网的 ES 服务集群中。

你可能感兴趣的:([实战] 用数人云,部署弹性 ELK 集群就五步)