Elastic:Fluentd 在 Elastic Stack 中的运用
2021年12月6日 | by mebius
在我之前的文章 “Elastic:使用 Fluentd 及 Elastic Stack 进行应用日志采集”,我详细地介绍了如何使用 Elastic Stack 及 Fluentd 来收集一个 nodejs 服务器的日志信息。在今天的文章中,我将详细地介绍如何使用 Docker 来部署 Elastic Stack 及 Fluentd。在我们的设计中,我们把 Fluentd 作为一个日志收集器,并最终把所有的日志写入到 Elasticsearch 中。我们的设计框图如下:
如上图所示,我们将使用 Docker 来部署 Elasticsearch, Kibana 及 Fluentd。它们所使用的端口地址如上所示。运用 Fluentd 的好处是可以让 Fluentd 运行于 cluster 模式下:
在上面的 Fluentd 将作为一个数据收集器,并把数据发送至 Elasticsearch 中。如果其中的一个由于某种原因不能正常工作,那么备份的那个将起作用。在所有的 Fluentd 服务器都不工作的情况下,TD-Agent 还可以帮我们缓存数据,并在 Fluentd 重新正常工作时把数据发送过来。在左边,我们可以使用一个 centos 来部署我们所需要的服务。在本示例中,我们将使用 RSyslog 把日志信息发送至 TD-Agent,进而发送至 Fluentd 服务器。关于如何使用 RSyslog 发送日志到 Logstash,并发送至 Elasticsearch,请阅读我之前的文章 “Beats:使用 Linux 系统上的 Rsyslog 收集日志并导入 Elasticsearch”。
安装
安装 docker containers
我能接下来安装 Elasticsearch,Kibana 及 Fluent。你可以参考我之前的文章 “Elasticsearch:如何在 Docker 容器中安装 Elastic Stack”。我们需要添加 Fluentd 的部分:
docker-compose.yml
version: '2.2'
services:
fluentd:
build: ./fluentd
container_name: fluentd
volumes:
- ./fluentd/conf:/fluentd/etc
ports:
- "24224:24224"
- "24224:24224/udp"
# Elasticsearch requires your vm.max_map_count set to 262144
# Default will be 65530
# sysctl -w vm.max_map_count=262144
# Add this to /etc/sysctl.conf for making it permanent
elasticsearch:
image: docker.elastic.co/elasticsearch/elasticsearch:7.15.2
container_name: elasticsearch
environment:
- node.name=elasticsearch
- discovery.seed_hosts=elasticsearch
- cluster.initial_master_nodes=elasticsearch
- cluster.name=docker-cluster
- bootstrap.memory_lock=true
- "ES_JAVA_OPTS=-Xms512m -Xmx512m"
ulimits:
memlock:
soft: -1
hard: -1
volumes:
- esdata1:/usr/share/elasticsearch/data
ports:
- 9200:9200
kibana:
image: docker.elastic.co/kibana/kibana:7.15.2
container_name: kibana
environment:
ELASTICSEARCH_URL: "http://elasticsearch:9200"
ports:
- 5601:5601
depends_on:
- elasticsearch
volumes:
esdata1:
driver: local
在上面,我们使用最新的 Elastic Stack 7.15.2。针对 Elasticsearch 及 Kibana,我们使用最新的 docker image,而针对 Fluentd,我们使用一个 Dockerfile 来进行编译。tgcode我们在当前的目录下创建一个叫做 fluentd 的子目录,并同时创建如下的两个文件:
Dockerfile
FROM fluent/fluentd
RUN ["gem",tgcode "install", "fluent-plugin-elasticsearch", "--no-rdoc", "--no-ri"]
在上面的文件中,我们需要安装fluent-plugin-elasticsearch 这个插件。这样它才可以和 Elasticsearch 进行交互。
接着在 fluentd 字母下,我们创建另外一个叫做 conf 的子目录。在这个子目录中,我们针对 fluentd 进行配置。在该目录下,我们创建如下的 fluentd.conf 配资文件:
fluent.conf
@type forward
port 24224
# Store Data in Elasticsearch
@type copy
@type elasticsearch
host elasticsearch
port 9200
include_tag_key true
tag_key @log_name
logstash_format true
flush_interval 10s
在上面,我们定义 source 端口为 24224,也即所有发送至端口 24244 的数据都将直接发送到 elasticsearch 这个服务。请注意这里的 elasticsearh 服务名称是在上面的 docker-compose 中所定义的 Elasticsearch 服务名称。因为 fluentd 和 Elasticsearch 及 Kibana 都是在同一个 docker-compose.yml 里所定义的,它们直接直接可以通过服务名称互相访问,否则我们需要定义一个 network 来做连接所有的服务。
我们整个部署的文件结构如下:
$ pwd
/Users/liuxg/data/elk/docker-efk
$ tree -L 3
.
├── docker-ctgcodeompose.yml
├── fluentd
│ ├── Dockerfile
│ └── conf
│ └── fluent.conf
└── misc
└── clients-td-agent.conf
我们在上面的 docker-compose.yml 所处的目录下打入如下的命令:
docker-compose up -d
请注意上面的 -d 选项。它指的是在 detach 模式下运行,也即在后台运行。上面的命令将会自动下载 Elasticsearch 及 Kibana 的镜像并按照。同时它也会编译 fluentd 的 image 来进行按照。等安装完毕后,我们可以通过如下的命令来进行检查:
docker ps
$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
2669d8ec6d71 docker.elastic.co/kibana/kibana:7.15.2 "/bin/tini -- /usr/l…" 47 seconds ago Up 46 seconds 0.0.0.0:5601->5601/tcp kibana
eb6ce5db5083 docker.elastic.co/elasticsearch/elasticsearch:7.15.2 "/bin/tini -- /usr/l…" 47 seconds ago Up 47 seconds 0.0.0.0:9200->9200/tcp, 9300/tcp elasticsearch
e66845d61f75 docker-efk_fluentd "/bin/entrypoint.sh …" 47 seconds ago Up 46 seconds 5140/tcp, 0.0.0.0:24224->24224/tcp, 0.0.0.0:24224->24224/udp fluentd
我们可以通过如下的命令来查看各个服务的日志信息:
docker logs elasticsearch | less
docker logs kibana | less
docker logs fluentd | less
比如,我们可以看到 fluentd 的日志信息:
上面表明我们的配置是成功的。
如果我们进行的顺利,我们可以在电脑上打开浏览器,并打开地址 http://localhost:5601
我们可以看到 Kibana 已经正常运行起来了。
在我的 macOS 机器上,我们可以使用如下的命令来检查所有的相关端口:
$ sudo lsof -iTCP -sTCP:LISTEN -n -P | grep docke
com.docke 16488 liuxg 87u IPv6 0xe44890273fc84edf 0t0 TCP *:9200 (LISTEN)
com.docke 16488 liuxg 89u IPv6 0xe44890273fc8553f 0t0 TCP *:24224 (LISTEN)
com.docke 16488 liuxg 91u IPv6 0xe44890274f6c7edf 0t0 TCP *:5601 (LISTEN)
我们发现 9200,5601 及 24224 端口都被使用。
安装 centos
我们接下来使用 Vagrant 来创建一个 centos 的虚拟机。我们使用如下的 Vagrantfile 文件。关于如何创建 centos,请阅读我的另外一篇文章 “Elastic:在 CentOS 上一步一步安装 Elastic Stack”。 我们首先创建如下的一个 Vagrantfile:
Vagrantfile
# vi: set ft=ruby :
ENV['VAGRANT_NO_PARALLEL'] = 'yes'
Vagrant.configure(2) do |config|
config.vm.define "client" do |client|
client.vm.box = "centos/7"
client.vm.hostname = "client.example.com"
client.vm.network "private_network", ip: "172.42.42.20"
client.vm.provider "virtualbox" do |vb|
vb.customize ["modifyvm", :id, "--natdnshostresolver1", "on"]
vb.customize ["modifyvm", :id, "--natdnsproxy1", "on"]
vb.name = "client"
vb.memory = 1024
vb.cpus = 1
end
config.vm.provision 'shell', inline:
我们的文件结构如下:
$ pwd
/Users/liuxg/data/elk/docker-efk
$ ls
Vagrantfile docker-compose.yml fluentd misc
$ tree -L 3
.
├── Vagrantfile
├── docker-compose.yml
├── fluentd
│ ├── Dockerfile
│ └── conf
│ └── fluent.conf
└── misc
└── clients-td-agent.conf
3 directories, 5 files
$ vagrant up
我们使用 vagrant up 命令来创建一个 centos 7 的虚拟机。我们可以在 Virtualbox 里发现这个运行的虚拟机:
我们接下来使用如下的命令来进行登录:
vagrant ssh
$ vagrant ssh
Last login: Mon Dec 6 06:10:07 2021 from 10.0.2.2
-bash: warning: setlocale: LC_CTYPE: cannot change locale (UTF-8): No such file or directory
[vagrant@localhost ~]$
我们接下来安装 TD-Agent。根据官方文档Install by RPM Package (Red Hat Linux) – Fluentd。我们执行如下的步骤:
sudo curl -L https://toolbelt.treasuredata.com/sh/install-redhat-td-agent4.sh | sh
等我们安装完毕后。我们查看一下 td-agent 的状态:
$ systemctl status td-agent
● td-agent.service - td-agent: Fluentd based data collector for Treasure Data
Loaded: loaded (/usr/lib/systemd/system/td-agent.service; enabled; vendor preset: disabled)
Active: inactive (dead)
Docs: https://docs.treasuredata.com/display/public/PD/About+Treasure+Data%27s+Server-Side+Agent
我们通过如下的命令来启动它:
$ systemctl enable td-agent
==== AUTHENTICATING FOR org.freedesktop.systemd1.manage-unit-files ===
Authentication is required to manage system service or unit files.
Authenticating as: root
Password:
==== AUTHENTICATION COMPLETE ===
==== AUTHENTICATING FOR org.freedesktop.systemd1.reload-daemon ===
Authentication is required to reload the systemd state.
Authenticating as: root
Password:
==== AUTHENTICATION COMPLETE ===
在上面,我们输入密码 admin 来完成安装。这个密码是在我们的 Vagrantfile 里定义的。
在正式开始采集数据之前,我们需要对 td-agent 进行配置。我们在 docker-compose.yml 文件所在的目录里创建一个叫做 misc 的子目录。在这个目录中,我们创建一个叫做 clients-td-agent.conf 的文件:
@type syslog
@id input_syslog
port 42185
tag client.system
@type forward
@id forward_syslog
host
$ pwd
/Users/liuxg/data/elk/docker-efk
$ ls
Vagrantfile docker-compose.yml fluentd misc
$ tree -L 3
.
├── Vagrantfile
├── docker-compose.yml
├── fluentd
│ ├── Dockerfile
│ └── conf
│ └── fluent.conf
└── misc
└── clients-td-agent.conf
在上面,我们定义了源及需要 forward 的 fluentd 的 IP 地址。针对源的配置,我们使用 UDP 协议。所有来自端口 42185 的日志信息都会自动转发到 fluentd 的收集器器中。
我们可以通过如下的命令来找到你当前的 host 的 IP 地址:
$ ifconfig | grep 192
inet 192.168.0.3 netmask 0xffffff00 broadcast 192.168.0.255
针对我的局域网,它的私有地址是以 192 开头的。我们很容易发现它的私有地址是 192.168.0.3。针对我的情况,我可以进行如下的配置:
@type syslog
@id input_syslog
port 42185
tag client.system
@type forward
@id forward_syslog
host 192.168.0.3
我们可以找到 td-agent 的 repo:
[vagrant@localhost ~]$ ls /etc/yum.repos.d/
CentOS-Base.repo CentOS-Media.repo CentOS-fasttrack.repo
CentOS-CR.repo CentOS-Sources.repo CentOS-x86_64-kernel.repo
CentOS-Debuginfo.repo CentOS-Vault.repo td.repo
我们接下来配置 td-agent。编辑如下的文件:
vi /etc/td-agent/td-agent.conf
在默认的文件中,有一些示例展示如何进行配置。我们把上述文件里的所有内容进行删除,然后把之前clients-td-agent.conf 里的内容进行粘贴,并保存。
[vagrant@localhost ~]$ sudo vi /etc/td-agent/td-agent.conf
[vagrant@localhost ~]$ cat vi /etc/td-agent/td-agent.conf
cat: vi: No such file or directory
@type syslog
@id input_syslog
port 42185
tag client.system
@type forward
@id forward_syslog
host 192.168.0.3
我们接下来启动 td-agent:
$ systemctl start td-agent
==== AUTHENTICATING FOR org.freedesktop.systemd1.manage-units ===
Authentication is required to manage system services or units.
Authenticating as: root
Password:
==== AUTHENTICATION COMPLETE ===
我们需要输入 admin 作为密码。我们使用如下的命令来检查服务是否已经成功运行:
[vagrant@localhost ~]$ systemctl status td-agent
● td-agent.service - td-agent: Fluentd based data collector for Treasure Data
Loaded: loaded (/usr/lib/systemd/system/td-agent.service; enabled; vendor preset: disabled)
Active: active (running) since Mon 2021-12-06 06:46:54 UTC; 56s ago
Docs: https://docs.treasuredata.com/display/public/PD/About+Treasure+Data%27s+Server-Side+Agent
Process: 3008 ExecStart=/opt/td-agent/bin/fluentd --log $TD_AGENT_LOG_FILE --daemon /var/run/td-agent/td-agent.pid $TD_AGENT_OPTIONS (code=exited, status=0/SUCCESS)
Main PID: 3014 (fluentd)
CGroup: /system.slice/td-agent.service
├─3014 /opt/td-agent/bin/ruby /opt/td-agent/bin/fluentd --log /var...
└─3017 /opt/td-agent/bin/ruby -Eascii-8bit:ascii-8bit /opt/td-agen..
上面表明 td-agent 已经成功地运行。你可以在如下的地址找到 td-agent 的日志信息:
less /var/log/td-agent/td-agent.log
我们接下来配置 RSyslog,这把所有的日志信息通过 UDP 的形式发送至 td-agent。我们来编辑如下的文件:
sudo vi /etc/rsyslog.conf
我们在该文件的最后添加如下的一行:
*.* @127.0.0.1:42185
保存该配置文件,并重新启动 Rsyslog 服务:
[vagrant@localhost ~]$ systemctl restart rsyslog.service
==== AUTHENTICATING FOR org.freedesktop.systemd1.manage-units ===
Authentication is required to manage system services or units.
Authenticating as: root
Password:
==== AUTHENTICATION COMPLETE ===
我们通过如下的命令来安装 netstat 命令:
yum install -y net-tools
我们可以通过如下的命令来查看 UDP 协议的端口使用情况:
$ netstat -tlup
(No info could be read for "-p": geteuid()=1000 but you should be root.)
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
tcp 0 0 localhost:smtp 0.0.0.0:* LISTEN -
tcp 0 0 0.0.0.0:sunrpc 0.0.0.0:* LISTEN -
tcp 0 0 0.0.0.0:ssh 0.0.0.0:* LISTEN -
tcp6 0 0 localhost:smtp [::]:* LISTEN -
tcp6 0 0 [::]:sunrpc [::]:* LISTEN -
tcp6 0 0 [::]:ssh [::]:* LISTEN -
udp 0 0 0.0.0.0:59457 0.0.0.0:* -
udp 0 0 0.0.0.0:bootpc 0.0.0.0:* -
udp 0 0 0.0.0.0:bootpc 0.0.0.0:* -
udp 0 0 0.0.0.0:sunrpc 0.0.0.0:* -
udp 0 0 0.0.0.0:42185 0.0.0.0:* -
udp 0 0 localhost:323 0.0.0.0:* -
udp 0 0 0.0.0.0:931 0.0.0.0:* -
udp6 0 0 [::]:sunrpc [::]:* -
udp6 0 0 localhost:323 [::]:* -
udp6 0 0 [::]:931 [::]:*
我们可以看到 42185 端口已经被使用。
到目前位置,我们已经安装好了我们所有需要的软件栈,并配置好了它们。我们接下来,使用 Kibana 来查看收到的数据。
使用 Kibana 查看日志
还记得我们在配置 Fluentd 时所使用的配置吗?
@type forward
port 24224
# Store Data in Elasticsearch
@type copy
@type elasticsearch
host elasticsearch
port 9200
include_tag_key true
tag_key @log_name
logstash_format true
flush_interval 10s
如上所示,我们使用的是 logstash_format,也就是说我们的日志的名称是以 logstash 为开头的。
打开 Kibana:
我们可以看到一个以 logstash 为开头的索引。点击上面的 Create index pattern:
这样我们就创建了一个叫做 logstash* 的索引模式。
我们可以在 Discover 中查看这个索引的所有内容:
我们看见日志里含有我们之前设置的 tag: client.system。
我们接下来在 centos 里打入如下的命令:
[vagrant@localhost ~]$ logger -t LIUXG this is so coool
我们使用如下的命令来查看所生产的 syslog:
sudo tail -f /var/log/messages
我们稍等一会儿,然后在 Kibana 的 Discover 中进行查看:
我们看到有两条收集到的日志信息。这个就是我们刚才使用 logger 命令所生产的日志。
文章来源于互联网:Elastic:Fluentd 在 Elastic Stack 中的运用
相关推荐: Observability:使用 Elastic APM 监控 Elastic Enterprise Search 性能
Elastic APM 是一种免费、开放且功能强大的可观察性工具,可为无数生产应用程序(例如吞吐量、错误率、延迟、资源使用情况、事务跟踪)提供应用程序性能情报。 你现在可以启用 Elastic APM 集成以深入了解您的 Elastic Enterprise …