Elastic：在 Grok 中运用 custom pattern 来定义 pattern

摘要：

它由空格字符串分隔。如果没有正确的Grok模式来帮助我们提取，那么很难提取完整的日期。我们可以单击上面的客户模式并输入以下句子：EVENTDATE%｛YEAR｝%｛MONTHNUM｝%｝MONTHDAY｝%{TIME｝。在上面，我们将EVENDATE定义为YEAR、MONTHNUM、MONTHDAY和TIME的组合。那么我们应该如何处理上面的自定义模式呢？我们可以创建以下命令：POST/_摄取/管道/_模拟｛“管道”：｛“处理器”：〔｛”grok“：｛”field“：”message“，”patterns“：〔”%｛IP:IP｝%｛EVENTDATE:@timestamp｝%{WORD:server｝进程%｛NUMBER:Process_id｝%｝WORD:action｝“〕，”pattern _definitions“：”｛“EVENTDATE”：“%｛YEAR｝%”｛MONTNUM｝%%｛MONTHDAY｝%“｝”｝”，“Docs”：[｛”_source“：｛”message“：”157.97.192.702019092900:39:02.912 myserverProcess107673Initializing“｝｝]｝运行上述命令：｛“Docs”：〔｛”doc“：”_index“：”index“，”type“：”_doc“，”id“：”_id“，“_source”：｛服务器“：”myserver“，”process_id“：“107673”，”@timestamp“：”2019092900:39:02-912“，，”ip“：”15.7.97.192.70“，”action“：”正在初始化“，”消息“：“157.97.192.702019092900:39:02.912myserverProcess107673Initializing”｝，“_ingest”：｛“timestamp”：“2020-06-15T08:33:01.28191Z”｝｝｝]｝这表明我们的日志已正确解析和结构化。另一种方法是使用setprocessor通过使用上述日期相关字段来形成我们需要的@timestamp字段。

我们先来看一下如下的一个日志：

157.97.192.70 2019 09 29 00:39:02.912 myserver Process 107673 Initializing

在上面的日志中，我们可以看到一个日期信息：2019 09 29 00:39:02.912。它是被空格字符串所分开，如果没有正确的 Grok pattern 来帮我们提取的话，我们将会很难提取到一个完整的日期。我们的日志信息符合如下的一个数据结构：

ip timestamp server Process process_id action

首先，我们打开 Kibana:

Elastic：在 Grok 中运用 custom pattern 来定义 pattern第1张

Elastic：在 Grok 中运用 custom pattern 来定义 pattern第2张

我们可以先提取 IP:

Elastic：在 Grok 中运用 custom pattern 来定义 pattern第3张

之后的，就是年，月，日，及时间。我们可以通过如下的方式来进行提取：

运用 YEAY 来提取年份
运用 MONTHNUM 来提取月份
运用 MONTHDAY 来提取日期
运用 TIME 来提取时间
运用 WORD 来提取一个单词
运用 NUMBER 来提取一个数值
对于 Process 来说，我们就不提取了，忽略它

这样，我们可以使用如下的 Grok pattern:

%{IP:ip} %{YEAR:year} %{MONTHNUM:month} %{MONTHDAY:day} %{TIME:time} %{WORD:server} Process %{NUMBER:process_id} %{WORD:action}

Elastic：在 Grok 中运用 custom pattern 来定义 pattern第4张

显然，它正确地解析了我们的日志，但是美中不足的是我们最终需要的是一个真正的日期，而不是用 year, month, day, time 来表示的一个时间。我们可以点击上面的 custerm pattern，并输入一下的句子：

EVENTDATE %{YEAR} %{MONTHNUM} %{MONTHDAY} %{TIME}

Elastic：在 Grok 中运用 custom pattern 来定义 pattern第5张

在上面，我们定义了 EVENDATE 为 YEAR， MONTHNUM, MONTHDAY 及 TIME 的组合。那么我们该如和应用上面的 custom patttern呢？

我们必须修改上面的 Grok pattern 为：

%{IP:ip} %{EVENTDATE:@timestamp} %{WORD:server} Process %{NUMBER:process_id} %{WORD:action}

Elastic：在 Grok 中运用 custom pattern 来定义 pattern第6张

从上面，我们可以看出来，我们的 EVENTDATE 起作用了。它正确地解析了我们的时间。

那么在我们实际的使用中，我们该如何地应用呢？

我们可以创建如下的一个命令：

POST /_ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "grok": {
          "field": "message",
          "patterns": [
            "%{IP:ip} %{EVENTDATE:@timestamp} %{WORD:server} Process %{NUMBER:process_id} %{WORD:action}"
          ],
          "pattern_definitions": {
            "EVENTDATE": "%{YEAR} %{MONTHNUM} %{MONTHDAY} %{TIME}"
          }
        }
      }
    ]
  },
  "docs": [
    {
      "_source": {
        "message": "157.97.192.70 2019 09 29 00:39:02.912 myserver Process 107673 Initializing"
      }
    }
  ]
}

运行上面的命令：

{
  "docs" : [
    {
      "doc" : {
        "_index" : "_index",
        "_type" : "_doc",
        "_id" : "_id",
        "_source" : {
          "server" : "myserver",
          "process_id" : "107673",
          "@timestamp" : "2019 09 29 00:39:02.912",
          "ip" : "157.97.192.70",
          "action" : "Initializing",
          "message" : "157.97.192.70 2019 09 29 00:39:02.912 myserver Process 107673 Initializing"
        },
        "_ingest" : {
          "timestamp" : "2020-06-15T08:33:01.28191Z"
        }
      }
    }
  ]
}

上面显示我们的日志被正确地解析并结构化。

另外一种方法是通过 set processor 来把上面的日期相关的字段来组成我们需要的 @timestamp 字段。

POST /_ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "grok": {
          "field": "message",
          "patterns": [
            "%{IP:ip} %{YEAR} %{MONTHNUM} %{MONTHDAY} %{TIME} %{WORD:server} Process %{NUMBER:process_id} %{WORD:action}"
          ]
        }
      },
      {
        "set": {
          "field": "@timestamp",
          "value": "{{year}} {{month}} {{day}} {{time}}"
        }
      }
    ]
  },
  "docs": [
    {
      "_source": {
        "message": "157.97.192.70 2019 09 29 00:39:02.912 myserver Process 107673 Initializing"
      }
    }
  ]
}

在上面，我们通过：

      {
        "set": {
          "field": "@timestamp",
          "value": "{{year}} {{month}} {{day}} {{time}}"
        }
      }

来把 @timestamp 进行定义，它组合了 year, month, day 及 time 的值。

转载自：https://blog.csdn.net/UbuntuTouch/article/details/106764157

Elastic：在 Grok 中运用 custom pattern 来定义 pattern

相关文章

.net微信公众号开发——快速入门【转载】

ORACLE 数据、表误删恢复（转）

数据仓库基础（六）数据的ETL

获取当前时间并格式化输出、时间戳转标准格式

js 时间戳转换为‘yyyy-MM-dd hh:mm’格式(es6语法)

交易所如何对接狗狗币(DOGE)钱包？这点不可忽视

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表