elasticsearch去重计数

摘要:
search_type=count{“aggs”:{“uniq_attr”:{“cardinality”:{“field”:“domain”}}}}备注:如上所述,它是查询索引urlAttributes中域字段上不同值的数量,“uniq_attr”是用户使用的bucket名称。获得的响应如下:{“touch”:28,“timed_out”:false,“_sards”:{”total“:6,“successful”:6,”failed“:0},”hits“:{”total:689562,”max_score“:0,”hit“:[]},“aggregations”:{“uniq_attr”:{”value“:121618}}}。返回的结果表明此字段中出现了121618个不同的域名。

如果需要针对ES索引统计某个字段上出现的不同值的个数时,可以使用cardinality聚合查询完成:

Post /urlAttributes/_search?search_type=count
{
  "aggs": {
    "uniq_attr": {
      "cardinality": {
        "field": "domain"
      }
    }
  }
}

 

注释:如上,是查询索引urlAttributes中domain字段上的不同值个数, "uniq_attr"是用户自己取的bucket名字。

得到的响应如下所示:

{    "took": 28,    "timed_out": false,    "_shards": {       "total": 6,       "successful": 6,       "failed": 0    },    "hits": {       "total": 689562,       "max_score": 0,       "hits": []    },    "aggregations": {       "uniq_attr": {          "value": 121618       }    } }

返回结果表示该字段出现过121618个不同的domain名字。

免责声明:文章转载自《elasticsearch去重计数》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇cron定时任务介绍线程的查看以及利用gdb调试多线程下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

es知识点

版权声明:本文为博主原创文章,未经博主允许不得转载。转载请务必加上原作者:铭毅天下,原文地址:blog.csdn.net/laoyang360 https://blog.csdn.net/wojiushiwo987/article/details/52244917 题记: Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心...

使用SQL语句查询Elasticsearch索引数据

Elasticsearch 的官方查询语言是 Query DSL,存在毕竟有存在的道理,存在即合理。SQL 作为一个数据库查询语言,它语法简洁,书写方便而且大部分服务端程序员都清楚了解和熟知它的写法。但是作为一个 ES 萌新来说,就算他已经是一位编程界的老江湖,但是如果他不熟悉 ES ,那么他如果要使用公司已经搭好的 ES 服务,他必须要先学习 Query...

Java 日志管理最佳实践

转:http://blog.jobbole.com/51155/ 日志记录是应用程序运行中必不可少的一部分。具有良好格式和完备信息的日志记录可以在程序出现问题时帮助开发人员迅速地定位错误的根源。对于开 发人员来说,在程序中使用日志API记录日志并不复杂,不过遵循一些最佳实践可以更好的利用日志。本文介绍了在Java程序中记录日志的最佳实践,同时也 介绍了如...

Elasticsearch: Ngrams, edge ngrams, and shingles

Ngrams和edge ngrams是在Elasticsearch中标记文本的两种更独特的方式。 Ngrams是一种将一个标记分成一个单词的每个部分的多个子字符的方法。 ngram和edge ngram过滤器都允许您指定min_gram以及max_gram设置。 这些设置控制单词被分割成的标记的大小。 这可能令人困惑,让我们看一个例子。 假设你想用ngra...

ElasticSearch 2.4

ES是一个基于Lucene的分布式全文搜索服务器,和SQL Server的全文索引(Fulltext Index)有点类似,都是基于分词和分段的全文搜索引擎,具有分词,同义词,词干查询的功能,但是ES天生具有分布式和实时的属性,本随笔演示在Windows环境中安装ElasticSearch,以及用于管理ElasticSearch的Head插件。 Elas...

springboot在windows集成elk

说明:elk指的是Elasticsearch、Logstash、Kibana的简称 Elasticsearch:是实时全文搜索和分析引擎,提供搜集、分析、存储数据三大功能; Logstash:是一个用来搜集、分析、过滤日志的工具。 Kibana:是一个基于Web的图形界面,用于搜索、分析和可视化存储在 Elasticsearch指标中的日志数据。 elk的...