date_histogram，es按照时间分组统计

2023年7月24日下午8:15 • 技术杂谈 • 阅读 82

日期直方图聚合(date_histogram)

与histogram相似，es中内部将日期表示为一个long值，所以有时候可以用histogram来达到相同的目的，但往往没有date_histogram那么精确

date_histogram的特点在于可以使用日期/时间表达式指定间隔。

原本的interval在7.2中被弃用，更换为fixed_interval与calendar_interval

相关字段

calendar_interval

只支持单个日历单元，如：支持 1m 不支持 2m 1.5m

minute (1m)
hour(1h)
day(1d)
week(1w)
month(1m)
quarter( 季度 1q)
year(1y)

fixed_interval

固定间隔，SI单位i，永远不会偏离，

seconds (s) ： 30s
hours (h) ： 1.5h
days (d)： 3d

time_zone

es的日期时间是以UTC存储的，默认情况下，所有的桶装和四舍五入也是在 UTC 中完成的。使用 time _ zone 参数指示 bucket 应使用不同的时区。

时区可以指定为 ISO 8601 UTC的偏移量，也可指定为 IANA 时区数据库中指定的时区 ID。如 "time_zone": "+08:00" 或 "time_zone": "Asia/Shanghai"

这里引用一个官方的例子：

PUT my_index/_doc/1?refresh
{
  "date": "2015-10-01T00:30:00Z"
}

PUT my_index/_doc/2?refresh
{
  "date": "2015-10-01T01:30:00Z"
}

不指定时区

GET my_index/_search?size=0
{
  "aggs": {
    "by_day": {
      "date_histogram": {
        "field":     "date",
        "calendar_interval":  "day"
      }
    }
  }
}

响应
{
  ...

  "aggregations": {
    "by_day": {
      "buckets": [
        {
          "key_as_string": "2015-10-01T00:00:00.000Z",
          "key":           1443657600000,
          "doc_count":     2
        }
      ]
    }
  }
}

如果指定的时区为”-01:00″，那么该时区的24点就是UTC23点

GET my_index/_search?size=0
{
  "aggs": {
    "by_day": {
      "date_histogram": {
        "field":     "date",
        "calendar_interval":  "day",
        "time_zone": "-01:00"
      }
    }
  }
}

现在，第一个文档落入2015年9月30日的桶中，而第二个文档落入2015年10月1日的桶中:
{
  ...

  "aggregations": {
    "by_day": {
      "buckets": [
        {
        # key_as_string 值表示指定时区内每天的午夜。
          "key_as_string": "2015-09-30T00:00:00.000-01:00",
          "key": 1443574800000,
          "doc_count": 1
        },
        {
          "key_as_string": "2015-10-01T00:00:00.000-01:00",
          "key": 1443661200000,
          "doc_count": 1
        }
      ]
    }
  }
}

offset

使用偏移量参数根据指定的正偏移量(+)或负偏移量(-)持续时间更改每个 bucket 的开始值

比如一个index中现有两个文档，date属性分别为 2015.10.01 05:30:00和 2015.10.01 06:30:00，使用如下参数，那么这两个文档会落入一桶中，即 2015-10-01 00:00:00的桶中

{
  "aggs": {
    "by_day": {
      "date_histogram": {
        "field":     "date",
        "calendar_interval":  "day"
      }
    }
  }
}

如果这时偏移量设置为+6h：

{
  ...

  "aggregations": {
    "by_day": {
      "buckets": [
        {
          "key_as_string": "2015-09-30T06:00:00.000Z",
          "key": 1443592800000,
          "doc_count": 1
        },
        {
          "key_as_string": "2015-10-01T06:00:00.000Z",
          "key": 1443679200000,
          "doc_count": 1
        }
      ]
    }
  }
}

extended_bounds

强制返回指定范围内的每一个桶，min与max都会被当做桶返回

Original: https://www.cnblogs.com/daydreamer-fs/p/16813648.html
Author: fogey
Title: date_histogram，es按照时间分组统计

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/713490/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Spark搭建

7、测试及使用切换目录： cd /usr/local/soft/spark-2.4.5/examples/jars Spark on Yarn Client模式：日志在本地输出，…

技术杂谈 2023年7月11日
0065
初次使用vscode遇到的坑

vscode使用时导入模块的一些问题在编写完某一个模块的代码时，需要在当前的模块下进行调试运行，发现报”ImportError:cannot import name …

技术杂谈 2023年7月25日
0096
C#中is关键字和as关键字的一些文章（链接）

下面的文章阐述了C#中的 is关键字：下面的文章阐述了C#中的 as关键字：下面的文章对C#中的 is关键字和 as关键字进行了比较： Original: https://ww…

技术杂谈 2023年5月31日
0083
思考：2021年还可以入门深度学习吗？

前言过年时闲来无事，瞎翻自己的博客，偶然看到之前写的一篇文章：一篇文章解决机器学习，深度学习入门疑惑这篇文章原先发布于2018年中旬，那会正是深度学习、神经网络无脑火热的时…

技术杂谈 2023年7月11日
0083
JAVA8-Lambda-FindFirst（获取列表中出现的第一条记录）

寻找列表中的第一个元素描述：代码示例中list列表存在三条记录，findFirst是找出第一个出现的记录信息。 public static void main(String[] …

技术杂谈 2023年7月24日
0074
Web Accessibility All In One

Web Accessibility All In One a11y / Accessibility / 可访问性（无障碍） Accessibility (often abbrevi…

技术杂谈 2023年6月1日
0087
Laravel 生产环境部署，phphub5应用部署记录

假定你能熟练使用 apt install 命令安装软件安装安装 nginx sudo apt install nginx 安装 mysql sudo apt install m…

技术杂谈 2023年5月30日
0083
Redis篇：事务和lua脚本的使用

现在多数秒杀，抽奖，抢红包等大并发高流量的功能一般都是基于 redis 实现，然而在选择 redis 的时候，我们也要了解 redis 如何保证服务正确运行的原理前言 redis…

技术杂谈 2023年7月25日
0079
Git 不识别文件名字母大小写变化

问题今天为一个项目撰写持续构建计划，撰写 Jenkinsfile 之后进行构建时报错： [2022-05-23 16:54:21] unable to prepare conte…

技术杂谈 2023年7月11日
0065
一款非常棒的十六进制编辑器 —— 010 Editor

参考 https://zhuanlan.zhihu.com/p/96001673 插件 ELF.bt 用来分析ELF文件，用起来感觉像wireshark，可以高亮源文件中正常查看的…

技术杂谈 2023年5月31日
00107
HashMap详解

什么是HashMap容器【1】HashMap是使用频率最高的用于映射(键值对)处理的数据类型。随着JDK（Java Developmet Kit）版本的更新，JDK1.8对Has…

技术杂谈 2023年7月24日
0080
永久激活Windows10系统的三种方法（亲测有效）

越来越多人选择升级安装Windows10系统，为了让更好的使用win10系统，一般会选择激活系统之后才能正常使用，不然很多功能就会被限制。那么如何永久激活Windows10系统？就…

技术杂谈 2023年5月31日
00105
Nginx服务的搭建与配置

Nginx服务的搭建与配置一、关闭防火墙并安装epel源 1、关闭selinux ①修改selinux的配置文件 [root@localhost ~]# vim /etc/sel…

技术杂谈 2023年7月11日
0087
NoteOfMySQL-14-日志管理

一、MySQL日志日志是MySQL数据库的重要组成部分，日志文件记录了MySQL数据库的日常操作和错误信息，可以通过分析这些日志文件了解MySQL数据库的运行情况。MySQL数据…

技术杂谈 2023年7月11日
0094
C# File API

【 C# File API】 1、System.IO.File Provides static methods for the creation, copying, deletio…

技术杂谈 2023年5月31日
0091
[CentOS7]安装tomcat并开启自启动

4、启动tomcat /usr/local/tomcat/bin/startup.sh 5、开放默认端口8080 firewall-cmd –zone=public –add-…

技术杂谈 2023年6月1日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31