InfluxDB总结

2023年6月3日上午2:45 • 大数据 • 阅读 74

一、简介

InfluxDB（时序数据库）influxdb是一个开源分布式时序、时间和指标数据库，使用 Go 语言编写，无需外部依赖。其设计目标是实现分布式和水平伸缩扩展，是 InfluxData 的核心产品。常用的一种使用场景：监控数据统计，物联网传感器数据和实

时分析等的后端存储。每毫秒记录一下电脑内存的使用情况，然后就可以根据统计的数据，利用图形化界面（InfluxDB V1一般配合Grafana）制作内存使用情况的折线图；可以理解为按时间记录一些数据（常用的监控数据、埋点统计数据等），然

后制作图表做统计。

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:45bdcafe-e78d-4cfa-8683-e0d6426b1848

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:cde90d2d-d3dd-41ea-a0f4-cd4d5fc5f7b3

* 时序数据库（TSDB）特点：
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:91d6d565-3101-4b5d-80c4-a41e07d6d003

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:aaf7bfb9-c40e-4fb7-a1e1-f8266e93eb14

数据压缩存储；
低查询延时。
* 常见 TSDB：influxdb、opentsdb、timeScaladb、Druid 等。
* influxdb 完整的上下游产业还包括：Chronograf、Telegraf、Kapacitor，其具体作用及关系如下：

influxdb和其他时序数据库比较

二、同常见关系型数据库（MySQL）的基础概念对比

概念MySQLInfluxDB 数据库（同） database database 表（不同） table measurement 列（不同） column tag(带索引的，非必须)、field(不带索引)、timestemp(唯一主键)

tag set：不同的每组tag key和tag value的集合；
field set：每组field key和field value的集合；
retention policy：数据存储策略（默认策略为autogen）InfluxDB没有删除数据操作，规定数据的保留时间达到清除数据的目的；
series：共同retention policy，measurement和tag set的集合；
示例数据如下：其中census是measurement，butterflies和honeybees是field key，location和scientist是tag key

scala;gutter:true; name: census [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:364bc947-770e-409c-b274-0176455fc5ce<details><summary>[En]</summary>[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:10558a80-ba90-4293-b050-f9fe08abb537</details> time butterflies honeybees location scientist 2015-08-18T00:00:00Z 12 23 1 langstroth 2015-08-18T00:00:00Z 1 30 1 perpetua 2015-08-18T00:06:00Z 11 28 1 langstroth 2015-08-18T00:06:00Z 11 28 2 langstroth <pre><code> * point的数据结构由时间戳（time）、标签（tags）、数据（fields）三部分组成，具体含义如下： point 属性含义 time 数据记录的时间，是主索引（自动生成） tags 各种有索引的属性 fields 各种value值（没有索引的属性） * 此外，influxdb还有个特有的概念：series（一般由：retention policy, measurement, tagset就共同组成），其含义如下：所有在数据库中的数据，都需要通过图表来展示，而这个series表示这个表里面的数据，可以在图表上画成几条线：通过tags排列组合算出来。 * 需要注意的是，influxdb不需要像传统数据库一样创建各种表，其表的创建主要是通过第一次数据插入时自动创建，如下： insert mytest, server=serverA count=1,name=5 //自动创建表 "mytest"，"server" 是 tags，"count"、"name" 是 fields * fields 中的 value 基本不用于索引 * tag 只能为字符串类型 * field 类型无限制 * 不支持join * 支持连续查询操作（汇总统计数据）：CONTINUOUS QUERY * 配合Telegraf服务（Telegraf可以监控系统CPU、内存、网络等数据） * 配合Grafana服务（数据展现的图像界面，将influxdb中的数据可视化） **三、常见sql** </code></pre> -- 查看所有的数据库 show databases; -- 使用特定的数据库 use database_name; -- 查看所有的measurement show measurements; -- 查询10条数据 select * from measurement_name limit 10; -- 数据中的时间字段默认显示的是一个纳秒时间戳，改成可读格式 precision rfc3339; -- 之后再查询，时间就是rfc3339标准格式 -- 或可以在连接数据库的时候，直接带该参数 influx -precision rfc3339 -- 查看一个measurement中所有的tag key show tag keys -- 查看一个measurement中所有的field key show field keys -- 查看一个measurement中所有的保存策略(可以有多个，一个标识为default) show retention policies; --distinct的字段仅是field 不能是tag select distinct(count) from test --group by仅是tag 不能是field select * from test group by app --支持模糊查询 select * from test where monitor_name =~/app/ select * from test where monitor_name =~/p1$/ --查询单个tag的value值查询所以tag为app的value的值 show tag values from test with key="app" --分页 limit offset select * from test limit 2 offset 2 --没有IN操作，但是有 OR select * from test where monitor_name = 'test' or monitor_name ='app1' <pre><code> * 1）基于时间序列，支持与时间有关的相关函数（如最大，最小，求和等）； * 2）可度量性：你可以实时对大量数据进行计算； * 3）基于事件：它支持任意的事件数据； * 4）无结构（无模式）：可以是任意数量的列； * 5）支持min, max, sum, count, mean, median 等一系列函数； * 6）内置http支持，使用http读写； * 7）强大的类SQL语法； * 8）自带管理界面，方便使用（新版本需要通过Chronograf） * 9) [distinct](https://so.csdn.net/so/search?q=distinct&spm=1001.2101.3001.7020)的字段仅是field 不能是tag * 10) group by仅是tag 不能是field * 11) 支持模糊查询 * 12）分页 limit offset * 13）没有IN操作，但是有 OR **四、存储引擎** 采用TSM存储引擎，TSM是在LSM的基础上优化改善的，引入了serieskey的概念，对数据实现了很好的分类组织。 **_TSM主要由四个部分组成： cache、wal、tsm file、compactor：_** * cache：插入数据时，先往 cache 中写入再写入wal中，可以认为 cache 是 wal 文件中的数据在内存中的缓存，cache 中的数据并不是无限增长的，有一个 maxSize 参数用于控制当 cache 中的数据占用多少内存后就会将数据写入 tsm 文件。如果不配置的话，默认上限为 25MB * wal：预写日志，对比MySQL的 binlog，其内容与内存中的 cache 相同，作用就是为了持久化数据，当系统崩溃后可以通过 wal 文件恢复还没有写入到 tsm 文件中的数据，当 InfluxDB 启动时，会遍历所有的 wal 文件，重新构造 cache。 * tsm file：每个 tsm 文件的大小上限是 2GB。当达到 cache-snapshot-memory-size,cache-max-memory-size 的限制时会触发将 cache 写入 tsm 文件。 * compactor：主要进行两种操作，一种是 cache 数据达到阀值后，进行快照，生成一个新的 tsm 文件。另外一种就是合并当前的 tsm 文件，将多个小的 tsm 文件合并成一个，减少文件的数量，并且进行一些数据删除操作。这些操作都在后台自动完成，一般每隔 1 秒会检查一次是否有需要压缩合并的数据。 **InfluxDB数据保留策略：** * 每个数据库刚开始会自动创建一个默认的存储策略 autogen，数据保留时间为永久，在集群中的副本个数为1，之后用户可以自己设置（查看、新建、修改、删除），例如保留最近2小时的数据。插入和查询数据时如果不指定存储策略，则使用默认存储策略，且默认存储策略可以修改。InfluxDB 会定期清除过期的数据。 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:c585e8ac-21aa-4bb1-9144-f2dec1b478a9<details><summary>*[En]*</summary>*[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0d64e5c8-7a06-47fe-a071-7b741ae1747b*</details> show retention policies on "db_name" * Shard 在 influxdb中是一个比较重要的概念，它和 retention policy 相关联。每一个存储策略下会存在许多 shard，每一个 shard 存储一个指定时间段内的数据，并且不重复，例如 7点-8点的数据落入 shard0 中，8点-9点的数据则落入 shard1 中。每一个 shard 都对应一个底层的 tsm 存储引擎，有独立的 cache、wal、tsm file。 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:7b647599-305b-4038-b92f-0a6cffd2953e<details><summary>*[En]*</summary>*[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:d45bbc02-a5a6-4ff6-9a25-03d71bbd5123*</details> [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:dcf735d0-e8ce-4111-8e17-2de73c105f05<details><summary>*[En]*</summary>*[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:e7e6dc42-30a2-4b60-945f-9e88b05a91c1*</details> create database testdb2 with duration 30d **influxdb的数据存储有三个目录，分别是meta、wal、data：** * meta 用于存储数据库的一些元数据，meta 目录下有一个 meta.db 文件； * wal 目录存放预写日志文件，以 .wal 结尾； * data 目录存放实际存储的数据文件，以 .tsm 结尾。更多： * [influxdb官网学习教程](https://docs.influxdata.com/influxdb/v1.7/introduction/getting-started/) * [influxdb官网教程](https://v2.docs.influxdata.com/v2.0/get-started/) * [influxdb中文教程](https://jasper-zhang1.gitbooks.io/influxdb/content/Introduction/installation.html) **五、性能优化与go开发** - 控制 series 的数量； - 使用批量写； - 使用恰当的时间粒度； - 存储的时候尽量对 Tag 进行排序； - 根据数据情况，调整 shard 的 duration； - 无关的数据写不同的database； - 控制 Tag Key, 与 Tag Value 值的大小； - 存储分离，将 wal 目录与 data 目录分别映射到不同的磁盘上，以减少读写操作的相互影响。 * go语言开发只需要一个依赖包：github.com/influxdata/influxdb/client/v2，需要注意是v1.8版本，直接clone会失败，可先到：[github.com/influxdata/influxdb](https://links.jianshu.com/go?to=http%3A%2F%2Fgithub.com%2Finfluxdata%2Finfluxdb)中选择版本号V1.8，然后clone下载 * 对influxdb的操作主要有连接、插入、查询、关闭等几个步骤，其中查询的时候需要注意时间，要设置相应的时区，不然可能显示的时间结果不同;gutter:true;
import (
"github.com/influxdata/influxdb/client/v2"
…

)
//连接influxdb
func ConnectInflux()(client.Client, error){
conn, err := client.NewHTTPClient(client.HTTPConfig{
Addr:"http://localhost:8086",
Username:username,
Password:password,
})
if nil != err{
fmt.Println(err)
return nil, err
}
return conn, nil
}
//写入point
func WritePoints(con client.Client)error{
batchpoint ,err := client.NewBatchPoints(client.BatchPointsConfig{
Precision:"s",
Database:MyDB,
})
if nil != err{
fmt.Println(err)
return err
}
record := Record{AssertId:"assert_aaaaa", ModelId:"model0", PoinntId:"point1",
ModelPath:"model0/model1/point1", Attr:"", ModelTime:"123456789"}
tags := map[string]string{Tag1:record.AssertId, Tag2:record.ModelId}
fields := map[string]interface{}{Field1:record.PoinntId, Field2:record.ModelPath,
Field3:record.Attr, Field4:record.ModelTime}
point, err := client.NewPoint(Measurement, tags, fields, time.Now())
if nil != err{
fmt.Println(err)
return err
}
batchpoint.AddPoint(point)
if err := con.Write(batchpoint); err != nil{
fmt.Println(err)
return err
}
}
//查询时要注意时区，东八区设置为：tz(‘Asia/Shanghai’)，命令行需要：precision rfc3339
query := fmt.Sprintf("select * from %s limit %d tz(‘Asia/Shanghai’)", Measurement, 5)
res, err := querydb(conn, query)

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:72c39e35-224a-446f-8322-9b2d1a11ef8b

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:f37398ea-b0bc-4265-b670-0fb9613b0a67

Original: https://www.cnblogs.com/laoqing/p/14892707.html
Author: 张永清
Title: InfluxDB总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/562799/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

索引的建立与理解（什么情况下不用？为什么？）（保姆级理解）

一：索引的建立 import pandas as pd import sqlite3 conn=sqlite3.connect(‘new.db’) cur=conn.cursor(…

大数据 2023年11月11日
0049
Linux 源码编译安装软件

源码编译使用的相关工具： C、C++的源码：使用make工具进行编译 java的源码：使用maven进行编译使用C语言编写的程序源码的安装过程：执行confige脚本生成mak…

大数据 2023年5月27日
0097
Docker 简单部署 Redis 超详细图文步骤

大数据 2023年11月15日
0048
新手入坑LSTM—–如何一步一步进行文本训练

最近在学习一个课程，课程里一个项目就是看图说话，需要提起使用CNN提取图像特征，然后使用LSTM进行文本特征提取，然后将图像特征和文本特征进行合并，扔到网络里面进行训练，完成看图说…

大数据 2023年5月28日
0064
【Redis】# 常见报错Unsatisfied dependency、设置密码、主从配置

大数据 2023年11月16日
0035
Hue4.10.0 安装并与Hdfs、Hive集成

HUE 第一部分Hue概述Hue(Hadoop User Experience)是一个开源的 Apache Hadoop UI系统，最早是由 Cloudera Desktop演化而…

大数据 2023年6月9日
00167
springboot自动配置原理以及手动实现配置类

springboot自动配置原理以及手动实现配置类 1、原理 spring有一个思想是”约定大于配置”。配置类自动配置可以帮助开发人员更加专注于业务逻辑开…

大数据 2023年6月2日
0064
网编(4)：TCP原理

TCP 套接字中的I/O缓冲 TCP套接字的数据收发无边界。服务器端即使调用1次write函数传输40字节的数据，客户端也有可能通过4次read函数调用每次读取10字节。但此处也有…

大数据 2023年5月26日
0080
【转】JVM监控工具介绍jstack, jconsole, jinfo, jmap, jdb, jstat, jvisualvm

一、jps 用来查看基于HotSpot JVM里面所有进程的具体状态, 包括进程ID，进程启动的路径等等。与unix上的ps类似，用来显示本地有权限的java进程，可以查看本地运行…

大数据 2023年5月28日
0088
c语言中sqlite3的使用方法

在学习完tcp通信之后又了解了sqlite3的的功能，以及c语言中sqlite3的使用方法，接下来我将介绍c语言中sqlite3的使用方法。首先需保证机器上已经有SQLITE库，…

大数据 2023年11月10日
0034
java 连接 Sqlite 数据库工具类

一、简介 sqlite3非常小，轻量级，就几百K大小；不需要用户名，密码，直接就可以对数据库进行操作。二、安装sqlite3 1.安装sqlite3 sudo apt-get i…

大数据 2023年11月11日
0047
Springboot中web场景静态资源访问

1.静态资源目录只要静态资源放在类路径下：called /static (or /public or /resources or /META-INF/resources) 访问：当…

大数据 2023年6月3日
0072
hive的多维度分析函数with cube和grouping__id的理解

大数据 2023年11月14日
0055
Hive SQL面试题-流失回流用户数统计

流失回流用户数统计根据用户最后一次登录记录表，统计每天的流失（一段时间未登录平台）用户数量，和回流用户（一段时间未登录平台，但今天重新登录了平台）数量。执行环境：Hive on …

大数据 2023年11月13日
0038
剑指Offer:斐波那契数列(10.1)

题目描述: 求斐波那契数列的第 n 项，n 解题思路: 如果使用递归求解，会重复计算一些子问题。例如，计算 f(4) 需要计算 f(3) 和 f(2)，计算 f(3) 需要计算 f…

大数据 2023年6月3日
0066
【Bert】文本多标签分类

1.1 参考文献复旦大学邱锡鹏老师课题组的研究论文《How to Fine-Tune BERT for Text Classification?》。论文: https://ar…

大数据 2023年5月28日
0051

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

InfluxDB总结

influxdb和其他时序数据库比较

大家都在看