几个时序数据库

================================
可用作计时的数据库:[en]Databases that can be used as timing:
================================
[时序]TimescaleDB, 基于 PostgreSQL, 支持 SQL.

[时序]KairosDB, 基于 Cassandra, 不支持 SQL.

[通用]CrateDB, 基于 Elastic Search, 但支持ANSI SQL
[时序]InfluxDB, 是 db-engines 上排名第一的时序数据库, 最新版中集群功能不开源了, 商业版支持, 另外并发查询性能较差.

[通用]Kudu, 列式存储(类parquet), 支持 java API 更新数据, 比较赞的是支持 upsert. 可以通过 impala 或 spark 来支持SQL 查询.

简单的评论(基于底层技术的评论,无需实际测试)[en]Simple comments (comments based on the underlying technology, without an actual test)
TimescaleDB 基于PostgreSQL, 可能适合数据量不太大的情形, 但提供丰富的SQL功能
KairosDB, 基于 Cassandra, 运维应该比较简单, 扩展性也应该不错, 写入性能估计要比 CrateDB 差一些, 另外不支持SQL.

CrateDB 基于 Elastic Search, 写入性能应该很好, 扩展性也应该不错, 估计 SQL 支持度和读取性能会差一些, 支持全文检索.

db-engines 网站的对比:
https://db-engines.com/en/system/CrateDB%3BKairosDB%3BTimescaleDB

Crate 官方的比较:
http://go.cratedb.com/rs/832-QEZ-801/images/CrateDB-Cassandra-MongoDB-Comparison.pdf

================================
支持SQL的流处理框架[en]Stream processing Framework supporting SQL
================================
在大多数流处理方案中,数据通常临时存储在Kafka中。格式建议采用JSON/AVRO,模式建议采用Oracle Goldgate(OGG)数据格式。[en]In most stream processing schemes, the data is generally temporarily stored in kafka. Json/Avro is recommended for format, and Oracle Goldgate (OGG) data format is recommended for schema.

支持SQL的流处理框架有:[en]The stream processing frameworks that support SQL are:
1. Spark Streaming: 可以写很复杂的SQL, 比如和其他数据库DB做 join.

  1. Kafka 的 KSQL: 和Kafka公用集群, 不需要额外计算集群.

  2. PipelineDB : 基于 PostgreSQL 的扩展, cluster版需要付费. 流数据既可以直接写到 pipelinedb(以pipelinedb的FOREIGN TABLE形式暂存流数据), 然后通过 pipelinedb SQL来处理; 流数据也可以先打到kafka中, 然后再通过 pipelinedb extension来处理.

Original: https://www.cnblogs.com/jpfss/p/12183217.html
Author: 星朝
Title: 几个时序数据库

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/6157/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部
最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总