按时间归档:2023年3月5日
-
大数据产品研究 – Presto简介
Presto是什么? Presto是一个开源的分布式SQL查询引擎,它以集群的方式运行,采用MPP架构,用在交互式分析查询场景下,可以将多种不同数据量级(从GB到PB)的数据源组合…
-
GreenPlum6.x之ETL工具
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、ETL是什么? 二、数据加载工具GPLoad * 1.GPLoad安装部署 2.编写控制文件t…
-
ETL 到底是什么?
如果您觉得有用的话,记得给 博主点个赞,评论,收藏一键三连啊,写作不易啊^ _ ^。而且听说 点赞的人每天的运气都不会太差,实在白嫖的话,那欢迎常来啊!!! ETL 到底是什么? …
-
初识ClickHouse
基本概念 OLTP(on-line transaction processing) 针对事务处理。 保证数据增删改的强一致性。 OLAP(On-Line Analytical Pr…
-
数仓:事实表设计方法,原则和三种类型选择
关注公众号,回复关键字 【资料】,获取【10万字大数据框架面试知识点】与【大数据开发的命令手册】 ; 事实表设计方法 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计。其…
-
ClickHouse整理
文章目录 * – 1. ClickHouse 概述 – 2. ClickHouse 入门 – + 2.1. 数据类型 + * 2.1.1. 整形…
-
kettle_配置数据库连接_报错
数据库连接 近期要使用kettle,今天尝试用kettle链接了一下 mysql数据库,报少驱动的错误 缺少驱动:org.gjt.mm.mysql.Driver 下载并使用驱动 2…
-
Hive语法中with as的使用
Hive语法中with as的使用 * – + 一、with as是什么? + 二、with as怎么用? + 三、with as测试 + 四、with as总结 一、…
-
一篇理清大数据技术发展和要求
自己通过阅读了解文章和极客时间相关讲解,总结该文章,阅读需要有一定的大数据基础知识,后续会展开描述细节。 大数据的定义 5v:大量,高速,多样化,价值,真实性,不能用传统的方法解决…
-
数据治理的一点点个人感想
1、数据治理是技术无关的,前期决定好怎么做,技术实现可以后续在商量(不仅仅是数据治理,所有的业务开发都是要理清楚业务之后才能考虑技术实现)。 2、数据治理是从上而下的,为什么?因为…