ETL的详细解释定义

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为DW的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。在整个项目中最难部分是用户需求分析和模型设计,而ETL规则设计和实施则是工作量最大的,约占整个项目的60%~80%,这是国内外从众多实践中得到的普遍共识。

ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

因此,如何通过各种技术手段将数据转化为信息和知识,成为提高其核心竞争力的主要瓶颈。其中ETL是主要的技术手段。[en]Therefore, how to transform data into information and knowledge through various technical means has become the main bottleneck to improve its core competitiveness. And ETL is the main technical means.

ETL作为一个数据仓库系统,是数据仓库中的关键环节。说得太远了,ETL是一个数据集成解决方案,如果它很小,它就是一个倾倒数据的工具。[en]As a data warehouse system, ETL is a key link. To put it too far, ETL is a data integration solution, and if it is small, it is a tool to pour data.

现在来说说ETL技术用到的工具,常用的有Informatica、Datastage、Beeload、Kettle等。目前只用过kettle,所以这里只对kettle做描述。

原文地址:https://blog.csdn.net/a814046606/article/details/82349711

Original: https://www.cnblogs.com/jpfss/p/12178988.html
Author: 星朝
Title: ETL的详细解释定义

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/6164/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部
最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总