2022-01-04 迈向程序猿的第五十九步

2023年7月18日上午2:01 • 人工智能 • 阅读 42

集成性是指数据仓库中数据必须是一致的。数据仓库的数据是从原有的分散的多个数据库、数据文

件和数据段中抽取来的，数据来源可能既有内部数据又有外部数据。

数据仓库中的数据是为分析服务的，而分析需要多种广泛的不同数据源以便进行比较、鉴别，因此

数据仓库中的数据必须从多个数据源中获取，这些数据源包括多种类型数据库、文件系统以及

Internet 网上数据等，它们通过数据集成而形成数据仓库中的数据。

集成的方法：

统一：消除不一致的现象

综合：对原有数据进行综合和计算

集成需要考虑的问题：

数据格式

计量单位

数据代码含义混乱

数据名称混乱

1.3.3 非易失

数据仓库中的数据是经过抽取而形成的分析型数据，不具有原始性，主要供企业决策分析之用，执

行的主要是 ‘ 查询 ‘ 操作，一般情况下不执行 ‘ 更新 ‘ 操作。同时，一个稳定的数据环境也有利于数据分

析操作和决策的制订。

面向应用的事务数据库需要对数据进行频繁的插入、更新操作，而对于数据仓库中数据的操作仅限

于数据的初始导入和记录查询。

1.3.4 随时间不断变化

数据仓库以维的形式对数据进行组织，时间维是数据仓库中很重要的一个维度。并且数据仓库中的

数据时间跨度大，从几年甚至到几十年，称为历史数据。

数据仓库中的数据必须以一定时间段为单位进行统一更新。

数据变化方式 :

– 不断增加新的数据内容

– 不断删去旧的数据内容

– 更新与时间有关的综合数据

数据的生命周期与行业、自己本身的需求有关，比如金融业 ” 在设计银行数据保存周期策略时，最常用的经验法则是7 年和 13 个月规则 “

基础数据区里面通过历史表（拉链表）来保存重要信息的历史数据，一般客户类、账户类等信息要保留7年，交易类流水类信息要保留至少 13 个月以上。除此之外，重要代码、主数据也要通过历史表保存历史。

根据业务决定数据的生命周期，比如电商交易频繁的可能是2 年，保险行业交易比较少的 5 年。太老的数据对于数据分析没多大作用，你想10 年前的电商交易数据对于现在的电商能有多大帮助，价格、产品、用户都已经完全不同了如果数据仓库是仅用于分析的话（我看好多地方建立的数据仓库仅用于统计分析，对于数据挖掘基本都没有用），如果有大量的数据挖掘的话，那么数据多些对于结果越精确。（当然，前提是你的历史数据质量不太差的情况下）现在存储设备越来越便宜，如果不是数据量很惊人的话，一般是不用删除或导出的，因为导出后是需要管理的。

数据仓库的概念确立之后，有关数据仓库的实施方法、实施路径和架构等问题引发了诸多争议。

1994 年前后，实施数据仓库的公司大都以失败告终，导致数据集市的概念被提出并大范围运用，其代表人物是Ralph Kimball 。

1.4 数据仓库与数据库的区别

1. &#x7740;&#x91CD;&#x70B9;&#x4E0D;&#x540C;&#xFF1A;
   - &#x6570;&#x636E;&#x5E93;&#x7740;&#x91CD;&#x4E8E;&#x6570;&#x636E;&#x7684;&#x4E1A;&#x52A1;&#x5904;&#x7406;&#xFF08;&#x6570;&#x636E;&#x7684;&#x589E;&#x5220;&#x6539;&#xFF09;&#x3001;&#x4E5F;&#x5C31;&#x662F;&#x6570;&#x636E;&#x7684;OLTP&#x5904;&#x7406;
   - &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7740;&#x91CD;&#x4E8E;&#x6570;&#x636E;&#x7684;&#x5206;&#x6790;&#xFF0C;&#x901A;&#x5E38;&#x90FD;&#x662F;&#x9762;&#x5411;&#x67D0;&#x4E00;&#x4E2A;&#x884C;&#x4E1A;&#xFF0C;&#x9886;&#x57DF;&#xFF08;&#x67E5;&#x8BE2;&#xFF09;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x6570;&#x636E;&#x7684;OLAP&#x5904;&#x7406;
2. &#x5B58;&#x50A8;&#x7ED3;&#x6784;&#x4E0D;&#x540C;&#xFF1A;
   - &#x6570;&#x636E;&#x5E93;&#x662F;&#x9762;&#x5411;&#x884C;&#x5F0F;&#x5B58;&#x50A8;&#x3002;
   - &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x662F;&#x9762;&#x5411;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#xFF0C;&#x5229;&#x4E8E;&#x67E5;&#x8BE2;&#x548C;&#x5206;&#x6790;. &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E5F;&#x53EF;&#x4EE5;&#x79F0;&#x4E4B;&#x4E3A;"&#x5206;&#x6790;&#x578B;&#x6570;&#x636E;&#x5E93;"
3. &#x4F7F;&#x7528;&#x7684;&#x7528;&#x6237;&#x4E0D;&#x540C;
   - &#x6570;&#x636E;&#x5E93;&#x4E3B;&#x8981;&#x662F;&#x4E1A;&#x52A1;&#x4EBA;&#x5458;&#xFF0C;&#x4EBA;&#x6570;&#x76F8;&#x5BF9;&#x5927;&#x3002;&#x4F1A;&#x7ECF;&#x5E38;&#x8FDB;&#x884C;&#x8BFB;&#x548C;&#x5199;&#x64CD;&#x4F5C;&#x3002;&#x6BCF;&#x6B21;&#x8BFB;&#x548C;&#x5199;&#x7684;&#x6570;&#x636E;&#x91CF;&#x90FD;&#x76F8;&#x5BF9;&#x6765;&#x8BF4;&#x5C11;&#x3002;
   - &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E3B;&#x8981;&#x662F;&#x7BA1;&#x7406;&#x4EBA;&#x5458;&#xFF0C;&#x4EBA;&#x6570;&#x76F8;&#x5BF9;&#x5C11;&#x3002;&#x4F1A;&#x7ECF;&#x5E38;&#x8FDB;&#x884C;&#x8BFB;&#x64CD;&#x4F5C;&#xFF0C;&#x6BCF;&#x6B21;&#x8BFB;&#x53D6;&#x7684;&#x6570;&#x636E;&#x91CF;&#x5DE8;&#x5927;
4. &#x4F7F;&#x7528;&#x7684;&#x5DE5;&#x5177;&#x4E0D;&#x540C;
   - &#x6570;&#x636E;&#x5E93;&#x4E3B;&#x8981;&#x7528;&#x7684;&#x662F;oracle&#x3001;mysql&#x3001;sqlserver&#x7B49;&#x4F20;&#x7EDF;&#x5173;&#x7CFB;&#x578B;&#x6570;&#x636E;&#x5E93;
   - &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E3B;&#x8981;&#x7528;&#x7684;&#x662F;hive&#x3001;mr&#x3001;spark&#x3001;flink
5. &#x6570;&#x636E;&#x7684;&#x5B58;&#x50A8;&#x4F4D;&#x7F6E;&#x4E0D;&#x540C;
   - &#x6570;&#x636E;&#x5E93;&#x7684;&#x6570;&#x636E;&#x5B58;&#x50A8;&#x5230;&#x672C;&#x5730;&#x6587;&#x4EF6;&#x7CFB;&#x7EDF;&#xFF0C;&#x6BD4;&#x5982;windows&#x3001;linux&#x3001;mac
   - &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7684;&#x6570;&#x636E;&#x5B58;&#x50A8;&#x5230;&#x5206;&#x5E03;&#x5F0F;&#x6587;&#x4EF6;&#x7CFB;&#x7EDF;&#xFF0C;&#x6BD4;&#x5982;hdfs&#xFF0C;hbase
6. &#x54CD;&#x5E94;&#x65F6;&#x95F4;&#x4E0D;&#x540C;
   - &#x6570;&#x636E;&#x5E93;&#x7684;&#x53CD;&#x6620;&#x65F6;&#x95F4;&#x662F;&#x975E;&#x5E38;&#x77ED;&#x7684;&#xFF0C;&#x6BEB;&#x79D2;&#x7EA7;&#x522B;
   - &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7684;&#x53CD;&#x6620;&#x65F6;&#x95F4;&#x8F83;&#x957F;&#xFF0C;&#x79D2;&#x7EA7;&#x522B;&#xFF0C;&#x5206;&#x949F;&#x7EA7;&#x522B;

1.5 OLTP与OLAP的区别

OLAP: (online Analytical Processing,&#x5728;&#x7EBF;&#x5206;&#x6790;&#x5904;&#x7406;)
     &#x4E3B;&#x8981;&#x5C31;&#x662F;&#x7528;&#x6765;&#x9488;&#x5BF9;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x5206;&#x6790;&#x7684;&#xFF0C;&#x4E3A;&#x7BA1;&#x7406;&#x5C42;&#x670D;&#x52A1;
OLTP: (online transaction Processing,&#x5728;&#x7EBF;&#x4E8B;&#x52A1;&#x5904;&#x7406;)
     &#x4E3B;&#x8981;&#x5C31;&#x662F;&#x7528;&#x6765;&#x5FEB;&#x901F;&#x7684;&#x8FDB;&#x884C;&#x4E1A;&#x52A1;&#x5904;&#x7406;&#x3002;&#x516C;&#x53F8;&#x5185;&#x90E8;&#x7684;&#x6240;&#x6709;&#x4EBA;&#xFF0C;&#x4EE5;&#x53CA;&#x80FD;&#x4F7F;&#x7528;&#x5BA2;&#x6237;&#x7AEF;&#x7684;&#x5BA2;&#x6237;

OLAP细分以下种类：

ROLAP &#x8868;&#x793A;&#x57FA;&#x4E8E;&#x5173;&#x7CFB;&#x6570;&#x636E;&#x5E93;&#x7684;OLAP&#x5B9E;&#x73B0;&#xFF08;Relational OLAP&#xFF09;
MOLAP &#x8868;&#x793A;&#x57FA;&#x4E8E;&#x591A;&#x7EF4;&#x6570;&#x636E;&#x7EC4;&#x7EC7;&#x7684;OLAP&#x5B9E;&#x73B0;&#xFF08;Multidimensional OLAP&#xFF09;
HOLAP &#x8868;&#x793A;&#x57FA;&#x4E8E;&#x6DF7;&#x5408;&#x6570;&#x636E;&#x7EC4;&#x7EC7;&#x7684;OLAP&#x5B9E;&#x73B0;&#xFF08;Hybrid OLAP&#xFF09;

二、数据仓库的架构

三范式的概念：

&#x7B2C;&#x4E00;&#x8303;&#x5F0F;&#xFF1A;1NF
        &#x4FDD;&#x8BC1;&#x5B57;&#x6BB5;&#x7684;&#x6570;&#x636E;&#x4E0D;&#x53EF;&#x518D;&#x5206;&#xFF0C;&#x786E;&#x4FDD;&#x539F;&#x5B50;&#x6027;&#x3002;
        &#x6BD4;&#x5982;&#x67D0;&#x4E00;&#x4E2A;&#x8868;&#x4E2D;&#x6709;address&#x5B57;&#x6BB5;&#xFF0C;&#x91CC;&#x9762;&#x5B58;&#x50A8;&#x7684;&#x6570;&#x636E;&#x5305;&#x62EC;&#x7701;&#x4EFD;&#x57CE;&#x5E02;&#x8857;&#x9053;&#xFF0C;&#x5C31;&#x4E0D;&#x6EE1;&#x8DB3;&#x7B2C;&#x4E00;&#x8303;&#x5F0F;
        &#x5982;&#x679C;&#x60F3;&#x8981;&#x6EE1;&#x8DB3;&#x7B2C;&#x4E00;&#x8303;&#x5F0F;&#xFF1A;&#x5E94;&#x8BE5;&#x5C06;address&#x62C6;&#x6210;&#x4E09;&#x4E2A;&#x5B57;&#x6BB5;province,city,street
&#x7B2C;&#x4E8C;&#x8303;&#x5F0F;&#xFF1A;2NF,  &#x524D;&#x63D0;&#x5FC5;&#x987B;&#x6EE1;&#x8DB3;&#x7B2C;&#x4E00;&#x8303;&#x5F0F;
         &#x5728;&#x4E00;&#x5F20;&#x8868;&#x4E2D;&#x7684;&#x6240;&#x6709;&#x5B57;&#x6BB5;&#x90FD;&#x5E94;&#x8BE5;&#x548C;&#x4E3B;&#x952E;&#x5B57;&#x6BB5;&#x6709;&#x76F4;&#x63A5;&#x5173;&#x7CFB;
         &#x53CD;&#x4F8B;&#xFF1A;   table1&#xFF08;&#x804C;&#x5DE5;&#x53F7;&#xFF0C;&#x59D3;&#x540D;&#xFF0C;&#x804C;&#x79F0;&#xFF0C;&#x9879;&#x76EE;&#x53F7;&#xFF0C;&#x9879;&#x76EE;&#x540D;&#x79F0;&#xFF09;  &#x8FD9;&#x4E2A;&#x8868;&#x91CC;&#x6709;&#x804C;&#x5DE5;&#x4FE1;&#x606F;&#xFF0C;&#x8FD8;&#x6709;&#x9879;&#x76EE;&#x4FE1;&#x606F; &#x4E0D;&#x6EE1;&#x8DB3;&#x7B2C;&#x4E8C;&#x8303;&#x5F0F;
                 &#x4E0A;&#x8FF0;table1&#x8868;&#xFF0C;&#x5E94;&#x8BE5;&#x62C6;&#x5206;&#x6210;&#x5982;&#x4E0B;&#x4E24;&#x5F20;&#x8868;
                 &#x804C;&#x5DE5;&#x8868;(&#x804C;&#x5DE5;&#x53F7;&#xFF0C;&#x59D3;&#x540D;&#xFF0C;&#x804C;&#x79F0;)     &#x9879;&#x76EE;&#x8868;(&#x9879;&#x76EE;&#x53F7;&#xFF0C;&#x9879;&#x76EE;&#x540D;&#x79F0;)
&#x7B2C;&#x4E09;&#x8303;&#x5F0F;&#xFF1A;3NF
      &#x9700;&#x8981;&#x786E;&#x4FDD;&#x6570;&#x636E;&#x8868;&#x4E2D;&#x7684;&#x6BCF;&#x4E00;&#x5217;&#x6570;&#x636E;&#x90FD;&#x548C;&#x4E3B;&#x952E;&#x76F4;&#x63A5;&#x76F8;&#x5173;&#xFF0C;&#x800C;&#x4E0D;&#x80FD;&#x95F4;&#x63A5;&#x76F8;&#x5173;&#x3002;
          &#x53CD;&#x4F8B;&#xFF1A;table1(&#x8BA2;&#x5355;&#x7F16;&#x53F7;, &#x8BA2;&#x5355;&#x9879;&#x76EE;&#xFF0C;&#x8D1F;&#x8D23;&#x4EBA;&#xFF0C;&#x4E1A;&#x52A1;&#x5458;&#xFF0C;&#x8BA2;&#x5355;&#x6570;&#x91CF;&#xFF0C;&#x5BA2;&#x6237;&#x7F16;&#x53F7;&#xFF0C;&#x5BA2;&#x6237;&#x540D;&#x79F0;&#xFF0C;&#x6240;&#x5C5E;&#x516C;&#x53F8;&#xFF0C;&#x8054;&#x7CFB;&#x65B9;&#x5F0F;)
                 &#x5B58;&#x5728;&#x7740;&#x8054;&#x7CFB;&#x65B9;&#x5F0F;--->&#x5BA2;&#x6237;&#x7F16;&#x53F7;--->&#x8BA2;&#x5355;&#x7F16;&#x53F7;
          &#x5E94;&#x8BE5;&#x6309;&#x7167;&#x4E0B;&#x56FE;&#x6240;&#x793A;&#x7EF4;&#x62A4;&#x4E24;&#x5F20;&#x8868;

&#x603B;&#x7ED3;&#xFF1A; &#x5C31;&#x662F;&#x66F4;&#x52A0;&#x7EC6;&#x7C92;&#x5EA6;&#x7684;&#x7BA1;&#x7406;&#x8868;&#x6570;&#x636E;&#x3002;
       1. &#x4F18;&#x70B9;&#xFF1A;&#x6570;&#x636E;&#x4E0D;&#x5197;&#x4F59;
      2. &#x7F3A;&#x70B9;&#xFF1A; &#x8868;&#x4E4B;&#x95F4;&#x5B58;&#x5728;&#x7740;&#x5927;&#x91CF;&#x7684;join&#x3002;

2.1 两种不同的架构思想简介

2.1.1 bill inmon提出的架构思想

2.1.2 kimball 提出的架构思想

数据仓库代表的是一种对数据管理和使用的方式。它是一整套包括建模、ETL、调度在内的完整的理论体系流程，数据仓库在构建过程中通常要分层处理，有以下原因

2.2.1 分层的原因

1. &#x6570;&#x636E;&#x7ED3;&#x6784;&#x6E05;&#x6670;
              &#x6BCF;&#x4E00;&#x5C42;&#x7684;&#x6570;&#x636E;&#x90FD;&#x6709;&#x81EA;&#x5DF1;&#x7684;&#x4F5C;&#x7528;&#xFF0C;
              &#x7B2C;&#x4E00;&#x5C42;&#x662F;&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF0C;&#x7B2C;&#x4E8C;&#x5C42;&#x662F;&#x5B57;&#x6BB5;&#x7EDF;&#x4E00;&#x683C;&#x5F0F;&#xFF0C;&#x7EDF;&#x4E00;&#x5355;&#x4F4D;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x7B2C;&#x4E09;&#x5C42;&#x662F;&#x5FAE;&#x805A;&#x5408;(&#x6BCF;&#x5929;&#x7684;&#x805A;&#x5408;)&#xFF0C;&#x7B2C;&#x56DB;&#x5C42;&#x6700;&#x7EC8;&#x6307;&#x6807;&#x7684;&#x4E00;&#x4E2A;&#x5206;&#x6790;&#x7ED3;&#x679C;&#x5B58;&#x50A8;
2. &#x65B9;&#x4FBF;&#x8840;&#x7F18;&#x8FFD;&#x8E2A;
                &#x5F53;&#x67D0;&#x4E00;&#x5F20;&#x8868;&#x7684;&#x6570;&#x636E;&#x51FA;&#x4E86;&#x95EE;&#x9898;&#xFF0C;&#x53EF;&#x4EE5;&#x5411;&#x4E0A;&#x8FFD;&#x8FF0;&#xFF0C;&#x518D;&#x6B21;&#x6267;&#x884C;&#x4E00;&#x6B21;&#x67E5;&#x8BE2;&#x548C;&#x52A8;&#x6001;&#x52A0;&#x8F7D;&#x3002;
                                      &#x53EF;&#x4EE5;&#x5411;&#x4E0B;&#x8FFD;&#x8FF0;&#xFF0C;&#x5BF9;&#x5176;&#x4ED6;&#x4EC0;&#x4E48;&#x8868;&#x4EA7;&#x751F;&#x4E86;&#x5F71;&#x54CD;
3. &#x51CF;&#x5C11;&#x91CD;&#x590D;&#x5F00;&#x53D1;
                  &#x67D0;&#x4E00;&#x5C42;&#x7684;&#x6570;&#x636E;&#x7EF4;&#x62A4;&#x597D;&#x540E;&#xFF0C; &#x4E0B;&#x4E00;&#x5C42;&#x7684;&#x6570;&#x636E;&#x6765;&#x6E90;&#x53EA;&#x9700;&#x8981;&#x4ECE;&#x8FD9;&#x4E00;&#x5C42;&#x67E5;&#x8BE2;&#x548C;&#x5B58;&#x50A8;&#x5C31;&#x884C;&#x3002;&#x53EF;&#x4EE5;&#x91CD;&#x590D;&#x8FDB;&#x884C;&#x3002;&#x53EF;&#x4EE5;&#x505A;&#x5176;&#x4ED6;&#x7684;&#x5206;&#x6790;&#x3002;
4. &#x590D;&#x6742;&#x95EE;&#x9898;&#x7B80;&#x5355;&#x5316;

5. &#x5C4F;&#x853D;&#x539F;&#x59CB;&#x6570;&#x636E;&#x7684;&#x5F02;&#x5E38;
            &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7684;&#x6570;&#x636E;&#x5177;&#x6709;&#x7A33;&#x5B9A;&#x6027;&#x3002;&#x67D0;&#x4E00;&#x5C42;&#x7684;&#x6570;&#x636E;&#x4E0D;&#x5E94;&#x8BE5;&#x5B9E;&#x65F6;&#x53D8;&#x5316;&#x7684;&#x3002;&#x5982;&#x679C;&#x4E0D;&#x5206;&#x5C42;&#xFF0C;&#x539F;&#x59CB;&#x6570;&#x636E;&#x53EF;&#x80FD;&#x4F1A;&#x7ECF;&#x5E38;&#x53D1;&#x751F;&#x53D8;&#x91CF;&#xFF0C;&#x90A3;&#x4E48;&#x6307;&#x6807;&#x7ED3;&#x679C;&#x5C31;&#x4F1A;&#x4E0D;&#x65AD;&#x7684;&#x53D8;&#x5316;&#x3002;

2.2.2 分层的价值

1. &#x9AD8;&#x6548;&#x7684;&#x6570;&#x636E;&#x7EC4;&#x7EC7;&#x5F62;&#x5F0F;&#x3010;&#x6613;&#x7EF4;&#x62A4;&#x3011;
2. &#x65F6;&#x95F4;&#x4EF7;&#x503C;&#x3010;&#x9AD8;&#x6027;&#x80FD;&#x3011;
3. &#x96C6;&#x6210;&#x4EF7;&#x503C;&#x3010;&#x7B80;&#x5355;&#x5316;&#x3011;
4. &#x5386;&#x53F2;&#x6570;&#x636E;&#x3010;&#x5386;&#x53F2;&#x6027;&#x3011;

2.2.3 如何分层(重点)

数据仓库的常见分层有三层：数据操作层(ODS)、数据仓库层(DW)、数据集市层(DM)、另外有一个维度层(DIM). 实际情况要根据公司的需求而定。

2.2.3.1 ODS层（数据操作层）

&#x5B58;&#x50A8;&#x91C7;&#x96C6;&#x8FC7;&#x6765;&#x7684;&#x6E90;&#x6570;&#x636E;&#xFF0C;&#x5C3D;&#x91CF;&#x4EC0;&#x4E48;&#x90FD;&#x4E0D;&#x505A;&#x3002;&#x4E0E;&#x6E90;&#x6570;&#x636E;&#x4FDD;&#x6301;&#x4E00;&#x81F4;&#x3002;&#x8FD9;&#x4E00;&#x5C42;&#x9762;&#x7684;&#x6570;&#x636E;&#x8FD8;&#x5177;&#x6709;&#x9C9C;&#x660E;&#x7684;&#x4E1A;&#x52A1;&#x6570;&#x636E;&#x5E93;&#x7684;&#x7279;&#x5F81;&#xFF0C;&#x751A;&#x81F3;&#x8FD8;&#x5177;&#x6709;&#x4E00;&#x5B9A;&#x7684;&#x5173;&#x7CFB;&#x6570;&#x636E;&#x5E93;&#x4E2D;&#x7684; &#x6570;&#x636E;&#x8303;&#x5F0F;&#x7684;&#x7EC4;&#x7EC7;&#x5F62;&#x5F0F;&#x3002;

但是、这一层面的数据却不完全等同于原始数据，可以做一些去噪、去脏、统一字段等（建议什么都不做）

2.2.3.2 dw层

主要是对ods层的数据进行清洗、去重、以主题的形式做宽表处理(表关联、字段的增减、微聚合)。细分以下几层

1）dwd层(数据仓库明细层)

&#x8868;&#x5173;&#x8054;(&#x5BF9;ods&#x7684;&#x5404;&#x4E2A;&#x8868;&#x8FDB;&#x884C;&#x5173;&#x8054;&#x3001;&#x6216;&#x8005;&#x518D;&#x8FDE;&#x63A5;DIM&#x5C42;&#x7684;&#x7EF4;&#x5EA6;)&#x5236;&#x4F5C;&#x5BBD;&#x8868;&#xFF0C;&#x4E5F;&#x53EF;&#x4EE5;&#x53BB;&#x6389;&#x5B57;&#x6BB5;&#x3001;&#x589E;&#x52A0;&#x5B57;&#x6BB5;(time-->year&#x3001;month&#x3001;day)&#x3002;&#x7EDF;&#x4E00;&#x5B57;&#x6BB5;&#x683C;&#x5F0F;(&#x4E0D;&#x540C;&#x7684;&#x8868;&#x7684;&#x65F6;&#x95F4;&#xFF0C;&#x7EDF;&#x4E00;&#x683C;&#x5F0F;)&#x3002;

&#x6CE8;&#x610F;&#xFF1A;&#x8868;&#x5173;&#x8054;&#x65F6;&#xFF0C;&#x90FD;&#x662F;&#x6839;&#x636E;&#x4E3B;&#x9898;&#x8FDB;&#x884C;&#x5173;&#x8054;&#x3002;

2) dw层(数据仓库层)

1. &#x5BF9;dwd&#x5C42;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x8FDB;&#x884C;&#x5FAE;&#x805A;&#x5408;&#xFF0C;&#x8FD9;&#x6837;&#x4E3A;&#x4E0A;&#x4E00;&#x4E2A;DM&#x5C42;&#x505A;&#x6570;&#x636E;&#x652F;&#x6301;&#xFF0C;&#x63D0;&#x9AD8;&#x4E0A;&#x4E00;&#x5C42;&#x7684;&#x6548;&#x7387;&#x3002;
2. &#x53EF;&#x4EE5;&#x9009;&#x62E9;&#x6027;&#x7684;&#x4E0E;dim&#x5C42;&#x518D;&#x6B21;&#x5173;&#x8054;&#x3002;
3. &#x8FD9;&#x5C42;&#x7684;&#x6570;&#x636E;&#x6A21;&#x578B;&#x4E00;&#x822C;&#x8981;&#x6839;&#x636E;&#x4E3B;&#x9898;&#x6765;&#x786E;&#x5B9A;&#x8981;&#x4F7F;&#x7528;&#x7684;&#x6570;&#x636E;&#x6A21;&#x578B;&#xFF0C;&#x6BD4;&#x5982;&#x661F;&#x578B;&#x6A21;&#x578B;&#x8FD8;&#x662F;&#x96EA;&#x82B1;&#x6A21;&#x578B;

2.2.3.3 DM层(数据集市)

1. &#x6839;&#x636E;&#x4E3B;&#x9898;&#x505A;&#x6700;&#x7EC8;&#x7684;&#x6307;&#x6807;&#x67E5;&#x8BE2;&#xFF0C;&#x6570;&#x636E;&#x6765;&#x6E90;&#x4E8E;&#x53EF;&#x80FD;&#x662F;&#x5176;&#x4ED6;&#x4EFB;&#x610F;&#x5C42;&#xFF0C;&#x591A;&#x6570;&#x60C5;&#x51B5;&#x662F;dw&#x5C42;&#xFF0C;&#x4E00;&#x822C;&#x4E00;&#x4E2A;&#x90E8;&#x95E8;&#x5BF9;&#x5E94;&#x4E00;&#x4E2A;&#x6570;&#x636E;&#x96C6;&#x5E02;&#xFF0C;&#x800C;&#x4E00;&#x4E2A;&#x6570;&#x636E;&#x96C6;&#x5E02;&#x4E2D;&#xFF0C;&#x53EF;&#x4EE5;&#x6709;&#x591A;&#x4E2A;&#x7EDF;&#x8BA1;&#x7ED3;&#x679C;&#x7684;&#x8868;&#x3002;
2. &#x8BE5;&#x5C42;&#x7684;&#x4F5C;&#x7528;&#x53EF;&#x4EE5;&#x8FDB;&#x884C;&#x6570;&#x636E;&#x5C55;&#x793A;&#x3001;&#x6570;&#x636E;&#x62A5;&#x8868;&#x3001;&#x4E5F;&#x53EF;&#x4EE5;&#x4E3A;&#x6570;&#x636E;&#x6316;&#x6398;&#x63D0;&#x4F9B;&#x6570;&#x636E;&#x652F;&#x6301;

2.2.3.4 DIM层(维度层)

&#x4E3A;&#x6574;&#x4E2A;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#xFF0C;&#x63D0;&#x4F9B;&#x5E38;&#x91CF;&#x503C;&#x3002;
&#x6BD4;&#x5982;&#x6574;&#x4E2A;&#x4E16;&#x754C;&#x7684;&#x6240;&#x6709;&#x56FD;&#x5BB6;&#x4EE3;&#x7801;&#x3001;&#x540D;&#x79F0;&#x3001;&#x4F4D;&#x7F6E;
&#x518D;&#x6709;&#x4E00;&#x4E2A;&#x56FD;&#x5BB6;&#x7684;&#x7701;&#x3001;&#x5E02;&#x3001;&#x53BF;&#x3001;&#x533A;&#x4FE1;&#x606F;
&#x6BD4;&#x5982;&#x65F6;&#x95F4;&#x7684;&#x7EF4;&#x5EA6;&#xFF1A; &#x5E74; &#x6708;  &#x65E5;  &#x5B63;&#x5EA6;  &#x661F;&#x671F;
...

2.3 数据仓库的开发命名规范

1. &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7684;&#x5E93;&#x7684;&#x547D;&#x540D;
    &#x6570;&#x4ED3;&#x5C42;_&#x4E1A;&#x52A1;&#x540D;&#x79F0;       &#x6BD4;&#x5982;: &#x6559;&#x80B2;&#x4E3B;&#x9898;&#xFF1A;
                                     ods_edu
                                 dwd_edu

                                 &#x7535;&#x5546;&#x4E3B;&#x9898;&#xFF1A;ods_tele

2. &#x6570;&#x636E;&#x4ED3;&#x5E93;&#x8868;&#x7684;&#x547D;&#x540D;
    - &#x6BCF;&#x79CD;&#x6765;&#x6E90;&#x7684;&#x7C7B;&#x578B;&#x4EE3;&#x7801;
        01 -> hdfs&#x6570;&#x636E;
        02 -> mysql&#x6570;&#x636E;
        03 -> redis&#x6570;&#x636E;
        04 -> mongodb&#x6570;&#x636E;
        05 -> tidb&#x6570;&#x636E;
    - &#x547D;&#x540D;&#x89C4;&#x5219;&#xFF1A;
        &#x6570;&#x4ED3;&#x5C42;_&#x6765;&#x6E90;&#x4EE3;&#x7801;_&#x4E1A;&#x52A1;
        &#x6BD4;&#x5982;&#xFF1A;
        ods_release.ods_01_release &#x6295;&#x653E;&#x6570;&#x636E;
        ods_release.ods_02_user &#x6CE8;&#x518C;&#x7528;&#x6237;&#x8868;(&#x4E1A;&#x52A1;&#x8868;&#xFF1A;&#x5B58;&#x4E8E;MYSQL)
        dw_release.dw_customer &#x76EE;&#x6807;&#x5BA2;&#x6237;&#x4E3B;&#x9898;&#x8868;
        dm_release.dm_customer_stat &#x76EE;&#x6807;&#x5BA2;&#x6237;&#x7EDF;&#x8BA1;&#x8868;

2.4 数据仓库的两种主流维度模型

2.4.1 星型模型

1. &#x661F;&#x578B;&#x6A21;&#x578B;&#x662F;&#x4E00;&#x79CD;&#x591A;&#x7EF4;&#x5EA6;&#x7684;&#x6570;&#x636E;&#x5173;&#x7CFB;&#xFF0C;
2. &#x5B83;&#x7531;&#x4E00;&#x4E2A;&#x4E8B;&#x5B9E;&#x8868;&#x548C;&#x4E00;&#x7EC4;&#x7EF4;&#x5EA6;&#x8868;&#x7EC4;&#x6210;&#x3002;&#x6BCF;&#x4E2A;&#x7EF4;&#x5EA6;&#x8868;&#x90FD;&#x6709;&#x4E00;&#x4E2A;&#x7EF4;&#x5EA6;&#x4F5C;&#x4E3A;&#x4E3B;&#x952E;&#xFF0C;&#x6240;&#x6709;&#x8FD9;&#x4E9B;&#x7EF4;&#x7684;&#x4E3B;&#x952E;&#x7EC4;&#x5408;&#x6210;&#x4E8B;&#x5B9E;&#x8868;&#x7684;&#x4E3B;&#x952E;&#x3002;&#x5F3A;&#x8C03;&#x7684;&#x662F;&#x5BF9;&#x7EF4;&#x5EA6;&#x8FDB;&#x884C;&#x9884;&#x5904;&#x7406;&#xFF0C;&#x5C06;&#x591A;&#x4E2A;&#x7EF4;&#x5EA6;&#x96C6;&#x5408;&#x5230;&#x4E00;&#x4E2A;&#x4E8B;&#x5B9E;&#x8868;&#xFF0C;&#x5F62;&#x6210;&#x4E00;&#x4E2A;&#x5BBD;&#x8868;&#x3002;&#x5176;&#x5305;&#x542B;&#x4E86;&#x7EF4;&#x5EA6;&#x5173;&#x8054;&#x7684;&#x4E3B;&#x952E;&#x548C;&#x4E00;&#x4E9B;&#x5EA6;&#x91CF;&#x4FE1;&#x606F;&#xFF0C;&#x800C;&#x7EF4;&#x5EA6;&#x8868;&#x5219;&#x662F;&#x4E8B;&#x5B9E;&#x8868;&#x91CC;&#x9762;&#x7EF4;&#x5EA6;&#x7684;&#x5177;&#x4F53;&#x4FE1;&#x606F;&#xFF0C;&#x4F7F;&#x7528;&#x65F6;&#x5019;&#x4E00;&#x822C;&#x901A;&#x8FC7;join&#x6765;&#x7EC4;&#x5408;&#x6570;&#x636E;&#xFF0C;&#x76F8;&#x5BF9;&#x6765;&#x8BF4;&#x5BF9;OLAP&#x7684;&#x5206;&#x6790;&#x6BD4;&#x8F83;&#x65B9;&#x4FBF;&#x3002;

&#x7B80;&#x5355;&#x8BF4;&#xFF1A;&#x4E00;&#x4E2A;&#x4E8B;&#x5B9E;&#x8868;&#x5468;&#x56F4;&#x53EA;&#x6709;&#x4E00;&#x5C42;&#x7EF4;&#x5EA6;&#x8868;&#x3002;

+86  1001   &#x5E7F;&#x4E1C;    10010001  &#x5E7F;&#x5DDE;   &#x533A;1
+86  1001   &#x5E7F;&#x4E1C;    10010001  &#x5E7F;&#x5DDE;   &#x533A;2
+86  1001   &#x5E7F;&#x4E1C;    10010001  &#x5E7F;&#x5DDE;   &#x533A;3
................................

+86  1002   &#x5E7F;&#x897F;    10010001  &#x5E7F;&#x5DDE;   &#x533A;1
+86  1002   &#x5E7F;&#x897F;    10010001  &#x5E7F;&#x5DDE;   &#x533A;2
+86  1002   &#x5E7F;&#x897F;    10010001  &#x5E7F;&#x5DDE;   &#x533A;3

1001   &#x5E7F;&#x4E1C;
1002  &#x5E7F;&#x897F;
......

1001  10010001 &#x5E7F;&#x5DDE;
1001  10010002 &#x6DF1;&#x5733;
.....

2.4.2 雪花模型

1. &#x5F53;&#x6709;&#x4E00;&#x4E2A;&#x6216;&#x591A;&#x4E2A;&#x7EF4;&#x8868;&#x6CA1;&#x6709;&#x76F4;&#x63A5;&#x8FDE;&#x63A5;&#x5230;&#x4E8B;&#x5B9E;&#x8868;&#x4E0A;&#xFF0C;&#x800C;&#x662F;&#x901A;&#x8FC7;&#x5176;&#x4ED6;&#x7EF4;&#x8868;&#x8FDE;&#x63A5;&#x5230;&#x4E8B;&#x5B9E;&#x8868;&#x4E0A;&#x65F6;&#xFF0C;&#x5176;&#x56FE;&#x89E3;&#x5C31;&#x50CF;&#x591A;&#x4E2A;&#x96EA;&#x82B1;&#x8FDE;&#x63A5;&#x5728;&#x4E00;&#x8D77;&#xFF0C;&#x6545;&#x79F0;&#x96EA;&#x82B1;&#x6A21;&#x578B;&#x3002;
2. &#x96EA;&#x82B1;&#x6A21;&#x578B;&#x662F;&#x5BF9;&#x661F;&#x578B;&#x6A21;&#x578B;&#x7684;&#x6269;&#x5C55;&#x3002;&#x5B83;&#x5BF9;&#x661F;&#x578B;&#x6A21;&#x578B;&#x7684;&#x7EF4;&#x8868;&#x8FDB;&#x4E00;&#x6B65;&#x5C42;&#x6B21;&#x5316;&#xFF0C;&#x539F;&#x6709;&#x7684;&#x5404;&#x7EF4;&#x8868;&#x53EF;&#x80FD;&#x88AB;&#x6269;&#x5C55;&#x4E3A;&#x5C0F;&#x7684;&#x4E8B;&#x5B9E;&#x8868;&#xFF0C;&#x5F62;&#x6210;&#x4E00;&#x4E9B;&#x5C40;&#x90E8;&#x7684;"&#x5C42;&#x6B21;"&#x533A;&#x57DF;&#xFF0C;&#x8FD9;&#x4E9B;&#x88AB;&#x5206;&#x89E3;&#x7684;&#x8868;&#x90FD;&#x8FDE;&#x63A5;&#x5230;&#x4E3B;&#x7EF4;&#x5EA6;&#x8868;&#x800C;&#x4E0D;&#x662F;&#x4E8B;&#x5B9E;&#x8868;&#x3002;&#x5982;&#x56FE; 2&#xFF0C;&#x5C06;&#x5730;&#x57DF;&#x7EF4;&#x8868;&#x53C8;&#x5206;&#x89E3;&#x4E3A;&#x56FD;&#x5BB6;&#xFF0C;&#x7701;&#x4EFD;&#xFF0C;&#x57CE;&#x5E02;&#x7B49;&#x7EF4;&#x8868;&#x3002;
3. &#x5B83;&#x7684;&#x4F18;&#x70B9;&#x662F; : &#x901A;&#x8FC7;&#x6700;&#x5927;&#x9650;&#x5EA6;&#x5730;&#x51CF;&#x5C11;&#x6570;&#x636E;&#x5B58;&#x50A8;&#x91CF;&#x4EE5;&#x53CA;&#x8054;&#x5408;&#x8F83;&#x5C0F;&#x7684;&#x7EF4;&#x8868;&#x6765;&#x6539;&#x5584;&#x67E5;&#x8BE2;&#x6027;&#x80FD;&#x3002;&#x96EA;&#x82B1;&#x578B;&#x7ED3;&#x6784;&#x53BB;&#x9664;&#x4E86;&#x6570;&#x636E;&#x5197;&#x4F59;&#x3002;

&#x7B80;&#x5355;&#x8BF4;&#xFF1A;&#x4E00;&#x4E2A;&#x4E8B;&#x5B9E;&#x8868;&#x5468;&#x56F4;&#x7684;&#x7EF4;&#x5EA6;&#x8868;&#x4E0D;&#x6B62;&#x4E00;&#x5C42;&#x3002;&#x4F18;&#x52BF;&#x662F;&#x51CF;&#x5C11;&#x6570;&#x636E;&#x5197;&#x4F59;

三、名次解释

3.1 维度

1. &#x89C2;&#x5BDF;(&#x5BA1;&#x89C6;)&#x6570;&#x636E;&#x7684;&#x89D2;&#x5EA6;&#xFF0C;&#x6BD4;&#x5982;&#x4ECE;&#x57CE;&#x5E02;&#x540D;&#x3001;&#x5B63;&#x5EA6;&#x3001;&#x5E74;&#x4EFD;&#x3001;&#x56FD;&#x5BB6;&#x540D;&#x7B49;&#x4E0D;&#x540C;&#x7684;&#x7684;&#x89D2;&#x5EA6;&#x6765;&#x5206;&#x6790;&#x6570;&#x636E;&#x3002;
2. &#x7EF4;&#x5EA6;&#x662F;&#x591A;&#x4E2A;&#x503C;&#x7684;&#x4E00;&#x4E2A;&#x96C6;&#x5408;&#x3002;
   &#x6BD4;&#x5982;&#x57CE;&#x5E02;&#x7EF4;&#x5EA6;&#xFF1A; &#x6DF1;&#x5733;&#x3001;&#x4E0A;&#x6D77;&#x3001;&#x54C8;&#x5C14;&#x6EE8;&#x3001;&#x5408;&#x80A5;&#x3001;&#x957F;&#x6625;&#x8FD9;&#x4E9B;&#x503C;&#x6784;&#x6210;&#x4E00;&#x4E2A;&#x7EF4;&#x5EA6;&#x5B57;&#x6BB5;&#x3002;
3. &#x7EF4;&#x5EA6;&#x662F;&#x4E00;&#x79CD;&#x79BB;&#x6563;&#x6570;&#x636E;&#xFF1A;  &#x540C;&#x4E00;&#x4E2A;&#x7EF4;&#x5EA6;&#x7684;&#x4E24;&#x4E2A;&#x4E0D;&#x540C;&#x7684;&#x503C;&#xFF0C;&#x6CA1;&#x5173;&#x7CFB;&#xFF0C;&#x90FD;&#x662F;&#x72EC;&#x7ACB;&#x7684;&#x3002;&#x5728;&#x505A;&#x6570;&#x636E;&#x7EDF;&#x8BA1;(&#x548C;&#x3001;&#x6700;&#x5927;&#x3001;&#x6700;&#x5C0F;&#x3001;&#x5E73;&#x5747;&#x3001;&#x6570;&#x91CF;)&#x65F6;&#xFF0C;&#x90FD;&#x662F;&#x5C06;&#x76F8;&#x540C;&#x503C;&#x7684;&#x6570;&#x636E;&#x805A;&#x5408;&#x8D77;&#x6765;&#x7684;&#x3002;

3.2 维度系数(基数)

&#x7EF4;&#x5EA6;&#x57FA;&#x6570;&#xFF08;Cardinality&#xFF09;&#x6307;&#x7684;&#x662F;&#x8FD9;&#x4E2A;&#x7EF4;&#x5EA6;&#x5728;&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x51FA;&#x73B0;&#x4E0D;&#x540C;&#x503C;&#x7684;&#x4E2A;&#x6570;&#x3002; &#x6BD4;&#x5982;province&#x8FD9;&#x4E2A;&#x7EF4;&#x5EA6;&#xFF0C;&#x6709;&#x6E56;&#x5317;&#x3001;&#x5E7F;&#x4E1C;&#x3001;&#x6E56;&#x5357;&#x3001;&#x5317;&#x4EAC;&#x7B49;34&#x4E2A;&#x503C;&#xFF0C;&#x5219;&#x8BE5;&#x7EF4;&#x5EA6;&#x7684;&#x57FA;&#x6570;&#x5C31;&#x662F;34

3.3 度量

1. &#x5EA6;&#x91CF;&#x5C31;&#x662F;&#x88AB;&#x805A;&#x5408;&#x7684;&#x7EDF;&#x8BA1;&#x503C;&#xFF0C;&#x4E5F;&#x662F;&#x805A;&#x5408;&#x8FD0;&#x7B97;&#x7684;&#x7ED3;&#x679C;
2. &#x5EA6;&#x91CF;&#x548C;&#x521A;&#x624D;&#x8BF4;&#x7684;&#x7EF4;&#x5EA6; &#x662F;&#x6570;&#x636E;&#x7EDF;&#x8BA1;&#x7684;&#x4E24;&#x4E2A;&#x4E3B;&#x8981;&#x6982;&#x5FF5;
3. &#x5EA6;&#x91CF;&#x4E3B;&#x8981;&#x7528;&#x4E8E;&#x5206;&#x6790;&#x6216;&#x8005;&#x8BC4;&#x4F30;&#xFF0C;&#x6BD4;&#x5982;&#x5BF9;&#x8D8B;&#x52BF;&#x7684;&#x5224;&#x65AD;&#xFF0C;&#x5BF9;&#x4E1A;&#x7EE9;&#x6216;&#x8005;&#x6548;&#x679C;&#x7684;&#x5224;&#x5B9A;&#x7B49;&#x7B49;&#x3002;&#x6BD4;&#x5982;&#x5728;&#x4E00;&#x822C;&#x7684;&#x5927;&#x6570;&#x636E;&#x5206;&#x6790; &#x5E94;&#x7528;&#x91CC;&#x9762;&#x5C31;&#x6709;&#x603B;PV&#xFF0C;&#x603B;UV&#x7B49;&#x5EA6;&#x91CF;&#x7528;&#x4E8E;&#x8BC4;&#x5224;&#x4E00;&#x4E2A;&#x7F51;&#x7AD9;&#x6216;&#x8005;APP&#x7684;&#x6D3B;&#x8DC3;&#x5EA6;

PV: page viewer     &#x9875;&#x9762;&#x8BBF;&#x95EE;&#x91CF;
UV: user viewer     &#x7528;&#x6237;&#x8BBF;&#x95EE;&#x91CF;

select province,city,count(1) &#x4E2A;&#x6570;,sum(sales) &#x9500;&#x552E;&#x603B;&#x989D;,avg(nvl(sales,0))&#x5E73;&#x5747;&#x9500;&#x552E;&#x989D; from tablename group by province,city,uid;

3.4 指标

&#x6307;&#x6807;&#x7528;&#x4E8E;&#x8861;&#x91CF;&#x4E8B;&#x7269;&#x53D1;&#x5C55;&#x7A0B;&#x5EA6;&#x7684;&#x5355;&#x4F4D;&#x6216;&#x65B9;&#x6CD5;&#xFF0C;&#x5B83;&#x8FD8;&#x6709;&#x4E2A;IT&#x4E0A;&#x5E38;&#x7528;&#x7684;&#x540D;&#x5B57;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x5EA6;&#x91CF;&#x3002;&#x3002;&#x4F8B;&#x5982;&#xFF0C;&#x7EF4;&#x5EA6;&#x201C;&#x57CE;&#x5E02;&#x201D;&#x53EF;&#x4EE5;&#x5173;&#x8054;&#x6307;&#x6807;&#x201C;&#x4EBA;&#x53E3;&#x201D;&#xFF0C;&#x5176;&#x503C;&#x4E3A;&#x5177;&#x4F53;&#x57CE;&#x5E02;&#x7684;&#x5C45;&#x6C11;&#x603B;&#x6570;

&#x6307;&#x6807;&#xFF1A; &#x4EBA;&#x6570;&#x6570;&#x91CF;&#xFF0C;&#x6D41;&#x5931;&#x91CF;&#xFF0C;&#x6C47;&#x5165;&#x91CF;&#xFF0C; PV(page view, &#x7EDF;&#x8BA1;&#x7684;&#x662F;&#x4E00;&#x4E2A;&#x7F51;&#x7AD9;&#x88AB;&#x8BBF;&#x95EE;&#x7684;&#x6B21;&#x6570;)&#xFF0C;UV(&#x7EDF;&#x8BA1;&#x7684;&#x662F;&#x4E00;&#x4E2A;&#x7F51;&#x7AD9;&#x88AB;&#x591A;&#x5C11;&#x4EBA;&#x8BBF;&#x95EE;)&#xFF0C;GDP&#x3001;&#x6536;&#x5165;&#x3001;&#x7528;&#x6237;&#x6570;&#x3001;&#x5229;&#x6DA6;&#x7387;&#x3001;&#x7559;&#x5B58;&#x7387;&#x3001;&#x8986;&#x76D6;&#x7387;&#x7B49;&#x3002;&#x5F88;&#x591A;&#x516C;&#x53F8;&#x90FD;&#x6709;&#x81EA;&#x5DF1;&#x7684;KPI&#x6307;&#x6807;&#x4F53;&#x7CFB;&#xFF0C;&#x5C31;&#x662F;&#x901A;&#x8FC7;&#x51E0;&#x4E2A;&#x5173;&#x952E;&#x6307;&#x6807;&#x6765;&#x8861;&#x91CF;&#x516C;&#x53F8;&#x4E1A;&#x52A1;&#x8FD0;&#x8425;&#x60C5;&#x51B5;&#x7684;&#x597D;&#x574F;&#x3002;

案例说明

1、企业运营好坏的指标：

    1.&#x6708;&#x5E38;&#x89C4;&#x6536;&#x5165; MRR
    2.&#x603B;&#x5BA2;&#x6237;&#x83B7;&#x53D6;&#x6210;&#x672C; tCAC
    3.&#x5E38;&#x89C4;&#x6027;&#x6BDB;&#x5229; RGB
    4.&#x6BDB;&#x5229;&#x56DE;&#x6536;&#x671F; GMPP
    5.&#x9884;&#x8BA1;&#x751F;&#x547D;&#x5468;&#x671F; eLT
    6.&#x751F;&#x547D;&#x5468;&#x671F;&#x4EF7;&#x503C; LTV
    7.&#x603B;&#x5BA2;&#x6237;&#x83B7;&#x53D6;&#x6210;&#x672C;&#x56DE;&#x62A5;&#x7387; rCAC

2、一个网站的指标

维度与指标

&#x867D;&#x7136;&#x7EF4;&#x5EA6;&#x548C;&#x6307;&#x6807;&#x53EF;&#x4EE5;&#x72EC;&#x7ACB;&#x4F7F;&#x7528;&#xFF0C;&#x4F46;&#x5E38;&#x89C1;&#x7684;&#x8FD8;&#x662F;&#x76F8;&#x4E92;&#x7ED3;&#x5408;&#x4F7F;&#x7528;&#x3002;&#x7EF4;&#x5EA6;&#x548C;&#x6307;&#x6807;&#x7684;&#x503C;&#x4EE5;&#x53CA;&#x8FD9;&#x4E9B;&#x503C;&#x4E4B;&#x95F4;&#x7684;&#x5173;&#x7CFB;&#xFF0C;&#x4F7F;&#x60A8;&#x7684;&#x6570;&#x636E;&#x5177;&#x6709;&#x4E86;&#x610F;&#x4E49;&#x3002;&#x4E3A;&#x4E86;&#x6316;&#x6398;&#x5C3D;&#x53EF;&#x80FD;&#x591A;&#x7684;&#x6DF1;&#x5C42;&#x6B21;&#x4FE1;&#x606F;&#xFF0C;&#x7EF4;&#x5EA6;&#x901A;&#x5E38;&#x4E0E;&#x4E00;&#x4E2A;&#x6216;&#x591A;&#x4E2A;&#x6307;&#x6807;&#x5173;&#x8054;&#x5728;&#x4E00;&#x8D77;&#x3002; &#x4F8B;&#x5982;&#xFF0C;&#x7EF4;&#x5EA6;&#x201C;&#x57CE;&#x5E02;&#x201D;&#x53EF;&#x4EE5;&#x4E0E;&#x6307;&#x6807;&#x201C;&#x4EBA;&#x53E3;&#x201D;&#x548C;&#x201C;&#x9762;&#x79EF;&#x201D;&#x76F8;&#x5173;&#x8054;&#x3002;&#x6709;&#x4E86;&#x8FD9;&#x4E9B;&#x6570;&#x636E;&#xFF0C;&#x7CFB;&#x7EDF;&#x8FD8;&#x53EF;&#x4EE5;&#x521B;&#x5EFA;&#x201C;&#x4EBA;&#x53E3;&#x5BC6;&#x5EA6;&#x201D;&#x7B49;&#x6BD4;&#x503C;&#x6307;&#x6807;&#xFF0C;&#x5E26;&#x6765;&#x6709;&#x5173;&#x8FD9;&#x4E9B;&#x57CE;&#x5E02;&#x7684;&#x66F4;&#x8BE6;&#x7EC6;&#x7684;&#x6DF1;&#x5165;&#x4FE1;&#x606F;

3.5 事实表

1. &#x4E8B;&#x5B9E;&#x4E0A;&#x3001;&#x6240;&#x6709;&#x7684;&#x8868;&#xFF0C;&#x90FD;&#x53EF;&#x4EE5;&#x79F0;&#x4E4B;&#x4E3A;&#x4E8B;&#x5B9E;&#x8868;
2. &#x4E3B;&#x8981;&#x5305;&#x542B;&#x4E86;&#x63CF;&#x8FF0;&#x7279;&#x5B9A;&#x5546;&#x4E1A;&#x4E8B;&#x4EF6;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x5373;&#x67D0;&#x4E9B;&#x7279;&#x5B9A;&#x5546;&#x4E1A;&#x4E8B;&#x4EF6;&#x7684;&#x5EA6;&#x91CF;&#x503C;&#x3002;
3. &#x4E00;&#x822C;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;&#x4E8B;&#x5B9E;&#x8868;&#x4E2D;&#x7684;&#x6570;&#x636E;&#x4E0D;&#x5141;&#x8BB8;&#x4FEE;&#x6539;&#xFF0C;&#x65B0;&#x7684;&#x6570;&#x636E;&#x53EA;&#x662F;&#x7B80;&#x5355;&#x5730;&#x6DFB;&#x52A0;&#x8FDB;&#x4E8B;&#x5B9E;&#x8868;&#x4E2D;&#x3002;
4. &#x53D1;&#x751F;&#x5728;&#x73B0;&#x5B9E;&#x4E16;&#x754C;&#x4E2D;&#x64CD;&#x4F5C;&#x578B;&#x4E8B;&#x4EF6;&#xFF0C;&#x5176;&#x4EA7;&#x751F;&#x7684;&#x53EF;&#x5EA6;&#x91CF;&#x6570;&#x503C;&#xFF0C;&#x5B58;&#x50A8;&#x7684;&#x8868;&#x7EDF;&#x79F0;&#x4E8B;&#x5B9E;&#x8868;&#x3002;&#x4F8B;&#x5982;&#x4EA4;&#x6613;&#x8868;

&#x4E8B;&#x5B9E;&#x8868;&#xFF1A;&#x5C31;&#x662F;&#x7ECF;&#x5E38;&#x53D1;&#x751F;&#x6570;&#x636E;&#x589E;&#x52A0;&#x7684;&#x8868;&#xFF0C;&#x800C;&#x4E14;&#x6570;&#x636E;&#x589E;&#x52A0;&#x7684;&#x91CF;&#x7279;&#x522B;&#x5927;&#xFF0C;&#x6BD4;&#x5982;&#x8BA2;&#x5355;&#x8868;&#xFF0C;&#x4EA4;&#x6613;&#x8868;&#xFF0C;&#x5404;&#x79CD;&#x6D41;&#x6C34;&#x8868;
&#x7279;&#x70B9;&#xFF1A;&#x4E8B;&#x5B9E;&#x8868;&#x7684;&#x5B57;&#x6BB5;&#x9664;&#x4E86;&#x6709;&#x7EF4;&#x5EA6;&#x4E3B;&#x952E;&#x5916;&#xFF0C;&#x5269;&#x4E0B;&#x7684;&#x90FD;&#x662F;&#x5EA6;&#x91CF;&#x5B57;&#x6BB5;&#xFF0C;&#x6BD4;&#x5982;&#x989D;&#x5EA6;&#xFF0C;&#x989D;&#x5EA6;&#x603B;&#x91CF;&#xFF0C;&#x5E73;&#x5747;&#x989D;&#x5EA6;&#x7B49;&#x3002;

       &#x8868;&#x4E2D;&#x7684;&#x6BCF;&#x4E00;&#x6761;&#x6570;&#x636E;&#xFF0C;&#x90FD;&#x8868;&#x793A;&#x53D1;&#x751F;&#x4E86;&#x4E00;&#x4E2A;&#x4E8B;&#x5B9E;(&#x53D1;&#x751F;&#x4E86;&#x4E8B;&#x4EF6;)

&#x4E8B;&#x5B9E;&#x8868;&#x53EF;&#x4EE5;&#x518D;&#x7EC6;&#x5206;&#xFF1A;
     &#x4E8B;&#x5B9E;&#x4E8B;&#x5B9E;&#x8868;
     &#x5468;&#x671F;&#x5FEB;&#x7167;&#x4E8B;&#x5B9E;&#x8868;
     &#x7D2F;&#x79EF;&#x5FEB;&#x7167;&#x4E8B;&#x5B9E;&#x8868;

3.6 ETL

&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4ECE;&#x5404;&#x6570;&#x636E;&#x6E90;&#x83B7;&#x53D6;&#x6570;&#x636E;&#x53CA;&#x5728;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x5185;&#x7684;&#x6570;&#x636E;&#x8F6C;&#x6362;&#x548C;&#x6D41;&#x52A8;&#x90FD;&#x53EF;&#x4EE5;&#x8BA4;&#x4E3A;&#x662F;ETL&#xFF08;&#x62BD;&#x53D6;Extra, &#x8F6C;&#x5316; Transfer, &#x88C5;&#x8F7D;Load&#xFF09;&#x7684;&#x8FC7;&#x7A0B;&#xFF0C;ETL&#x662F;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7684;&#x6D41;&#x6C34;&#x7EBF;

3.6.1 E

Extract&#x3001;&#x6570;&#x636E;&#x62BD;&#x53D6;&#xFF1A; &#x6307;&#x7684;&#x5C31;&#x662F;&#x5C06;&#x6E90;&#x6570;&#x636E;&#x5BFC;&#x5165;&#x5230;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E2D;&#x3002;
1. &#x62BD;&#x53D6;&#x65B9;&#x5F0F;&#xFF1A;
    -  &#x62C9;&#x53D6;&#xFF08;poll&#xFF09;,&#x6307;&#x7684;&#x662F;&#x6570;&#x4ED3;&#x4E3B;&#x52A8;&#x62C9;&#x53D6;&#x6E90;&#x6570;&#x636E;&#xFF0C; &#x8FD9;&#x662F;&#x6700;&#x5E38;&#x7528;&#x7684;&#x65B9;&#x5F0F;
    -  &#x63A8;&#x9001;&#xFF08;push&#xFF09;,&#x6307;&#x7684;&#x662F;&#x6E90;&#x6570;&#x636E;&#x65B9;&#x4E3B;&#x52A8;&#x628A;&#x6570;&#x636E;&#x5B58;&#x50A8;&#x5230;&#x6570;&#x4ED3;&#x91CC;&#xFF0C;&#x8FD9;&#x79CD;&#x65B9;&#x5F0F;&#x4E0D;&#x53EF;&#x53D6;&#xFF0C;&#x539F;&#x56E0;&#x662F;&#x6E90;&#x6570;&#x636E;&#x8FD8;&#x8981;&#x5355;&#x72EC;&#x5F00;&#x53D1;&#x4E00;&#x4E2A;&#x63A8;&#x9001;&#x673A;&#x5236;&#x3002;&#x4F1A;&#x5F71;&#x54CD;&#x6027;&#x80FD;
2. &#x62BD;&#x53D6;&#x7C7B;&#x578B;&#xFF1A;
    - &#x5168;&#x91CF;&#x5BFC;&#x5165;: &#x6570;&#x636E;&#x603B;&#x91CF;&#x5C0F;&#x3002;
    - &#x589E;&#x91CF;&#x5BFC;&#x5165;: &#x6570;&#x636E;&#x603B;&#x91CF;&#x5927;&#xFF0C;&#x5BFC;&#x5165;&#x4E0A;&#x4E00;&#x6B21;&#x5BFC;&#x5165;&#x540E;&#x7684;&#x53D1;&#x751F;&#x53D8;&#x5316;&#x7684;&#x6570;&#x636E;&#x3002;

3.6.2 T

Transfor&#x3001;&#x6570;&#x636E;&#x8F6C;&#x6362;&#xFF1A;
1. &#x6570;&#x636E;&#x8F6C;&#x6362;&#x662F;&#x5C06;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x91CD;&#x6784;&#x4EE5;&#x53CA;&#x6807;&#x51C6;&#x5316;&#xFF0C;&#x6D88;&#x9664;&#x6570;&#x636E;&#x7684;&#x4E0D;&#x4E00;&#x81F4;&#xFF0C;&#x5904;&#x7406;&#x7F3A;&#x5931;&#x6570;&#x636E;&#xFF0C;&#x8F6C;&#x6362;&#x6700;&#x4E3B;&#x8981;&#x7684;&#x4EFB;&#x52A1;&#x5C31;&#x662F;
&#x6570;&#x636E;&#x6E05;&#x6D17;&#x3002;
2. &#x6570;&#x636E;&#x6E05;&#x6D17;&#x662F;&#x5BF9;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x91CD;&#x65B0;&#x5BA1;&#x67E5;&#x548C;&#x6821;&#x9A8C;&#x7684;&#x8FC7;&#x7A0B;&#xFF0C;&#x76EE;&#x7684;&#x5728;&#x4E8E;&#x5220;&#x9664;&#x91CD;&#x590D;&#x4FE1;&#x606F;&#xFF0C;&#x7EA0;&#x6B63;&#x5B58;&#x5728;&#x7684;&#x9519;&#x8BEF;&#xFF0C;&#x5E76;&#x63D0;&#x4F9B;&#x6570;&#x636E;&#x4E00;&#x81F4;&#x6027;&#x3002;&#x6211;&#x4EEC;&#x8BF4;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x7684;&#x6570;&#x636E;&#x6E90;&#x662F;&#x591A;&#x4E2A;&#x4E1A;&#x52A1;&#x7CFB;&#x7EDF;&#xFF0C;&#x5404;&#x6765;&#x6E90;&#x7684;&#x6570;&#x636E;&#x5B58;&#x5728;&#x7740;&#x5DEE;&#x5F02;&#x548C;&#x548C;&#x51B2;&#x7A81;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x6211;&#x4EEC;&#x6240;&#x8BF4;&#x7684;&#x810F;&#x6570;&#x636E;&#xFF0C;&#x6309;&#x7167;&#x4E00;&#x5B9A;&#x7684;&#x89C4;&#x5219;&#x5904;&#x7406;&#x810F;&#x6570;&#x636E;&#x7684;&#x8FC7;&#x7A0B;&#x5C31;&#x662F;&#x6570;&#x636E;&#x6E05;&#x6D17;

3. &#x4E00;&#x822C;&#x7684;&#x6570;&#x636E;&#x6E05;&#x6D17;&#x6D41;&#x7A0B;&#x5982;&#x4E0B;&#xFF1A;
    -- &#x9884;&#x5904;&#x7406;
    -- &#x5EFA;&#x7ACB;&#x6807;&#x51C6;&#x5316;
    -- &#x53BB;&#x91CD;&#x5904;&#x7406;
    -- &#x5904;&#x7406;&#x9519;&#x8BEF;&#x503C;
    -- &#x5904;&#x7406;&#x7F3A;&#x5931;&#x503C;
    -- &#x683C;&#x5F0F;&#x5185;&#x5BB9;&#x6E05;&#x6D17;
    -- &#x903B;&#x8F91;&#x9519;&#x8BEF;&#x6E05;&#x6D17;
    -- &#x4FEE;&#x6B63;&#x77DB;&#x76FE;&#x5185;&#x5BB9;
    -- &#x975E;&#x9700;&#x6C42;&#x6570;&#x636E;&#x6E05;&#x6D17;
    -- &#x5173;&#x8054;&#x6027;&#x9A8C;&#x8BC1;

3.6.3 L

Load&#x3001;&#x6570;&#x636E;&#x88C5;&#x8F7D;
1. &#x9884;&#x88C5;&#x8F7D;&#xFF1A;  &#x4E00;&#x4E9B;&#x5E38;&#x91CF;&#x8868;&#xFF0C;&#x6BD4;&#x5982;&#x7EF4;&#x5EA6;&#x8868;&#x7684;&#x6570;&#x636E;&#x8981;&#x63D0;&#x524D;&#x8D2D;&#x4E70;&#xFF0C;&#x88C5;&#x8F7D;&#x5230;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E2D;
2. &#x521D;&#x59CB;&#x88C5;&#x8F7D;&#xFF1A;&#x5728;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x642D;&#x5EFA;&#x5B8C;&#x540E;&#xFF0C;&#x5BF9;&#x73B0;&#x6709;&#x7684;&#x4F01;&#x4E1A;&#x6570;&#x636E;&#x4E00;&#x5B9A;&#x6B21;&#x5BFC;&#x5165;&#x5230;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E2D;
3. &#x5B9A;&#x671F;&#x88C5;&#x8F7D;&#xFF1A;&#x65E5;&#x5E38;&#x4EA7;&#x751F;&#x7684;&#x65B0;&#x6570;&#x636E;&#xFF0C;&#x8FDB;&#x884C;&#x5B9A;&#x65F6;&#x7684;&#x5BFC;&#x5165;&#x5230;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x4E2D;

总结：数据仓库的整个流程其实就是ETL的流程

3.7 数据仓库建模

3.7.1 概念说明

数据仓库建模指的就是建表。

3.7.2 整个流程

&#x4E1A;&#x52A1;&#x5EFA;&#x6A21;&#x300B;&#x9886;&#x57DF;&#x6982;&#x5FF5;&#x5EFA;&#x6A21;&#x300B;&#x903B;&#x8F91;&#x5EFA;&#x6A21;&#x300B;&#x7269;&#x7406;&#x5EFA;&#x6A21;
     1.   &#x4E1A;&#x52A1;&#x5EFA;&#x6A21;&#xFF0C;&#x8FD9;&#x90E8;&#x5206;&#x5EFA;&#x6A21;&#x5DE5;&#x4F5C;&#xFF0C;&#x4E3B;&#x8981;&#x5305;&#x542B;&#x4EE5;&#x4E0B;&#x51E0;&#x4E2A;&#x90E8;&#x5206;&#xFF1A;

    &#x5212;&#x5206;&#x6574;&#x4E2A;&#x5355;&#x4F4D;&#x7684;&#x4E1A;&#x52A1;&#xFF0C;&#x4E00;&#x822C;&#x6309;&#x7167;&#x4E1A;&#x52A1;&#x90E8;&#x95E8;&#x7684;&#x5212;&#x5206;&#xFF0C;&#x8FDB;&#x884C;&#x5404;&#x4E2A;&#x90E8;&#x5206;&#x4E4B;&#x95F4;&#x4E1A;&#x52A1;&#x5DE5;&#x4F5C;&#x7684;&#x754C;&#x5B9A;&#xFF0C;&#x7406;&#x6E05;&#x5404;&#x4E1A;&#x52A1;&#x90E8;&#x95E8;&#x4E4B;&#x95F4;&#x7684;&#x5173;&#x7CFB;&#x3002;
    &#x6DF1;&#x5165;&#x4E86;&#x89E3;&#x5404;&#x4E2A;&#x4E1A;&#x52A1;&#x90E8;&#x95E8;&#x7684;&#x5185;&#x5177;&#x4F53;&#x4E1A;&#x52A1;&#x6D41;&#x7A0B;&#x5E76;&#x5C06;&#x5176;&#x7A0B;&#x5E8F;&#x5316;&#x3002;
    &#x63D0;&#x51FA;&#x4FEE;&#x6539;&#x548C;&#x6539;&#x8FDB;&#x4E1A;&#x52A1;&#x90E8;&#x95E8;&#x5DE5;&#x4F5C;&#x6D41;&#x7A0B;&#x7684;&#x65B9;&#x6CD5;&#x5E76;&#x7A0B;&#x5E8F;&#x5316;&#x3002;
    &#x6570;&#x636E;&#x5EFA;&#x6A21;&#x7684;&#x8303;&#x56F4;&#x754C;&#x5B9A;&#xFF0C;&#x6574;&#x4E2A;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x9879;&#x76EE;&#x7684;&#x76EE;&#x6807;&#x548C;&#x9636;&#x6BB5;&#x5212;&#x5206;&#x3002;
    2.   &#x9886;&#x57DF;&#x6982;&#x5FF5;&#x5EFA;&#x6A21;&#xFF0C;&#x8FD9;&#x90E8;&#x5206;&#x5F97;&#x5EFA;&#x6A21;&#x5DE5;&#x4F5C;&#xFF0C;&#x4E3B;&#x8981;&#x5305;&#x542B;&#x4EE5;&#x4E0B;&#x51E0;&#x4E2A;&#x90E8;&#x5206;&#xFF1A;

    &#x62BD;&#x53D6;&#x5173;&#x952E;&#x4E1A;&#x52A1;&#x6982;&#x5FF5;&#xFF0C;&#x5E76;&#x5C06;&#x4E4B;&#x62BD;&#x8C61;&#x5316;&#x3002;
    &#x5C06;&#x4E1A;&#x52A1;&#x6982;&#x5FF5;&#x5206;&#x7EC4;&#xFF0C;&#x6309;&#x7167;&#x4E1A;&#x52A1;&#x4E3B;&#x7EBF;&#x805A;&#x5408;&#x7C7B;&#x4F3C;&#x7684;&#x5206;&#x7EC4;&#x6982;&#x5FF5;&#x3002;
    &#x7EC6;&#x5316;&#x5206;&#x7EC4;&#x6982;&#x5FF5;&#xFF0C;&#x7406;&#x6E05;&#x5206;&#x7EC4;&#x6982;&#x5FF5;&#x5185;&#x7684;&#x4E1A;&#x52A1;&#x6D41;&#x7A0B;&#x5E76;&#x62BD;&#x8C61;&#x5316;&#x3002;
    &#x7406;&#x6E05;&#x5206;&#x7EC4;&#x6982;&#x5FF5;&#x4E4B;&#x95F4;&#x7684;&#x5173;&#x8054;&#xFF0C;&#x5F62;&#x6210;&#x5B8C;&#x6574;&#x7684;&#x9886;&#x57DF;&#x6982;&#x5FF5;&#x6A21;&#x578B;&#x3002;
    3.   &#x903B;&#x8F91;&#x5EFA;&#x6A21;&#xFF0C;&#x8FD9;&#x90E8;&#x5206;&#x7684;&#x5EFA;&#x6A21;&#x5DE5;&#x4F5C;&#xFF0C;&#x4E3B;&#x8981;&#x5305;&#x542B;&#x4EE5;&#x4E0B;&#x51E0;&#x4E2A;&#x90E8;&#x5206;&#xFF1A;

    &#x4E1A;&#x52A1;&#x6982;&#x5FF5;&#x5B9E;&#x4F53;&#x5316;&#xFF0C;&#x5E76;&#x8003;&#x8651;&#x5176;&#x5177;&#x4F53;&#x7684;&#x5C5E;&#x6027;
    &#x4E8B;&#x4EF6;&#x5B9E;&#x4F53;&#x5316;&#xFF0C;&#x5E76;&#x8003;&#x8651;&#x5176;&#x5C5E;&#x6027;&#x5185;&#x5BB9;
    &#x8BF4;&#x660E;&#x5B9E;&#x4F53;&#x5316;&#xFF0C;&#x5E76;&#x8003;&#x8651;&#x5176;&#x5C5E;&#x6027;&#x5185;&#x5BB9;
    4.   &#x7269;&#x7406;&#x5EFA;&#x6A21;&#xFF0C;&#x8FD9;&#x90E8;&#x5206;&#x5F97;&#x5EFA;&#x6A21;&#x5DE5;&#x4F5C;&#xFF0C;&#x4E3B;&#x8981;&#x5305;&#x542B;&#x4EE5;&#x4E0B;&#x51E0;&#x4E2A;&#x90E8;&#x5206;&#xFF1A;

    &#x9488;&#x5BF9;&#x7279;&#x5B9A;&#x7269;&#x7406;&#x5316;&#x5E73;&#x53F0;&#xFF0C;&#x505A;&#x51FA;&#x76F8;&#x5E94;&#x7684;&#x6280;&#x672F;&#x8C03;&#x6574;
    &#x9488;&#x5BF9;&#x6A21;&#x578B;&#x7684;&#x6027;&#x80FD;&#x8003;&#x8651;&#xFF0C;&#x5BF9;&#x7279;&#x5B9A;&#x5E73;&#x53F0;&#x4F5C;&#x51FA;&#x76F8;&#x5E94;&#x7684;&#x8C03;&#x6574;
    &#x9488;&#x5BF9;&#x7BA1;&#x7406;&#x7684;&#x9700;&#x8981;&#xFF0C;&#x7ED3;&#x5408;&#x7279;&#x5B9A;&#x7684;&#x5E73;&#x53F0;&#xFF0C;&#x505A;&#x51FA;&#x76F8;&#x5E94;&#x7684;&#x8C03;&#x6574;
    &#x751F;&#x6210;&#x6700;&#x540E;&#x7684;&#x6267;&#x884C;&#x811A;&#x672C;&#xFF0C;&#x5E76;&#x5B8C;&#x5584;&#x4E4B;&#x3002;

3.7.3 数仓建模的步骤也可以总结如下：

--1. &#x5206;&#x6790;&#x6570;&#x636E;&#x6E90;
    (1)&#x6839;&#x636E;&#x4E1A;&#x52A1;&#x786E;&#x5B9A;&#x4E3B;&#x9898;
    (2)&#x786E;&#x5B9A;&#x5404;&#x79CD;&#x6570;&#x636E;&#x6E90;&#xFF1A;RDBMS&#x3001;ACCESS&#x3001;CONTENT
--2:&#x8003;&#x8651;&#x5E73;&#x53F0;&#x548C;&#x5DE5;&#x5177;&#x7684;&#x9009;&#x62E9;:  hdfs&#xFF0C;hive&#x3001;hbase&#x3001;flume&#x3001;sqoop&#x3001;datax&#x7B49;
--3: &#x8BBE;&#x8BA1;&#x903B;&#x8F91;&#x6A21;&#x578B;
    (1) &#x8BBE;&#x8BA1;&#x8868;&#x6A21;&#x578B;
    (2) &#x8BBE;&#x8BA1;&#x6570;&#x636E;&#x4ED3;&#x5E93;&#x5206;&#x5C42;(kill inmon&#x8FD8;&#x662F;kim ball)&#x3001;&#x9009;&#x62E9;&#x6570;&#x636E;&#x6A21;&#x578B;(&#x661F;&#x578B;&#x6A21;&#x578B;&#x3001;&#x96EA;&#x82B1;&#x6A21;&#x578B;)
    (3) &#x8BBE;&#x8BA1;&#x547D;&#x540D;&#x89C4;&#x8303;
--4&#xFF1A;&#x5B9E;&#x65BD;&#x64CD;&#x4F5C;
    (1) &#x5EFA;&#x5E93;&#x5EFA;&#x8868;
    (2) &#x88C5;&#x8F7D;&#x6570;&#x636E;(&#x9884;&#x88C5;&#x8F7D;)
    (3) ETL&#x8FC7;&#x7A0B;(&#x5236;&#x5B9A;&#x91C7;&#x96C6;&#x65B9;&#x6848;&#x3001;&#x5236;&#x5B9A;&#x811A;&#x672C;(&#x589E;&#x91CF;&#x5BFC;&#x5165;&#x3001;&#x67E5;&#x8BE2;&#x3001;&#x589E;&#x52A0;&#x5206;&#x533A;)
    (4) &#x6700;&#x7EC8;&#x81EA;&#x52A8;&#x5316;ETL

 &#x6269;&#x5C55;&#xFF1A; &#x4E00;&#x4E2A;&#x9879;&#x76EE;&#x7684;&#x57FA;&#x672C;&#x6D41;&#x7A0B;
    1. &#x9879;&#x76EE;&#x8BBE;&#x8BA1;&#x62A5;&#x544A;(&#x591A;&#x65B9;&#x6848;)
    2. &#x9879;&#x76EE;&#x9700;&#x6C42;&#x5206;&#x6790;
    3. &#x9879;&#x76EE;&#x6A21;&#x5757;&#x5316;
    4. &#x5F00;&#x59CB;&#x5B9E;&#x65BD;(&#x6D4B;&#x8BD5;)
    5. &#x9879;&#x76EE;&#x7ED3;&#x675F;&#x3001;&#x4EA4;&#x63A5;&#x3001;&#x5B89;&#x88C5;&#x3001;&#x6D4B;&#x8BD5;&#x3001;&#x8FD0;&#x7EF4;

四、案例演示：销售案例

4.1 数据源分析

4.2 业务需求分析(指定指标)

4.3 平台的选择

mysql&#x3001;hdfs&#x3001;hive&#x3001;sqoop&#x3001;flume&#x3001;superset&#x3001;kylin&#x7B49;

4.4 设计逻辑模型

1）设置时间维度表、抽象出来地域维度表

2）选择kimball架构体系，选择数据模型(星型模型、雪花模型)

比如，选择雪花模型

3）设计分层名称规范

&#x7535;&#x5546;&#x4E3B;&#x9898;&#xFF1A;
      &#x5E93;&#x540D;&#xFF1A;ods_tel
           dwd_tel
           dws_tel
           dm_tel
           dim_tel
      &#x8868;&#x540D;&#xFF1A;
           ods_tel.ods_sales_order
           ...........

           dim_tel.dim_product
           dim_tel.dim_date
           dim_tel.dim_customer
           dim_tel.dim_area
           .......

           dwd_tel.dwd_sales_order
           .........

           dws_tel.dws_sales_order_day&#xFF08;.....&#xFF09;
           ......

           dm_tel.dm_sales_order_final()

4.5 数仓建模实施

4.5.1 平台搭建、采集数据

hdfs,hive,sqoop,flume&#x7B49;

4.5.2 数仓的构建

一般选择创建hive表，ods层的数据一般都是textfile，其他层的数据一般都是parquet格式

ods层：

create database if not exists ods_tel;
use ods_tel;
create table if not exists ods_sales_order(
......

)
parititioned by(.....) clustered by() into 4 buckets....

row format delimited
fields teminated by ","
stored as textfile;

&#x5176;&#x4ED6;&#x8868;&#x5982;&#x662F;

dim层：

create database if not exists dim_tel;
use dim_tel;

create table if not exists dim_tel.dim_product(
......

)
row format delimited
fields teminated by ","
stored as parquet;

&#x5176;&#x4ED6;&#x8868;&#x5982;&#x662F;

dwd层：

create database if not exists dwd_tel;
use dwd_tel;

create table if not exists dwd_tel.dwd_sales_order(
......

)
row format delimited
fields teminated by ","
stored as parquet;

&#x5176;&#x4ED6;&#x8868;&#x5982;&#x662F;

dws层：

create database if not exists dws_tel;
use dws_tel;

create table if not exists dws_tel.dws_sales_order_day(
&#x591A;&#x4E2A;&#x7EF4;&#x5EA6;&#x5B57;&#x6BB5;&#xFF0C;
day,
&#x591A;&#x4E2A;&#x5EA6;&#x91CF;&#x5B57;&#x6BB5;&#xFF0C;
)
row format delimited
fields teminated by ","
stored as parquet;

&#x5176;&#x4ED6;&#x8868;&#x5982;&#x662F;

dm层：

create database if not exists dm_tel;
use dm_tel;

create table if not exists dm_tel.dm_sales_order_final(
&#x591A;&#x4E2A;&#x7EF4;&#x5EA6;&#x5B57;&#x6BB5;&#xFF0C;
&#x591A;&#x4E2A;&#x5EA6;&#x91CF;&#x5B57;&#x6BB5;&#xFF0C;
)
row format delimited
fields teminated by ","
stored as parquet;

&#x5176;&#x4ED6;&#x8868;&#x5982;&#x662F;

(=-=,元旦假期过的是真的快,一眨眼三天时间就过去了,现在开始慢慢补文章,过几天会发一个完整版的项目文档上来,大家可以提提意见!)

Original: https://blog.csdn.net/qq_48654729/article/details/122308576
Author: 改个昵称就有这么难吗
Title: 2022-01-04 迈向程序猿的第五十九步

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/699913/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Android R系统aidl文件怎么对应的java文件找不到了?

Android系列博客沉寂很久了，很久了！不是我已经离开了江湖，而是最近忙着给OpenHarmony鸿蒙小系统，标准系统而给耽误了。这不趁着这两天有点空闲时间，准备调试下Andro…

人工智能 2023年6月28日
0098
PyTorch实现PPO代码

原理：Proximal Policy Optimization近端策略优化（PPO）视频：Proximal Policy Optimization (PPO) is Easy Wi…

人工智能 2023年7月21日
0070
python金融风控评分卡模型和数据分析(加强版)-收藏

信用评分卡信用评分是指根据银行客户的各种历史信用资料，利用一定的信用评分模型，得到不同等级的信用分数，根据客户的信用分数，授信者可以通过分析客户按时还款的可能性，据此决定是否给予授…

人工智能 2023年7月15日
0065
使用C++ OpenCV实现椭圆区域检测与Aruco码的生成与检测并估计位姿

前景概要很多机器视觉的定位与识别场景，如无人车、无人机，都会用 Aruco码或特定的标志物来实现，Aruco码的优点在于，xxxx(自行搜索)。对于像在低成本轻量级的无…

人工智能 2023年6月19日
0081
可变形卷积（DCN）

可变形卷积即DCN（全称为Deformable Conv）提出于ICCV 2017的一篇文章: Deformable Convolutional Networks 论文paper地…

人工智能 2023年7月25日
0088
Transformer论文翻译

Attention Is All You Need word版本需要word版本的点赞，收藏，评论邮箱哦，整理不易，谢谢大家！ ; 摘要主流的序列转换模型基于复杂的卷积神经网络…

人工智能 2023年5月28日
00120
基于MATLAB的车道线识别、自动驾驶识别

使用单目相机的视觉感知这个例子展示了如何构建一个能够进行车道边界和车辆检测的单眼摄像机传感器仿真。该传感器将在车辆坐标系中报告这些检测结果。在本例中，您将了解自动驾驶工具箱™使用…

人工智能 2023年5月28日
0050
用普通摄像头测量距离

近年来，由于无人机、无人车等技术的不断成熟，需要用到实时测距的场所也越来越多，如定位，避障，测速等，相比于其他测距方法，单目测距是利用一个摄像头进行视频拍摄，在图像中找到待测物体。…

人工智能 2023年5月26日
00113
机器学习之CART树

CART树 1、Cart树介绍 2、Cart树生成 3、回归树 4、分类树 * 4.1 分类树原理 4.2 分类树算法步骤 4.3 案例 5、Cart树总结 1、Cart树介绍分…

人工智能 2023年6月18日
0077
macOS：实现声音内录不用其它App

macOS：实现声音内录不用其它App 目前市场上有一些实现此类功能的 app，比如：Github 上的blackhole，以及 loopback，audio hijack，和…

人工智能 2023年5月27日
0085
【目标检测】YOLOv7理论简介+实践测试

概述 YOLOv7由YOLOv4的作者团队提出，其论文一作也是YOLOR的作者。论文的风格也和YOLOR一样，比较难懂，因此这里的理论部分也不做仔细研究，仅对论文提出的几个创新点进…

人工智能 2023年7月10日
0083
Tensorflow入门–运算

任务描述：本关任务：编写一个函数，该函数有四个零阶Tensor参数，要求该函数使用Tensorflow的API先对它们两两求和，然后对和进行乘积计算。编程要求：根据提示在右侧…

人工智能 2023年5月25日
0061
【Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech 论文阅读】

引言不考虑前端文本处理的情况下，语音合成 (text-to-Speech, TTS) 的主要建模过程被简化为两个主要阶段。第一阶段：将前端文本处理得到的规范文本序列转换为中间特征表…

人工智能 2023年5月23日
0090
时序知识图谱嵌入模型DE-Distmult代码解读

de_distmult.py dataset:经过dataset.py读取后得到的全部数据集信息： all_facts_as_tuples：包含训练集，验证集，测试集全部四元组，以…

人工智能 2023年5月27日
0077
PyTorch实战案例（一）——利用PyTorch实现线性回归算法（基础）

目录 * – 一、案例描述 – 二、代码详解 – + 2.1 根据直线方程构造数据集 + 2.2 构建数据迭代器 + 2.3 构建神经网络层并进…

人工智能 2023年7月23日
0063
命令行运行Python脚本时传入参数

方法1. 在命令行运行Python脚本时，传入参数，并根据参数做相应动作。先来一个简单的—把命令行输入的参数打印出来。 Step1: 在linux中，建立名字为 t1…

人工智能 2023年7月5日
0049

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30