电商数仓笔记1_用户行为采集（数据仓库概念，项目需求及架构设计，数据生成模块）

2023年7月16日下午7:08 • 人工智能 • 阅读 44

电商数仓

一、数据仓库概念
二、项目需求及架构设计
1、项目需求分析
2、项目框架
（1）技术选型
（2）系统数据流程设计
（3）框架版本选型
（4）服务器选型
（5）集群规模
（6）集群资源规划设计
3、数据生成模块
（1）目标数据
（1.1）页面
（1.2）事件
（1.3）曝光
（1.4）启动
（1.5）错误
（2）数据埋点
（2.1）主流埋点方式
（2.2）埋点数据上报时机
（2.3）埋点数据日志结构
（3）服务器和JDK准备
（3.0）服务器准备
（3.1）编写集群分发脚本xsync
（3.2）SSH无密登录配置
（3.3）JDK准备
（3.4）环境变量配置说明
（4）模拟数据
（4.1）使用说明
（4.2）集群日志生成脚本

一、数据仓库概念

数据仓库（ Data Warehouse ），是为企业制定决策，提供数据支持的。可以帮助企业，改进业务流程、提高产品质量等。
数据仓库的输入数据通常包括：业务数据、用户行为数据和爬虫数据等
业务数据：就是各行业在处理事务过程中产生的数据。比如用户在电商网站中登录、下单、支付等过程中，需要和网站后台数据库进行增删改查交互，产生的数据就是业务数据。业务数据通常存储在MySQL、Oracle等数据库中。
用户行为数据：用户在使用产品过程中，通过埋点收集与客户端产品交互过程中产生的数据，并发往日志服务器进行保存。比如页面浏览、点击、停留、评论、点赞、收藏等。用户行为数据通常存储在日志文件中。
爬虫数据：通常是通过技术手段获取其他公司网站的数据。不建议这样去做。

; 二、项目需求及架构设计

1、项目需求分析

; 2、项目框架

（1）技术选型

; （2）系统数据流程设计

（3）框架版本选型

1、框架发行版本选型

2、具体版本型号

; （4）服务器选型

（5）集群规模

; （6）集群资源规划设计

在企业中通常会搭建一套生产集群和一套测试集群。生产集群运行生产任务，测试集群用于上线前代码编写和测试。

1）生产集群
（1）消耗内存的分开
（2）数据传输数据比较紧密的放在一起（Kafka 、Zookeeper）
（3）客户端尽量放在一到两台服务器上，方便外部访问
（4）有依赖关系的尽量放到同一台服务器（例如：Hive和Azkaban Executor）

2）测试集群服务器规划

3、数据生成模块

（1）目标数据

我们要收集和分析的数据主要包括 *页面数据、事件数据、曝光数据、启动数据和错误数据。

（1.1）页面

页面数据主要记录一个页面的用户访问情况，包括访问时间、停留时间、页面路径等信息。

; （1.2）事件

事件数据主要记录应用内一个具体操作行为，包括操作类型、操作对象、操作对象描述等信息。

（1.3）曝光

曝光数据主要记录页面所曝光的内容，包括曝光对象，曝光类型等信息

; （1.4）启动

启动数据记录应用的启动信息

（1.5）错误

错误数据记录应用使用
过程中的错误信息，包括 错误编号及错误信息

; （2）数据埋点

（2.1）主流埋点方式

目前主流的埋点方式，有 代码埋点（前端/后端）、可视化埋点、全埋点三种。
代码埋点是通过调用埋点SDK函数，在需要埋点的业务逻辑功能位置调用接口，上报埋点数据。例如，我们对页面中的某个按钮埋点后，当这个按钮被点击时，可以在这个按钮对应的OnClick 函数里面调用SDK提供的数据发送接口，来发送数据。
可视化埋点只需要研发人员集成采集SDK，不需要写埋点代码，业务人员就可以通过访问分析平台的”圈选”功能，来”圈”出需要对用户行为进行捕捉的控件，并对该事件进行命名。圈选完毕后，这些配置会同步到各个用户的终端上，由采集SDK 按照圈选的配置自动进行用户行为数据的采集和发送。
全埋点是通过在产品中嵌入SDK，前端自动采集页面上的全部用户行为事件，上报埋点数据，相当于做了一个统一的埋点。然后再通过界面配置哪些数据需要在系统里面进行分析。

图例解析三种方式：

; （2.2）埋点数据上报时机

埋点数据上报时机包括两种方式。

方式一，在离开该页面时，上传在这个页面产生的所有数据（页面、事件、曝光、错误等）。优点，批处理，减少了服务器接收数据压力。缺点，不是特别及时。

方式二，每个事件、动作、错误等，产生后，立即发送。优点，响应及时。缺点，对服务器接收数据压力比较大。

本次项目采用方式一埋点。

（2.3）埋点数据日志结构

我们的日志结构大致可分为两类，一是普通页面埋点日志，二是启动日志。
普通页面日志结构如下，每条日志包含了，当前页面的页面信息，所有事件（动作）、所有曝光信息以及错误信息。除此之外，还包含了一系列公共信息，包括设备信息，地理位置，应用信息等，即下边的common字段。

（1）普通页面埋点日志格式

{
  "common": {                  -- 公共信息
    "ar": "230000",              -- 地区编码
    "ba": "iPhone",              -- 手机品牌
    "ch": "Appstore",            -- 渠道
    "is_new": "1",--是否首日使用，首次使用的当日，该字段值为1，过了24:00，该字段置为0。
    "md": "iPhone 8",            -- 手机型号
    "mid": "YXfhjAYH6As2z9Iq", -- 设备id
    "os": "iOS 13.2.9",          -- 操作系统
    "uid": "485",                 -- 会员id
    "vc": "v2.1.134"             -- app版本号
  },
"actions": [                     --动作(事件)
    {
      "action_id": "favor_add",   --动作id
      "item": "3",                   --目标id
      "item_type": "sku_id",       --目标类型
      "ts": 1585744376605           --动作时间戳
    }
  ],
  "displays": [
    {
      "displayType": "query",        -- 曝光类型
      "item": "3",                     -- 曝光对象id
      "item_type": "sku_id",         -- 曝光对象类型
      "order": 1,                      --出现顺序
      "pos_id": 2                      --曝光位置
    },
    {
      "displayType": "promotion",
      "item": "6",
      "item_type": "sku_id",
      "order": 2,
      "pos_id": 1
    },
    {
      "displayType": "promotion",
      "item": "9",
      "item_type": "sku_id",
      "order": 3,
      "pos_id": 3
    },
    {
      "displayType": "recommend",
      "item": "6",
      "item_type": "sku_id",
      "order": 4,
      "pos_id": 2
    },
    {
      "displayType": "query ",
      "item": "6",
      "item_type": "sku_id",
      "order": 5,
      "pos_id": 1
    }
  ],
  "page": {                       --页面信息
    "during_time": 7648,        -- 持续时间毫秒
    "item": "3",                  -- 目标id
    "item_type": "sku_id",      -- 目标类型
    "last_page_id": "login",    -- 上页类型
    "page_id": "good_detail",   -- 页面ID
    "sourceType": "promotion"   -- 来源类型
  },
"err":{                     --错误
"error_code": "1234",      --错误码
    "msg": "***********"       --错误信息
},
  "ts": 1585744374423  --跳入时间戳
}

（2）启动日志格式

启动日志结构相对简单，主要包含 *公共信息，启动信息和错误信息。

{
  "common": {
    "ar": "370000",
    "ba": "Honor",
    "ch": "wandoujia",
    "is_new": "1",
    "md": "Honor 20s",
    "mid": "eQF5boERMJFOujcp",
    "os": "Android 11.0",
    "uid": "76",
    "vc": "v2.1.134"
  },
  "start": {
    "entry": "icon",         --icon手机图标  notice 通知   install 安装后启动
    "loading_time": 18803,  --启动加载时间
    "open_ad_id": 7,        --广告页ID
    "open_ad_ms": 3449,    -- 广告总共播放时间
    "open_ad_skip_ms": 1989   --  用户跳过广告时点
  },
"err":{                     --错误
"error_code": "1234",      --错误码
    "msg": "***********"       --错误信息
},
  "ts": 1585744304000
}

（3）服务器和JDK准备

（3.0）服务器准备

分别安装hadoop102、hadoop103、hadoop104三台主机。
详情见Hadoop笔记

（3.1）编写集群分发脚本xsync

1）xsync集群分发脚本
（1）需求：循环复制文件到所有节点的相同目录下
（2）需求分析
①rsync命令原始拷贝：
rsync -av /opt/module root@hadoop103:/opt/
②期望脚本：
xsync要同步的文件名称
③说明：在/home/atguigu/bin这个目录下存放的脚本，atguigu用户可以在系统任何地方直接执行。
（3）脚本实现
①在用的家目录/home/atguigu下创建bin文件夹
[atguigu@hadoop102 ~]$ mkdir bin
②在/home/atguigu/bin目录下创建xsync文件，以便全局调用
[atguigu@hadoop102 ~]$ cd /home/atguigu/bin
[atguigu@hadoop102 ~]$ vim xsync
在该文件中编写如下代码

#!/bin/bash

if [ $# -lt 1 ]
then
  echo Not Enough Arguement!

  exit;
fi

for host in hadoop102 hadoop103 hadoop104
do
  echo ====================  $host  ====================

  for file in $@
  do

    if [ -e $file ]
    then

      pdir=$(cd -P $(dirname $file); pwd)

      fname=$(basename $file)
      ssh $host "mkdir -p $pdir"
      rsync -av $pdir/$fname $host:$pdir
    else
      echo $file does not exists!

    fi
  done
done

③修改脚本xsync具有执行权限
[atguigu@hadoop102 bin]$ chmod +x xsync
④测试脚本
[atguigu@hadoop102 bin]$ xsync xsync

（3.2）SSH无密登录配置

说明：这里面只配置了hadoop102、hadoop103到其他主机的无密登录；因为hadoop102未外配置的是NameNode，hadoop103配置的是ResourceManager，都要求对其他节点无密访问。
（1）hadoop102上生成公钥和私钥：
[atguigu@hadoop102 .ssh]$ ssh-keygen -t rsa
然后敲（三个回车），就会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）
（2）将hadoop102公钥拷贝到要免密登录的目标机器上
[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop102
[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop103
[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop104
（3）hadoop103上生成公钥和私钥：
[atguigu@hadoop103 .ssh]$ ssh-keygen -t rsa
然后敲（三个回车），就会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）
（4）将hadoop103公钥拷贝到要免密登录的目标机器上
[atguigu@hadoop103 .ssh]$ ssh-copy-id hadoop102
[atguigu@hadoop103 .ssh]$ ssh-copy-id hadoop103
[atguigu@hadoop103 .ssh]$ ssh-copy-id hadoop104

（3.3）JDK准备

1）卸载现有JDK（3台节点）
[atguigu@hadoop102 opt]# sudo rpm -qa | grep -i java | xargs -n1 sudo rpm -e –nodeps

[atguigu@hadoop103 opt]# sudo rpm -qa | grep -i java | xargs -n1 sudo rpm -e –nodeps

[atguigu@hadoop104 opt]# sudo rpm -qa | grep -i java | xargs -n1 sudo rpm -e –nodeps
（1）rpm -qa：表示查询所有已经安装的软件包
（2）grep -i：表示过滤时不区分大小写
（3）xargs -n1：表示一次获取上次执行结果的一个值
（4）rpm -e –nodeps：表示卸载软件

2）用XShell工具将JDK导入到hadoop102的/opt/software文件夹下面

3）在Linux系统下的opt目录中查看软件包是否导入成功
[atguigu@hadoop102 software]# ls /opt/software/
看到如下结果：
jdk-8u212-linux-x64.tar.gz
4）解压JDK到/opt/module目录下
[atguigu@hadoop102 software]# tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/
5）配置JDK环境变量

（1）新建/etc/profile.d/my_env.sh文件
[atguigu@hadoop102 module]
添加如下内容，然后保存（:wq）退出

export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin
（2）让环境变量生效
[atguigu@hadoop102 software]$ source /etc/profile.d/my_env.sh

6）测试JDK是否安装成功
[atguigu@hadoop102 module]# java -version
如果能看到以下结果、则Java正常安装
java version “1.8.0_212”
7）分发JDK
[atguigu@hadoop102 module]$ xsync /opt/module/jdk1.8.0_212/
8）分发环境变量配置文件
[atguigu@hadoop102 module]$ sudo /home/atguigu/bin/xsync /etc/profile.d/my_env.sh
9）分别在hadoop103、hadoop104上执行source
[atguigu@hadoop103 module]$ source /etc/profile.d/my_env.sh
[atguigu@hadoop104 module]$ source /etc/profile.d/my_env.sh

（3.4）环境变量配置说明

Linux的环境变量可在多个文件中配置，如/etc/profile，/etc/profile.d/*.sh，~/.bashrc，~/.bash_profile等，下面说明上述几个文件之间的关系和区别。
bash的运行模式可分为login shell和non-login shell。
例如，我们通过终端，输入用户名、密码，登录系统之后，得到就是一个login shell。而当我们执行以下命令ssh hadoop103 command，在hadoop103执行command的就是一个non-login shell。
这两种shell的主要区别在于，它们启动时会加载不同的配置文件，login shell启动时会加载/etc/profile，~/.bash_profile，~/.bashrc。non-login shell启动时会加载~/.bashrc。 而在加载~/.bashrc（实际是~/.bashrc中加载的/etc/bashrc）或/etc/profile时，都会执行如下代码片段
因此不管是login shell还是non-login shell，启动时都会加载/etc/profile.d/*.sh中的环境变量。

; （4）模拟数据

（4.1）使用说明

1）将application.yml、gmall2020-mock-log-2021-01-22.jar、path.json、logback.xml上传到hadoop102的/opt/module/applog目录下
（1）创建applog路径
[atguigu@hadoop102 module]$ mkdir /opt/module/applog
（2）上传文件application.yml到/opt/module/applog目录

2）配置文件
（1）application.yml文件
可以根据需求生成对应日期的用户行为日志。
[atguigu@hadoop102 applog]$ vim application.yml
修改如下内容


logging.config: "./logback.xml"

mock.date: "2020-06-14"

mock.type: "log"

mock.url: "http://hdp1/applog"

mock:
  kafka-server: "hdp1:9092,hdp2:9092,hdp3:9092"
  kafka-topic: "ODS_BASE_LOG"

mock.startup.count: 200

mock.max.mid: 500000

mock.max.uid: 100

mock.max.sku-id: 35

mock.page.during-time-ms: 20000

mock.error.rate: 3

mock.log.sleep: 10

mock.detail.source-type-rate: "40:25:15:20"

mock.if_get_coupon_rate: 75

mock.max.coupon-id: 3

mock.search.keyword: "图书,小米,iphone11,电视,口红,ps5,苹果手机,小米盒子"

（2）path.json，该文件用来配置访问路径

根据需求，可以灵活配置用户点击路径。

[
    {"path":["home","good_list","good_detail","cart","trade","payment"],"rate":20 },
    {"path":["home","search","good_list","good_detail","login","good_detail","cart","trade","payment"],"rate":40 },
    {"path":["home","mine","orders_unpaid","trade","payment"],"rate":10 },
    {"path":["home","mine","orders_unpaid","good_detail","good_spec","comment","trade","payment"],"rate":5 },
    {"path":["home","mine","orders_unpaid","good_detail","good_spec","comment","home"],"rate":5 },
    {"path":["home","good_detail"],"rate":10 },
    {"path":["home"  ],"rate":10 }
]

(3）logback配置文件

可配置日志生成路径，修改内容如下

<?xml version="1.0" encoding="UTF-8"?>
<configuration>
    <property name="LOG_HOME" value="/opt/module/applog/log" />
    <appender name="console" class="ch.qos.logback.core.ConsoleAppender">
        <encoder>
            <pattern>%msg%n</pattern>
        </encoder>
    </appender>

    <appender name="rollingFile" class="ch.qos.logback.core.rolling.RollingFileAppender">
        <rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
            <fileNamePattern>${LOG_HOME}/app.%d{yyyy-MM-dd}.log</fileNamePattern>
        </rollingPolicy>
        <encoder>
            <pattern>%msg%n</pattern>
        </encoder>
    </appender>

    <!-- 将某一个包下日志单独打印日志 -->
    <logger name="com.atgugu.gmall2020.mock.log.util.LogUtil"
            level="INFO" additivity="false">
        <appender-ref ref="rollingFile" />
        <appender-ref ref="console" />
    </logger>

    <root level="error"  >
        <appender-ref ref="console" />
    </root>
</configuration>

3）生成日志
（1）进入到/opt/module/applog路径，执行以下命令
[atguigu@hadoop102 applog]$ java -jar gmall2020-mock-log-2021-01-22.jar
（2）在/opt/module/applog/log目录下查看生成日志
[atguigu@hadoop102 log]$ ll

（4.2）集群日志生成脚本

在hadoop102的/home/atguigu目录下创建bin目录，这样脚本可以在服务器的任何目录执行。

[atguigu@hadoop102 ~]$ echo $PATH
/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/home/atguigu/.local/bin:/home/atguigu/bin

（1）在/home/atguigu/bin目录下创建脚本lg.sh
[atguigu@hadoop102 bin]$ vim lg.sh
（2）在脚本中编写如下内容

#!/bin/bash
for i in hadoop102 hadoop103; do
    echo "========== $i =========="
    ssh $i "cd /opt/module/applog/; java -jar gmall2020-mock-log-2021-01-22.jar >/dev/null 2>&1 &"
done

注：
①/opt/module/applog/为jar包及配置文件所在路径
②/dev/null代表Linux的空设备文件，所有往这个文件里面写入的内容都会丢失，俗称” 黑洞“。
标准输入0：从键盘获得输入 /proc/self/fd/0
标准输出1：输出到屏幕（即控制台） /proc/self/fd/1
错误输出2：输出到屏幕（即控制台） /proc/self/fd/2
（3）修改脚本执行权限
[atguigu@hadoop102 bin]$ chmod u+x lg.sh
（4）将jar包及配置文件上传至hadoop103的/opt/module/applog/路径
（5）启动脚本
[atguigu@hadoop102 module]$ lg.sh
（6）分别在hadoop102、hadoop103的/opt/module/applog/log目录上查看生成的数据
[atguigu@hadoop102 logs]$ ls
app.2020-06-14.log
[atguigu@hadoop103 logs]$ ls
app.2020-06-14.log

Original: https://blog.csdn.net/weixin_60440795/article/details/126145871
Author: 明灭18
Title: 电商数仓笔记1_用户行为采集（数据仓库概念，项目需求及架构设计，数据生成模块）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/697042/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

讯飞AIUI智能机器人5—–让器理解你（语音技术综合应用）

🍖🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖…

人工智能 2023年5月27日
0092
Autosar MCAL软件架构基本概念

MCAL 架构介绍 Autosar整体架构图如下所示： MCAL是MicroController Abstraction Layer（微控制器抽象层）的缩写。如下图所示，MCAL位…

人工智能 2023年6月26日
0085
YoloX引入注意力机制，CIoU、DIoU，DW卷积

本文以Bubbliiing的YoloX代码进行注意力机制的增加，原博文参考以下。 https://blog.csdn.net/weixin_44791964/article/det…

人工智能 2023年6月16日
0094
Transformer课程第39章：面向Knowledge-intensive任务的Transformer模型RAG的架构及完整源码实现

1，为何Transformer网络能够存储factual knowledge信息？ 2，pretrained dense retrieval数学原理分析 3，sequence-to…

人工智能 2023年5月30日
0085
28. 找出字符串中第一个匹配项的下标 KMP C++

给你两个字符串 haystack 和 needle ，请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标（下标从 0 开始）。如果 needle 不是…

人工智能 2023年6月28日
0068
2022年10大最流行的数据分析工具，掌握3种算你厉害

目录 1、SAS BA 2、QlikView 3、Board 4、Splunk 5、Sisense 6、Microstrategy 7、KNIME 8、Dundas BI 9、TI…

人工智能 2023年6月11日
0084
【推荐算法】协同过滤算法代码（pyspark | ALS）

【推荐算法】协同过滤算法介绍_MachineCYL的博客-CSDN博客上文介绍了协同过滤算法的原理，接下来我介绍一下协同过滤算法的代码实现。下面我就开始介绍用pyspark中的…

人工智能 2023年6月16日
0091
AttributeError: module ‘cv2.cv2‘ has no attribute ‘face‘

AttributeError: module ‘cv2.cv2’ has no attribute ‘face’解决方案今天运行一…

人工智能 2023年6月18日
00101
YOLO算法创新改进系列项目汇总（入门级教程指南）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月30日
0088
Multi-View Domain Adapted Sentence Embeddings for Low-Resource Unsupervised Duplicate Question Detec

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
00111
统计学基础专栏04—回归和预测

0、术语 0.4、回归和预测响应变量想要预测的变量。自变量用于预测响应的变量。记录一个表示特定个体或实例的向量，由因子和结果值组成。截距回归线的截距，即当 X = …

人工智能 2023年6月17日
0088
#gStore-weekly | gStore应用之应急指挥知识图谱服务平台

gStore及生态产品由于完善的功能和卓越的性能已应用于金融、医疗、政府大数据、公安、纪检、应急指挥、军工、智能问答等多个领域，在多个互联网和人工智能公司的图数据和知识图谱项目进行…

人工智能 2023年6月10日
00129
Swin Transformer理解

最近在阅读transformer，也作个笔记，供学习使用。希望阅读者有CNN的基础，如YOLO,MobileNets，ResNet等,并且一定要先阅读ViT。不然读起来可能比较吃力…

人工智能 2023年6月25日
0082
Qlib教程——基于源码（二）本地数据保存与加载

文章目录 1. Data Preparation * 1.1 Qlib 数据 1.2 CSV数据 2. Data API * 2.1 数据检索示例 2.2 关于 qlib.init…

人工智能 2023年6月19日
0080
ROS机械臂 Movelt 学习笔记4 | Move Group 接口 Python

Python 的使用总是比 C++ 简单许多，Move Group 的 Python 接口更为便捷，也为使用者提供了很多用于操纵机器人和机械臂的函数，能够和 C++ 接口实现相同的…

人工智能 2023年6月4日
0089
Charles抓包微信小程序数据

本文中使用的是mac上的抓包工具charles进行抓包，手机是apple11。 Charles 上的设置：要截取 iPhone 上的网络请求，我们首先需要将 Charles 的代…

人工智能 2023年5月30日
00168

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

电商数仓笔记1_用户行为采集（数据仓库概念，项目需求及架构设计，数据生成模块）

电商数仓

大家都在看