文章目录
- 0. 相关概念
- 1. 你怎么理解数据分析的?数据分析的主要流程是什么?
- 2. 指标的异常波动变化(例如日活下跌),你会如何分析?
* - 2.1 电商GMV下降该如何分析?
- 2.2 某APP DAU 增长的原因
- 3. 什么是A/B Test?其核心逻辑是什么?
* - 使用A/B Test评估算法效果
- 使用A/B Test 做效果评估
- 4. 如何理解漏斗分析?有哪些需要注意的点?
- 5. 你认为数据分析的价值如何体现
- 6. 什么是描述性统计?
- 7. 什么是分类?有哪些分类算法?
- 8. 什么是聚类?有哪些聚类算法?
- 9. 什么是回归?有哪些回归算法和应用场景?
-
相关概念
-
UV:Unique Visitor 独立访问
- PV:Page View 页面访问量
- 漏斗分析:Funnel Analysis
- CR:Conversion Rate 转化率
- CRV:Click Value Rate 点击率
- GMV:Gross Merchandise Volume 商品交易总额
- DAU :Daily Active User 日活用户
- MAU Monthly Active User 月活用户
- ARPU:Average Revenue Per User 用户用户收入
- 留存率
- 复购率
- 埋点
- 同比:环比增长速度 = (本期数 – 上期数)/ 上期数 * 100%,会受季节影响
- 环比:环比增长速度 = (本期数 – 同期数)/ 同期数 * 100%,可以排除季节影响
- 相关性:变量之间相互相关,没有先后顺序(比如:y=0.5x)
- 因果性:两个事件的发生有严格的先后顺序(变化可能延迟)
-
…
-
你怎么理解数据分析的?数据分析的主要流程是什么?
数据分析是 基于对业务的理解, 发现业务中的 问题_或潜在的 _增长点, 形成分析思路,并 利用数据分析工具进行分析, 给出结论和解决方案,并 协调各方推动方案落地, 解决问题, 回到业务中去的完整闭环。
数据分析的 主要流程:
- 观察现状
- 发现问题
- 寻找原因
- 预测未来
- 生成决策
- 推动落地
-
复盘
-
指标的异常波动变化(例如日活下跌),你会如何分析?
分为以下几个部分:
- ① 核查 数据是否可靠;确定指标 计算口径是否一致;确定是否是 市场的整体趋势
- ② 描述并分析变化 是否合理
- ③ 多维度拆解分析,相关分析等等方法进行分析,寻找造成变化的 相关因素
- ④ 进行回归分析/ 预测,还会持续多久?最坏到什么程度?
- ⑤ 风险/损失评估,下跌对产品的核心KPI有什么影响
- ⑥ 制定策略,挽回损失/避免下次发生
2.1 电商GMV下降该如何分析?
; 2.2 某APP DAU 增长的原因
- 什么是A/B Test?其核心逻辑是什么?
A/B Test是基于小样本的 后验方法,通过 设置对照组和实验组,对变量进行试验,通过假设检验对不同的结果进行检验,以 检验变量是否对结果造成显著影响,从而选取最合理的方法。
其核心逻辑是通过随机合理分流,设置对照组和实验组,通过 控制变量法,在保证两组用户除待验证变量不同外,其他变量分布均一致。
使用A/B Test评估算法效果
; 使用A/B Test 做效果评估
- 如何理解漏斗分析?有哪些需要注意的点?
核心逻辑:分解和评估,将业务流程 分解为关键环节形成漏斗,通过相邻环节的转化率 定位问题环节。
常见漏斗有电商漏斗:首页-详情页-购物车-支付;还有用户生命周期AARRR;用户行为周期AIDMA
注意点:漏斗的各个环节一定是连续的,对应连续的业务流程
一般以上一环节为基准,计算相邻两个环节的转化率,1-转化率即为流失率,但并不意味着最低的环节就是问题环节。
; 5. 你认为数据分析的价值如何体现
(价值不在与数据,而在于业务,以及背后的原因一家优化方向)
数据分析不是数据 统计,不能仅仅停留在输出一份报告,给出一些数字,要给出结论,讲清楚数据背后的 业务含义,数字的大小正负说明业务是好是坏,有多好多坏。
除明确数字背后的业务含义外,还要给出背后的 原因,好的方面是否可以复用 拓展,坏的方面原因是什么,应对方案是什么?要把方案推动落地到业务中执行,并且跟进执行的效果和复盘,螺旋上升,不断迭代优化。
- 什么是描述性统计?
描述性统计,是指运行图形以及概括性数据来描述数据特征。描述性统计主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形。
- 频数分析:在数据预处理部分可以检验异常值
- 数据 集中趋势分析:反应数据的一般水平,常用的有平均值、中位数和众数等
- 数据的 离散程度分析:反应数据之间的差异程度,主要有方差和标准差
- 数据的 分布:在统计分析中,通常要假设样本所属总体的分布属于正态分布,需要用到偏度和峰度两个指标来检查样本数据是否符合正态分布。
-
绘制 统计图:用图形的方式来表达数据,比用文字表达更清晰、更简明。
-
什么是分类?有哪些分类算法?
分类:学习已有分类样本的特征,对新特征进行划分,是一种 有监督的机器学习算法。
场景分类算法:
常见分类算:
- 逻辑回归
- SVM
- 贝叶斯
- 决策树
- KNN
-
XGBoost
-
什么是聚类?有哪些聚类算法?
聚类:对数据的特征进行抽象,通过算法将特征相似的对象划归为一类,是一种 无监督机器学习算法。
关键:
- 如何确定分类对的数量
- 特征如何选择
常用聚类算法:
- K-menas
- DBSCAN
应用场景:
- 互联网金融用户等级分类
-
垃圾邮箱分类
-
什么是回归?有哪些回归算法和应用场景?
回归分析:使用 线性回归方程对两个或多个变量之间的关系进行建模的一种分析方法。
本质:找到一条最合适的” 平均线“或者” 超平面“,使得这条线或者这个面两边的点分布均匀。
应用场景:
- 运营推广中,是不是花的钱越多,买的流量越多,品类越丰富,用户活跃度越高,那么,多到什么程度、大道到什么程度、丰富到什么程度、用户的活跃度最高,留存最高
- 智慧城市的交通,预测交通通塞程度:自变量:时间段、商业指数,住宅指数、城区指数、道路指数;因变量:两个连续信号灯之间道路的通行时间
(联想到费米问题)
常见回归算法:
- 线性回归
- lasso回归(拉索回归)
-
ridge回归(岭回归)
-
如何评估一场活动的效果
具体可以展开来讲,可以从以下几个方面来讲:
1、活动关键指标达成分析
2、活动关键流程漏斗分析
3、活动的渠道、用户分析
4、活动策略、节奏分析
参考:数据分析星球(小红书)
Original: https://blog.csdn.net/Robin_Pi/article/details/123421157
Author: Robin_Pi
Title: 数据分析面试:业务题
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/639693/
转载文章受原作者版权保护。转载请注明原作者出处!