Tableau是一个比较昂贵的软件,免费试用也只有2周,教育使用可以一年
- 一,数据获取
* - 观测
– - 实验
–- 假设
- 验证
+ - 设计A/B测试获取数据
- 应用
– - 二,Tableau介绍
* - 全世界的可视化大神,都在基于Tableau进行可视化创作
– - 和其他数据工具相比👉也有明显的优势
- Tableau/PowerBI/FineBI到底应该学哪个
- 三,下载,安装,注册,试用,激活,密钥管理,学生账号申请全攻略
- 四,数据连接
* - EXCEL
– - 五,数据可视化原理
* - 目的
- 形式:维度和度量
- 度量👉映射图形
– - 可视化字典(Visual Dictionary)
- 维度👉负责区分
- 可视化四大金刚:散点图,柱状图,饼图,折线图
- 六,具体若干图表的详细制作
* - 行与列
- 图表类型转化:工作区左边的标记标签页
- 视图:图表的伸缩,zoom in or out
- 边操作边理解:
- 有轴图形和无轴图形
– - 表
- 图表数据的下钻
- 筛选器
- 编辑表计算
- 七,数据分析(使用TABLEAU分析)
* - 直方图(数据桶)
- 地图
– - 八,BI仪表盘搭建
* - 数据可视化原则
- BI仪表盘搭建
–
一,数据获取
观测
API接口
数据的存储方式:数据库
各种数据库:
; 实验
假设
所有未经事实数据验证的想法都是假设
所有的论点除了事实就是假设
验证
设计A/B测试获取数据
- 实验目标
- 实验假设(不一定只有一个)
- 实验过程
- 实验结果
- 决策计划
应用
- 流程拆解法
- 二分法
- 乡限拆解法
- 杜邦分析法
- AARRR
- PEST
- RFM
- SWOT
- 5W1H
数据应用于算法:
- 为算法设定明确的业务目标👉为算法提供高质量的数据👉判断算法是否真的创造了实际价值👉帮助业务更好地使用算法
二,Tableau介绍
全世界的可视化大神,都在基于Tableau进行可视化创作
我们可以在Tableau 的可视化社区学习各种顶尖的可视化方案
- TABLEAU可视化学习平台
- 数据可视化整体分为四大流派
- 艺术流:旨在探索更多的数据表达方法,相当于用数据作画,简直就是艺术品
- 分析法 :
- 信息全面:
- 实战流
- 为实际的业务场景服务,追求数据的全面性和逻辑,属于能用就行
- 一般来说,一线的分析师不会有时间去做美化(除非你工作不饱和)
但是可视化只是Tableau的基操
数据赋能和数据探索才是Tableau的正确打开方式
; 数据赋能
- 让业务一线也可以轻松使用最新数据
分析师可以直接将数据看板发布到线上
自动更新看板
线上修改图表
邮箱发送数据
设置数据预警
数据探索
- 通过统计分析和数据可视化,
通过统计分析和数据可视化,从数据发现问题,用数据验证假设
支持亿万级的数据的连接和处理
自由地对字段进行各种计算
拖拽就可以轻松制作图表
数据可以随意聚合下钻(或者聚合)
图表类型可以灵活转换
内置算法智能建模
和其他数据工具相比👉也有明显的优势
Python/R
- 学习难度高
功能强大,数据处理,描述性分析和算法建模都能做
可以重复执行和自动化
Tableau/PowerBI/FineBI到底应该学哪个
三,下载,安装,注册,试用,激活,密钥管理,学生账号申请全攻略
四,数据连接
EXCEL
- 注意:csv文件要点击这里的 文本文件
; 连接本地数据文件
具体如何连接
或者在工具栏点击
文件👉打开👉选择对应的本地文件
进入如下界面:
- 你可以从左边的资源管理器( library),直接拖动到右边的工作区
- 再来拖拽第三个表来继续关联
; 连接方式:实时和数据提取
分别代表:
实时
- 数据与图表之间存在动态链接
- 方便你去实时查看自己改动的数据的样子
数据提取
- 相当于TABLEAU把数据自己存起来,一般选择这种,因为更适合大数据的情况
点击了解更多信息来查看提取数据的更多操作细则
; TABLEAU文件的封装格式与保存
ctrl+S保存
封装名为:twb(不带数据)或者twbx(有内置数据)
筛选器
- 在上面图中亏内有小伙伴看见了筛选器:
- 顾名思义,就是筛选数据的,被筛选的数据只是被隐藏了而非删除了
- 要想显示全部的数据,只需要把全部的筛选器关闭即可
- 筛选器不止可以创建一个,且不同的筛选器之间优先级不同
选择字段👉选择条件(等于/不等于/)
引入数据之后更改字段的信息
更改数据类型
; 绘制图表时更改数据类型
可以直接右击维度元素,复制,再更改复制出来的副本维度元素的数据类型
字段的重命名/别名
- 点击下拉小三角发现这些功能
; 字段的自定义拆分
- 拆分就是会根据你指定的分割符将字符串分割,然后在全部的列之后添加一列拆分出来的结果
五,数据可视化原理
- 点击工作表来到工作表
; 目的
数据可视化的目的是为了能一眼看出一张图表中能突出显示的数据,比如极值,均值,程度,概率等。。。
形式:维度和度量
- 度量映射图形
- 维度负责区分
- 度量往往是连续的,离散往往是离散的
- 如下图,智能的TABLEAU会自动判断,一个表中的度量和维度,虚线以上的是维度,虚线以下是度量:
; 度量👉映射图形
- 一般是由数字组成的变量
- 例如:成交金额,用户数,点击量
- 数值的变量可以进行计算,并基于计算结果的大小表示图表的面积大小,条形长短,颜色深浅等可以量化的视觉元素
位置
; 长度
角度
方向
形状
面积和体积
颜色和深浅(热力图)
以上六点都属于视觉元素,但是表达效果又有强弱之分
可视化字典(Visual Dictionary)
可视化字典类似与图例
维度👉负责区分
- 类别变量
可视化四大金刚:散点图,柱状图,饼图,折线图
- 掌握上面四种就够了
六,具体若干图表的详细制作
行与列
如上图:直接拖动即可生成最简单的图表
- 注意:按住ctrl可以复制拖动
; 图表类型转化:工作区左边的标记标签页
视图:图表的伸缩,zoom in or out
; 边操作边理解:
* 多维度的图表中,各个维度之间有优先级关系
* 例如:如下两图对比
* 当然上面两图都是比较看起来费力的
* 不妨试试这样:
* 以上四图让我们得出一个重要的概念:
维度可以对图形进行比较随意的切分
是不是很精彩?后面更精彩:
- 气泡图 我们可以将日期拖动在标签上,把平台删除,把标记改为圆,再把GMV拖动在大小上
- 词云 在刚才的基础上,把标记改为文本,把日期拖动到文本上,就好了
有轴图形和无轴图形
饼图
; 南丁格尔玫瑰图
树地图
; 表
- 上面两种提到的貌似都不是我们想要的表:
- 试试把GMV性这样拖动:
👇
👇
图表数据的下钻
- 右击维度元素👉创建分层结构
- 然后把对应的维度元素放在新建的分层结构下面
再点击上图中红色的加号
👇
OR
; 筛选器
- 直接把元素拖动到筛选器里面可以直接形成筛选器
- 连续的度量和离散的维度对应的筛选器的筛选范围也是连续或者离散的
留下一个小问题:上图中选项中的百分比差异有什么作用
编辑表计算
; 七,数据分析(使用TABLEAU分析)
- 拖动图上显示出预测线,趋势线等的、
直方图(数据桶)
- 数据桶是形成直方图的重要依据
- 如何创建数据桶:右击任何一个度量元素然后选择👉创建👉数据桶
- 数据桶的宽度是最重要的参数
- 智能推荐里可以直接创建直方图
地图
右击经纬度等度量元素👉选择地理角色👉经度,维度,城市等
注意:
要把订单ID放在 维度元素列表中再拖动到详细信息上
订单的主键
-
在现在的地图上我们依然可以看到有一些过深的点
-
这些点过深是因为在同一个位置同一个时间有多笔外卖订单同时下来
- 所以我们需要创建一个能够区分不同订单的主键
左击这个小三角:
👇创建计算字段
👇起名叫做主键然后给他设定公式,下图中的向右小三角可以查看tableau支持的全部函数
公式依然可以不手敲而是选择拖动
- 但是拖谁进去不拖谁进去要经验判断
[用户id]+[下单日期时间 (复制)]+[配送地址eleme]+[订单id]
- 成品出炉:
八,BI仪表盘搭建
数据可视化原则
- 区分用户
– 高管
– 中管
– 数据分析基层 - 主次分明详略得当
– 选择视觉元素和颜色等 - 真实准确
– 坐标轴一定要从0开始
– 符合大众的趋势和审美
–适度原则
–尽量不要使用三维效果
– 五秒原则 :五秒看懂 - 恰到好处的说明
– 说明,图例,注释等
– 多了也不好 - 少就是多
BI仪表盘搭建
仪表盘搭建原则
明确仪表盘主题
这个主题涉及到哪些数据
数据重要性是如何
最适合数据的图表是哪种
- 对比
- 绝对值对比:折线图和柱状图
- 变化
- 没有累计关系:折线图,柱状图
- 有累计关系:面积图,堆积图
- 构成
- 对象少:环形图
- 对象多:树地图
- 分布
- 单变量分布:直方图
- 多变量分布:散点图,气泡图
仪表盘主题拆解
开发设计工作表
经营情况总览
突出显示的文字
经营数据详情:表格
- 将GMV拖动到文本上
- 将商家实收拖拽到GMV的数字上
- 将行的度量名称拖动到列
- 继续向度量值框内增加字段
- 添加日期筛选,拖动日期到筛选器上,选择日期范围
- 应用于使用相关数据源的所有项
- 最后成品展示:
; 每日营收数据:多轴折现图
- 右键日期👉选择自定义日期,选择天
拖动到列
- 再把度量值GMV拖动到行,再把商家实收拖动到数轴(如图)
- 最后成果
每日流量数据:双轴组合图
- 拖动日期(天)到列
- 拖动曝光人数到行
- 创建计算字段
- 计算进店率(进店人数/曝光人数)
- 更高数字格式为百分比
- 复制进店率设置成交率= 下单人数/曝光人数
- 再把成交率拖动到行
- 最终效果如下图所示
怎么变成双轴呢?
点击这里
ok!成品如下
- 点击同步轴可以让图表再次回归单轴
👇
👇点击颜色和透明度
修改为合适的条形图
; 新老客占比(环形图)
- 创建计算字段
- 新老客
--公式
IF IFNULL ([Order 90D],0) = 0 THEN '新客' --代表90天之内没有
ELSE
'老客'
END
- 如何添加鼠标悬停到扇形上面之后的更详细信息
- 将 计数orders拖到工具提示
- 在行一栏,双击,添加俩”0″,再双轴
- 这个操作相当于是给这个表复制了俩
- 然后来到第二个总和的标记
- 删除全部元素,大小改小,颜色改为白色
投放情况:散点图
- cpc总费用到列
- 商家实收到行
- 日期(复制)到详细信息和标签
这里的行列位置决定了趋势线的斜率含义:
举例说明比如上图中金黄色的趋势线,他的斜率是每单位CPC总费用产生的GMV,也就是 投放广告的投入产出比,从图中看的出”蛙小辣”的略高于”拌客”的
; 订单日期:面积图
- 下单日期到列👉连续天
- orders计数到行
- 下单日期时间到颜色👉离散小时
- 标记为区域
配送分布:地图
; 构思仪表盘布局
加亿点点细节
- 联动筛选:给所有的仪表盘里的图表点下图的按钮
- 修改一下边框,字体字号字色
Original: https://blog.csdn.net/csdn_okcheng/article/details/123618774
Author: Life lies in diligence.
Title: 【数据分析】第3天Tableau
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/599658/
转载文章受原作者版权保护。转载请注明原作者出处!