3.1数据基本分析(实验)
任务介绍:
本小节实训我们要练习 SPSS Modeler当中的 数据基本分析部分。
Modeler数据基本分析包括5大块内容:
1.数据质量分析
2.描述性统计分析
3.探索性分析
4.二分类变量相关性分析
5.变量的重要性分析
学习相关知识
-
数据质量探索
-
数据挖掘的首要任务是对数据质量进行考察。对数据质量的考察可通过”输出”选项卡中的数据审核节点实现。数据审核节点还可以计算变量的基本统计量并绘制相应的柱形图和直方图等。
-
基本描述分析
-
对数值型变量,应计算基本描述统计量,以准确把握变量的集中趋势和离散程度。
可以 用”数据审核”节点,也可以用”statistics”节点
-
探索性分析
-
统计建模常常要求变量服从正态分布,如果变量不服从正态分布,应对变量进行适当的转换处理。SPSS Modeler提供了直观的图形方式用于变量的转换,大大缩短了变量分布探索的时间。
-
对各种费用变量应做怎样的转换才能使其接近正态分布?
-
二分类变量相关分析
-
对二分类型相关性进行研究具有重要意义。
- 二分类型相关性研究可以从图形分析入手,然后采用数值方法进行分析。
1.二分类型相关性的图形分析
(1)条形图
- 选择”图形”选项卡中的分布节点,并将其连接到数据流的恰当位置上,在分布节点处单击鼠标右键,选择快捷菜单中的”编辑”选项,进行参数设置。
(2)网状图
- 网状图是一种能更生动和直观地展示两个或多个分类型变量(尤其适合多个分类型变量)相关性特征的图形。
- 选择”图形”选项卡中的网络节点,并将其连接到数据流的恰当位置上,在网络节点处单击鼠标右键,选择快捷菜单中的”编辑”选项,进行参数设置。
2.二分类型相关性的数值分析
用”矩阵”节点,做出交叉表
- 图形分析并不能准确反映二分类型之间精确的相关程度,因此进行数值分析是必要的。数值分析通常采用的方法是列联分析。
- 列联分析包括两个步骤:第一步,计算二分类型的列联表;第二步,分析列联表中行、列变量之间的相关性。
结论的分析主要看卡方、自由度和概率,假设列变量和行变量之间独立,如果概率
Original: https://blog.csdn.net/m0_51928351/article/details/124590558
Author: 身边都是巨佬的菜王DoubleF
Title: 3.SPSS Modeler数据基本分析笔记
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/694155/
转载文章受原作者版权保护。转载请注明原作者出处!