参数检验和非参数检验（结合SPSS分析）

2023年7月15日下午6:35 • 人工智能 • 阅读 43

文章目录

假设检验
*
参数检验
–
非参数检验
–

假设检验

概念：是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。

根据样本来推断总体的原因：

总体数据不可能全部收集到。如：质量检测问题
收集到总体全部数据要耗费大量的人力和财力

假设检验包括：

参数检验
非参数检验

基本原理：利用小概率原理进行反证明。小概率事件在一次实验中不可能发生。

基本步骤：

根据检验的目标，对有待推断的总体参数或分布作一个零假设H 0 H_0 H 0
构造检验统计量,且该统计量服从某种已知分布.（卡方分布、t分布、F分布）
利用收集到的样本数据和基本假设计算检验统计量的值，并得到相应的相伴概率P值，即：检验统计量在某个特定的极端区域取值在H 0 H_0 H 0 成立时的概率.
给定显著性水平，如果概率P值小于用户给定的显著性水平α \alpha α(一般取0.05或0.01)，则拒绝零假设H 0 H_0 H 0 而接受备择假设。否则，不拒绝零假设H 0 H_0 H 0 （类似一种反证法）。 显著性水平指的是零假设正确却被错误拒绝的概率，一般取0.01或0.05，即零假设正确且正确接受的概率为99%或95%

参数检验

参数检验方法

平均值检验
单样本t检验
两独立样本t检验
两配对样本t检验

平均值检验

计算一个或多个自变量类别中因变量的子组平均值与相关的单变量统计，也可以通过比较两个样本的均值来判断两个总体的均值是否相等。零假设：两个样本的均值，没有显著差异。
实例
问题：判断男女生数学成绩的均值是否具有显著差异
操作：
点击>分析>比较平均值>平均值

将性别拖到自变量列表，数学成绩拖到因变量列表。

点击选项按钮，勾选Anova表和eta、线性相关度检验
（如果自变量的个数少于3或者含有字符串，则无法进行线性相关度检验，因此此选项也可不必勾选）

分析结果：

从ANOVA表中可以看出，显著性为0.36，大于0.05，说明男生和女生之间的数学成绩均值没有显著差异。

从相关性测量表中看出Eta的平方为0.02

; 单样本t检验

H 0 H_0 H 0 :u = u 0 u=u_0 u =u 0 ,总体均值与检验值之间不存在显著差异.

构造检验统计量.从样本均值的分布出发,即:~N ( u 0 , σ 2 / n ) N(u_0,\sigma^2/n)N (u 0 ,σ2 /n ).于是：

总体方差未知时构造t统计量t = D ‾ S / n t=\frac{\overline D}{S/\sqrt{n}}t =S /n D
D = X − u 0 D=X- u_0 D =X −u 0
t统计量服从n-1个自由度的t分布

计算t统计量和对应的相伴概率P(绝对值大于等于α \alpha α的双侧概率)

结论:P ≤ α P\leq\alpha P ≤α,则拒绝H 0 H_0 H 0 ,认为总体均值与检验值之间有显著差异.P > α P>\alpha P >α,不能拒绝H 0 H_0 H 0 ，认为总体均值与检验值之间没有显著差异

两独立样本t检验

含义: 在两个样本相互独立的前提下，检验两个样本的总体均值是否存在显著差异。零假设：两个样本数据的均值不存在显著差异。

例如：男生和女生的计算机平均成绩有显著差异吗？

要求:

两样本必须相互独立,即:抽取其中一批样本对抽取另一批样本没有任何影响.(如:北京周岁儿童与上海儿童的平均身高)
两总体服从正态分布

基本思路：

零假设H 0 : u 1 − u 2 = 0 H_0:u_1-u_2=0 H 0 :u 1 −u 2 =0,两总体均值无显著差异。
构造检验统计量.从两样本均值差的分布出发,即:~N ( u 1 − u 2 , σ x 1 − x 2 2 ) . N(u_1-u_2,\sigma^2_{x_1-x_2} ).N (u 1 −u 2 ,σx 1 −x 2 2 ).于是两总体均方差未知时构造t统计量：
两总体均值差的抽样分布标准差：
方差相等：用合并方差
方差不等：
- 计算t统计量和对应的相伴概率P (绝对值大于等于该值的双侧概率)

利用 方差齐性（Levene）F检验确定两总体方差是否齐性。给定零假设H 0 H_0 H 0 :两总体方差无显著差异。

首先计算每个个案与所属组均值之差并取绝对值.然后对其进行单因素方差分析.

如果已假设方差齐性行 F检验的P ≤ α P\leq\alpha P ≤α,则拒绝F检验的H 0 H_0 H 0 ,认为方差不齐性;其次看未假设方差齐性（Unequal）行的t检验概率.如果≤ α \leq\alpha ≤α,则拒绝t检验的H 0 H_0 H 0 ,认为两总体均值有显著差异;如果> α >\alpha >α,则不拒绝t检验的H 0 H_0 H 0

如果F检验的P > α P >\alpha P >α,则不能拒绝F检验的H 0 H_0 H 0 ,认为方差齐性;其次看已假设方差齐性（equal）行的t检验概率，t检验概率如果≤ α \leq\alpha ≤α,则拒绝t检验的H 0 H_0 H 0 ,认为两总体均值有显著差异;如果> α >\alpha >α,则不拒绝t检验的H 0 H_0 H 0

实例：

问题：判断男女生数学成绩是否具有显著差异
SPSS操作：
点击>分析>比较平均值>独立样本T检验

点击>定义组

分析结果：

在”列表方差相等性检验”框中，显著性为0.256，大于0.05，两组的总体方差齐性，则选择”已假设方差齐性”这一行的t检验结果。在”平均值相等性的t检验”中显著性（双尾）为0.346，大于0.05，说明两组数据的均值不存在显著差异。

; 配对样本t检验

含义: 根据配对样本对两总体均值是否有显著差异进行推断。零假设：两个配对样本数据的均值不存在显著差异。

例如：某种减肥茶是否有效

要求:

两样本数据必须两两配对,即:样本个数相同,个案顺序相同.如:减肥茶的效果、不同广告形式对销售额的影响.(控制了个案自身的影响)
两总体服从正态分布

非参数检验

卡方检验

目的：通过样本数据的分布来检验总体分布与期望分布或某一理论是否一致，零假设是样本的总体与期望没有显著差异。

基本思想：如果从一个随机变量X中随机抽取若干个样本均值，当这些样本落在X X X的k k k个互不相关的子集中的观察频数服从一个多项分布，当k趋于无穷时，这个多项分布服从卡方分布。

卡方检验的零假设是：两个变量之间没有显著差异。若两种检验（皮尔逊卡方、似然比）的渐进显著性水平（双向）都小于0.05，则拒绝零假设，若两种检验的双向显著性水平都大于0.05，则不能拒绝零假设。

即：若卡方的渐进显著性小于0.05，表明变量之间有显著差异，若卡方的渐进显著性大于0.05，表明变量之间没有显著差异。

基本方法:

根据已知总体的构成比计算出样本中各类别的期望频数，计算实际观察频数与期望频数的差距,即：计算卡方值χ 2 = ∑ i = 1 k ( 观测频数 − 预测频数 ) 2 预测频数 \chi^2=\sum_{i=1}^{k}\frac{(\text{观测频数}-\text{预测频数})^2}{\text{预测频数}}χ2 =∑i =1 k 预测频数(观测频数−预测频数)2
卡方值越小,则实际频数和期望频数相差越小.如果P大于显著性水平α \alpha α,不能拒绝H 0 H_0 H 0 ,认为总体分布与已知分布无显著差异。

单样本K-S检验

目的:利用样本数据推断总体是否服从某个理论分布（正态分布、均匀分布、指数分布和泊松分布）。

例如：周岁儿童的身高是否服从正态分布

基本假设: H 0 H_0 H 0 :总体分布与指定的理论分布无显著差异（总体服从指定的分布）

基本方法:

根据用户指定检验的总体分布,构造出一理论的频数分布，并计算相应的累计频率.
与样本在相同点的累计频率进行比较.如果相差较小,则认为样本所代表的总体符合指定的总体分布.

实例：
问题：判断班里语文成绩是否服从正态分布或泊松分布
SPSS操作：
点击>分析>非参数检验>旧对话框>1-样本K-S检验

勾选常规、泊松按钮
（如下图所示：常规是指正态分布，相等是指均匀分布）

分析结果：

正态分布检验统计量为0.051，渐进显著性为0.009,小于0.05，拒绝零假设，认为班上语文成绩不服从正态分布。

泊松分布检验统计量为0.038，渐进显著性为0.560，大于0.05，不能拒绝零假设，认为班上以为成绩服从泊松分布。

; 两独立样本的非参数检验

目的：由独立样本数据推断两总体的分布是否存在显著差异(或两样本是否来自同一总体)。

例如：两种不同生产工艺产品使用寿命分布的差异性

基本假设：H 0 H_0 H 0 :两总体分布无显著差异(两样本来自同一总体)

基本方法:

曼-惠特尼U检验(Mann-Whitney U)：平均秩检验
将两样本数据混合并按升序排序
求出其秩
对两样本的秩分别求平均
如果两样本的平均秩大致相同,则认为两总体分布无显著差异
k-s检验（保证有较大的样本数）
将两样本混合并按升序排序
分别计算两个样本在相同点上的累计频数和累计频率
两个累计频率相减
如果差距较小,则认为两总体分布无显著差异
游程检验(Wald-Wolfowitz runs)
将两样本混合并按升序排序
计算分组标志序列的游程数
如果游程数较大,则说明是由于两类样本数据充分混合的结果,即:认为两总体分布无显著差异.
如果两样本中有相同的样本值，则会使游程数发生变化.系统会作出提示.

多个独立样本的非参数检验

目的：检验多个独立样本之间是否具有相同分布，零假设是多个独立样本来自的总体分布无显著差异

基本方法：

Kruskal-Wallis H检验(推广的平均秩检验)
将多个样本数混合并按升序排序,求出其秩
对多个样本的秩分别求平均秩序
如果各样本的平均秩大致相等,渐进显著性大于0.05，则认为多个总体分布无显著差异
相同中位数检验(median)
判断多个总体是否是具有相同的中位数
将多个样本数混合并按升序排序
求出混合样本序列的中位数
如果各独立样本中大于此中位数的个案数和小于此中位数的个案数大致相同，渐进显著性大于0.05，则认为总体有相同的中位数。
Jonckheere-Terpstra检验（适用于行和列皆有序的R*C列联表）
计算统计量的值J
跟读统计量J值得到p值
将p值与给定的显著性水平进行比较。若p值小于显著性水平，则拒绝零假设，接受备择假设。

两配对样本检验

基本方法：

变化显著性检验(McNemar)（要求数据只能是二分值）
将研究对象作为自身的对照者检验其”前后”的变化是否显著
例如:领导培训前后,群众对他们的评价
关心的是发生变化的两格中的频数变化.如果频数变化相当,则认为无显著变化.
正负符号检验(sign)
将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号
如果正号的个数与负号的个数相当,则认为无显著变化.否则,认为有显著变化
例如:采用新训练方法前后的最好成绩比较

3.符号平均秩检验(wilcoxon)

正负符号检验只考虑了两总体数据变化的性质,而没有注意其变化的程度.符号平均秩检验注意到了这点

将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号.
将差值按升序排序,并求其秩.分别计算正号秩和负号秩总和
如果正秩和负秩相当,认为正负变化程度相当,两总体无显著差异.

多匹配样本的非参数检验

基本方法

推广的平均秩检验(双向Friedman检验)
将每个个案的变量值数据按升序排序，并求其秩
求各样本的平均秩
如果平均秩相当,则认为各总体分布无显著差异

2.谐同系数检验(Kendall W检验)

谐同系数检验方法与推广的平均秩检验方法相同
主要用在分析评判者的评判标准是否一致和公平
通过谐同系数W进行判定.W表示了横向各样本数据之间相关的强弱程度,取值在0和1之间.越接近1,则表示相关性越强,即:评判者的评判标准一致

参考书目：
《SPSS22.0统计分析·从入门到精通》

Original: https://blog.csdn.net/qq_48211069/article/details/119221363
Author: 只猪会上树
Title: 参数检验和非参数检验（结合SPSS分析）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/694832/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

HikariCP实战 | 通过查看源码分析如何解决maxLifeTime配置问题

目录 1、追本溯源 2、解决hikariCP的maxLifetime配置出现以下warn问题 3、具体解决步骤（查看源码） ; 1、追本溯源很多年前在stackoverflow上…

人工智能 2023年7月29日
0096
【负荷预测】10KV馈线负荷预测

### 回答1： cpw馈电是一种微带线结构，常用于高速数字和射频信号传输。在进行高频电磁仿真时，HFSS是一种常用的软件。使用HFSS对cpw馈电进行仿真，可以分析它的电磁性能。…

人工智能 2023年7月8日
0070
车牌识别项目全过程——opencv知识自学(1)

目录什么是opencv? * 图像数字化基础知识图像获取图像变换 – 改变大小车牌识别内容分析 * 定位车牌 – 图像降噪形态学处理阈值分割+边…

人工智能 2023年7月27日
0076
度秘语音引擎app_语音机器人哪家强度秘/小冰/Siri/小娜横向评测

关于智能语音机器人，我们一定不会陌生，它们在某种程度上给我们带来了极大的便利。 [En] About intelligent voice robots, we must be no…

人工智能 2023年5月27日
00177
手把手教你用anaconda安装pytorch最新版

序言：在有过python和jupyter notebook 安装基础之上，安装pytorch。小贴士：个人不建议用miniconda，虽然比较小巧，但是功能还是没办法和anacon…

人工智能 2023年7月23日
0081
2021年“泰迪杯”数据分析技能赛A题

2021年”泰迪杯”数据分析技能赛A题通讯产品销售和盈利能力分析摘要进入本世纪以来，我国通讯产品得到了飞速发展，其技术先进，价格便宜，深受世界各国和地…

人工智能 2023年7月16日
0078
Tushare取数-历史行情/实时行情

Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程，能够为金融分析人员提供快速、整洁、和多样的便于分析…

人工智能 2023年7月15日
0077
Detectron2安装踩坑记录（比较详细版）

目录第一章创建一个detectron2的环境 1.1打开Prompt，然后输入 1.2激活环境第二章安装pytorch1.9.0 2.1依据自身环境查看版本 2.2安装py…

人工智能 2023年7月5日
00112
tf2.6 OOM：tensorflow/core/framework/op_kernel.cc:1680] Resource exhausted: failed to allocate memory

2022-04-27 17:16:35.834265: I tensorflow/core/common_runtime/bfc_allocator.cc:1074] total_…

人工智能 2023年7月10日
0068
python划分数据集用pandas_Python数据分析工件-pandas（高级教程）,神器,进阶

合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并： pandas.merge 可以根据一个或多个键将不同DataFrame中的行连接起来 pandas.conca…

人工智能 2023年7月8日
0052
数字图像处理基础内容

openCV读取图片导入需要的库 import numpy as np import matplotlib.pyplot as plt import cv2 as cv 使用im…

人工智能 2023年6月20日
0092
AutoDL-GPU租用平台使用教程

AutoDL是一个国内的GPU租用平台，最近使用了一下，体验感还是很nice的，所以写了篇博客来介绍一下该平台的具体使用方式，也可以当做一个教程来学习^_^ 网址：AutoDL-品…

人工智能 2023年6月16日
0084
图像风格迁移

文章目录前言一、传统的图像风格迁移（Traditional style transfer） * 1.1计算机图形学领域和计算机视觉领域（Computer Graphics&am…

人工智能 2023年6月23日
0091
ChatGPT 试用

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0063
python3-pandas 数据结构 Series、DataFrame 基础

Pandas 应用Pandas 的主要数据结构是 Series （一维数据）与 DataFrame（二维数据），这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型…

人工智能 2023年7月8日
0082
MATLAB中怎样初始化(创建)二维、三维、四维以及多维矩阵,各维度的索引顺序是怎样的？

目录 1 在MATLAB中初始化二维矩阵 2 在MATLAB中初始化三维矩阵 3 在MATLAB中初始化四维矩阵 4 在MATLAB中初始化N维矩阵 1 在MATLAB中初始化二维…

人工智能 2023年6月18日
00121

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

参数检验和非参数检验（结合SPSS分析）

文章目录

参数检验

平均值检验

; 单样本t检验

两独立样本t检验

; 配对样本t检验

非参数检验

卡方检验

单样本K-S检验

; 两独立样本的非参数检验

多个独立样本的非参数检验

两配对样本检验

多匹配样本的非参数检验

大家都在看