【统计方法】一致性分析：组内相关系数(ICC)的10种形式选择（SPSS操作指南与Python实现）

2023年7月14日下午8:26 • 人工智能 • 阅读 143

可靠性（Reliability）被定义为测量结果可被复制的程度。它不仅反映了相关程度（correlation），还反映了测量之间的一致性（agreement）。实践中，Pearson相关系数、配对t检验和Bland-Altman图都可以用来评价Reliability。其中，配对t检验和Bland-Altman图是分析一致性的方法，Pearson相关系数则仅是对相关性的度量，因此，对Reliability来说，它们都不是理想的衡量方法。

一个更优秀的可靠性度量指标，应该同时反映测量之间相关性和一致性的程度。组内相关系数（Interclass Correlation Coefficient, ICC）就是天选之子。

参考论文：A Guideline of Selecting and Reporting Intraclass Correlation Coefficients for Reliability Research

1. ICC简介

ICC是Fisher在1954年首次提出的，作为对Pearson相关系数的修正。而现在的ICC是通过方差分析得到的均方差(即，基于一组给定度量之间的可变性对总体方差的估计)来计算的。1979年，Shrout和Fleiss定义了6种形式的ICC，它们用括号中的2个数字表示：ICC(1,1)、ICC(1,k)、ICC(2,1)、ICC(2,1)、ICC(3,1)和ICC(3,k)。1997年，McGraw和Wong根据模型（model）、类型（type）和被认为重要的关系定义（definition）确定了10种形式的ICC。

【1】模型有三种：
单向随机效应：1-way random effects
双向随机效应：2-way random effects
双向混合效应：2-way fixed effects

【2】类型有两种：
单个评分者/测量值：single rater/ measurement
k个评分者/测量值的平均值：the mean of k raters/measurements

【3】定义有两种：
一致性：consistency
绝对一致性：absolute agreement

如何选择正确的ICC形式可通过4个问题来指导：
（1）是否对所有受试样本都采用同一组评分者？ → 模型
（2）评分者样本是从更大样本的群体中选取的还是特定的评分者样本？ → 模型
（3）感兴趣的是单一评分者还是多个评分者均值的可靠性？ → 类型
（4）关心的一致性还是绝对一致性？ → 定义

2. ICC形式选择

2.1 模型选择

（1）单向随机效应：1-way random effects
这个模型中，每个受试样本都由一组不同的评分者打分，这些评分者是从大量可能的评分者中随机挑选出来的。实际上，该模型很少用于临床信度分析，因为大多数可靠性研究通常采用同一组评分者对所有受试样本进行测量。
如下图所示，ABCDEF表示6名不同的评分者：

【统计方法】一致性分析：组内相关系数(ICC)的10种形式选择（SPSS操作指南与Python实现）

在多中心研究中可能会有应用场景，比如一组评分者对一个中心的受试样本进行评估，而另一组评分者对另一个中心的受试样本进行评估。

（2）双向随机效应：2-way random effects
这个模型中，我们从一个更大的具有相似特征的评分者群体中随机选择我们的评分者。换句话说，如果我们打算将我们的可靠性结果推广到与可靠性研究中所选的评分者具有相同特征的任何评分者，就应选择双向随机效应模型。简言之，可靠性结果可推广。

（3）双向混合效应：2-way fixed effects
如果所选的评分者是唯一感兴趣的评分者，则应该使用双向混合效应模型。在此模型下，结果仅代表了参与可靠性实验的具体评分者的可靠性。它们不能推广到其他评分者，即使这些评价者与可靠性实验中所选的评价者具有相似的特征。简言之，可靠性结果不可推广。

; 2.2 类型选择

这种选择取决于在实际应用中将如何执行测量方案。例如，如果我们计划使用3个评分者的平均值作为评估依据，则可靠性研究的实验设计应包括3个评分者，并选择类型： the mean of k raters/measurements。相反地，如果我们打算使用单一评分者的测量作为实际测量的依据，那么即使可靠性实验涉及到2个或2个以上的评分者，也应该选择类型： single rater/ measurement。

2.3 定义选择

对于双向随机效应模型和双向混合效应模型，有2个ICC定义： “绝对一致性” 和”一致性”。选择ICC定义取决于我们认为评分者之间的绝对一致性还是一致性更重要。
设 y {y}y 为评分者A的分数，x {x}x 为评分者B的分数，c {c}c 为误差：
一致性：同一组受试样本的评分是否以加性的方式相关，数学表达为 y = x + c {y=x+c}y =x +c
绝对一致性：同一组受试样本的评分数值是否相近，数学表达为 y = x {y=x}y =x

论文中给定的10种ICC形式的计算表达式如下所示：

但是我认为论文中ICC(1,1)的计算表达式分母的 k + 1 {k+1}k +1 应该为 k − 1 {k-1}k −1 ，即：

后面我将用代码证明k − 1 {k-1}k −1 才是正确的。

; 3. SPSS操作指南

SPSS可以方便的实现ICC计算：
1. 数据录入

2. 分析 → 标度→ 可靠性分析（Analyze → Scale → Reliability Analysis）

3. 设置选项

4. 模型选择：统计（Statistics）→ 同类相关系数（ICC），根据需要选择模型和类型

5. 结果解读

单个测量（Single Measures）：对应single rater/ measurement
平均测量（Average Measures）：对应the mean of k raters/measurements

ICC的值介于0~1之间：
小于0.5表示一致性较差；
0.5~0.75一致性中等；
0.75~0.9一致性较好；
大于0.9一致性极好；

4. Python实现

仔细观察计算表达式，发现双向混合与双向随机的表达式是一样的。
故用Python实现了6种ICC形式的计算：

import numpy as np

def icc_calculate(Y, icc_type):

    [n, k] = Y.shape

    dfall = n * k - 1
    dfe = (n - 1) * (k - 1)
    dfc = k - 1
    dfr = n - 1

    mean_Y = np.mean(Y)
    SST = ((Y - mean_Y) ** 2).sum()

    x = np.kron(np.eye(k), np.ones((n, 1)))
    x0 = np.tile(np.eye(n), (k, 1))
    X = np.hstack([x, x0])

    predicted_Y = np.dot(
        np.dot(np.dot(X, np.linalg.pinv(np.dot(X.T, X))), X.T), Y.flatten("F")
        )
    residuals = Y.flatten("F") - predicted_Y
    SSE = (residuals ** 2).sum()

    MSE = SSE / dfe

    SSC = ((np.mean(Y, 0) - mean_Y) ** 2).sum() * n
    MSC = SSC / dfc

    SSR = ((np.mean(Y, 1) - mean_Y) ** 2).sum() * k
    MSR = SSR / dfr

    if icc_type == "icc(1)":
        SSW = SST - SSR
        MSW = SSW / (dfall - dfr)

        ICC1 = (MSR - MSW) / (MSR + (k - 1) * MSW)
        ICC2 = (MSR - MSW) / MSR

    elif icc_type == "icc(2)":

        ICC1 = (MSR - MSE) / (MSR + (k - 1) * MSE + k * (MSC - MSE) / n)
        ICC2 = (MSR - MSE) / (MSR +  (MSC - MSE) / n)

    elif icc_type == "icc(3)":

        ICC1 = (MSR - MSE) / (MSR + (k - 1) * MSE)
        ICC2 = (MSR - MSE) / MSR

    return ICC1, ICC2

测试icc(1)：

a = [[90,95,89,92,89,80,91,94,84,95],
     [89,80,89,93,91,80,94,92,82,90],
     [100,100,91,91,94,81,93,92,84,96]]
b = np.array(a)
b = b.T
icc_type = "icc(1)"
icc1, icc2 = icc_calculate(b, icc_type)
print('模型{}:\t'.format(icc_type))
print('单个测量:', icc1)
print('平均测量:', icc2)

输出：对应SPSS选择 单项随机，代码与SPSS结果一致， 故k − 1 {k-1}k −1 才是正确的

模型icc(1):
单个测量: 0.4642314139799629
平均测量: 0.7221784219782894

测试icc(2)：

a = [[90,95,89,92,89,80,91,94,84,95],
     [89,80,89,93,91,80,94,92,82,90],
     [100,100,91,91,94,81,93,92,84,96]]
b = np.array(a)
b = b.T
icc_type = "icc(2)"
icc1, icc2 = icc_calculate(b, icc_type)
print('模型{}:\t'.format(icc_type))
print('单个测量:', icc1)
print('平均测量:', icc2)

输出：对应SPSS选择 双向随机，绝对一致，代码与SPSS结果一致

模型icc(2):
单个测量: 0.4807888473308402
平均测量: 0.7353094123764954

测试icc(3)：

a = [[90,95,89,92,89,80,91,94,84,95],
     [89,80,89,93,91,80,94,92,82,90],
     [100,100,91,91,94,81,93,92,84,96]]
b = np.array(a)
b = b.T
icc_type = "icc(3)"
icc1, icc2 = icc_calculate(b, icc_type)
print('模型{}:\t'.format(icc_type))
print('单个测量:', icc1)
print('平均测量:', icc2)

输出：对应SPSS选择 双向混合，一致性，代码与SPSS结果一致

模型icc(3):
单个测量: 0.529918800749532
平均测量: 0.7717872521074659

Original: https://blog.csdn.net/qq_43426908/article/details/124365536
Author: 风巽·剑染春水
Title: 【统计方法】一致性分析：组内相关系数(ICC)的10种形式选择（SPSS操作指南与Python实现）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692813/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Anaconda 修改默认虚拟环境安装位置

项目场景：使用Anaconda Prompt创建虚拟环境问题描述保存虚拟环境的默认地址是C盘，而我想将下载的虚拟环境保存到我自定义的位置。解决方案： 1、使用 conda …

人工智能 2023年7月29日
0098
Sarsa算法和Q-learning算法

1、马尔可夫决策过程(MDP)四元组马尔可夫四元组 s：state 状态a：action 动作r：reward 奖励p：policy 状态转移概率 p ( s t + 1 , r…

人工智能 2023年6月25日
0089
基于OpenCV实现对图片及视频中感兴趣区域颜色识别

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位🧡 Python实战微信订餐小程序 🧡 进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯…

人工智能 2023年7月18日
0070
数据分析与挖掘简单快速介绍

第一章数据分析与挖掘引入一.什么是数据分析与挖掘数据分析说白了，就是基于搜集到的已有数据，应用数学、统计、计算机等各方面的知识抽取出数据所包含的信息的过程。 Tips：一般来…

人工智能 2023年7月17日
0067
实时车辆行人多目标检测与跟踪系统-上篇（UI界面清新版，Python代码）

摘要：本文详细介绍如何利用深度学习中的 Y O L O_及 _S O R T_算法实现车辆、行人等多目标的实时检测和跟踪，并利用 _P y Q t 5_设计了清新简约的系统UI界面…

人工智能 2023年6月17日
0084
Python制作爱心跳动代码，这就是程序员的烂漫吗

前言最近有个剧挺火的就是那个程序员的剧，叫什么温暖你来着咳咳，剧我没怎么看，但是吧，里面有个爱心代码，最近可是蛮火的，今天就用Python来尝试一下吧怎么说呢，用这个表白也…

人工智能 2023年7月30日
0086
正规蓝牙耳机一般多少钱？音质好又便宜的蓝牙耳机

蓝牙耳机以强大的性能和无线的便利性取代了有线耳机，现在已经成为人们必须购买的新电子产品。对许多人来说，听音乐是他们的爱好。蓝牙耳机的出现极大地改善了无线耳机造成的音质不佳，给人们带…

人工智能 2023年5月25日
0082
torch.optim.SGD参数详解（除nesterov）

【我的理解】虽然叫做”随机梯度下降”，但是本质上还是还是实现的批量梯度下降，即用全部样本梯度的均值更新可学习参数。这里所说的全部样本可以是全部数据集，也可…

人工智能 2023年7月20日
0062
【XML】学习笔记第二章-dtd

XML-DTD DTD语句基本声明语句引用外部DTD DTD元素四种元素类型元素定义关键字修饰符号 DTD中的属性属性修饰属性类型 DTD中的实体和符号符号坑 X…

人工智能 2023年6月4日
0095
梯度下降（Gradient descent)算法详解

梯度下降（Gradient descent)算法详解说起梯度下降算法，其实并不是很难，它的重要作用就是求函数的极值。梯度下降就是求一个函数的最小值，对应的梯度上升就是求函数最大值…

人工智能 2023年6月15日
0067
全球及中国本质安全校准器行业销售前景与竞争规模预测报告2022-2027年

全球及中国本质安全校准器行业销售前景与竞争规模预测报告2022-2027年 Original: https://blog.csdn.net/HSXH1/article/detail…

人工智能 2023年6月11日
0073
目标检测：RCNN-＞Fast RCNN-＞Faster RCNN

一、RCNN RCNN（Region with CNN feature）是深度卷积神经网络应用于目标检测问题的一个里程碑的飞跃。2014年提出的，之前都是传统的检测算法。算法步骤…

人工智能 2023年7月12日
0055
机器学习Sklearn——红酒分类案例详解决策树模型参数

目录 1 分类树 1.1 红酒分类案例 1.1.1 导入包 1.1.2 观察、分割数据 1.1.3 三段论 2 参数介绍 2.1 重要参数 2.2 控制随机选项参数 2.3 剪枝参…

人工智能 2023年6月30日
00140
csvtk：表格处理神器-美化、统计、头表、合并、转置、筛选、取样、去冗余、分列、分类汇总和简单绘图…

写在前面 CSV/TSV作为数据科学和组学分析的基本格式，其实本质上均为txt格式的表格，CSV是按逗号分隔，TSV是以制表符分隔的表格。这两种格式数据格式应用非常广泛。比较常用的…

人工智能 2023年7月3日
00120
隐马尔科夫模型的简单实现

模型 HMM=(A, B, \pi) 初始化三个参数：隐状态初始状态概率向量\pi，状态转移概率矩阵A，隐状态生成观测状态概率矩阵B。实现三个方法： 1、2. 计算给定观测状态序…

人工智能 2023年6月4日
0061
从零开始搭建ROS移动机器人系列之（三）底层控制硬件

“ 上一期讲到了机器人机械结构、外部传感器以及ROS部署载体的选择及设计，这一期讲一讲底层控制硬件部分的内容。 “ 目录单片机控制芯片电机驱动模块电机…

人工智能 2023年6月26日
00103

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31