Cox比例风险回归(Cox ProportionalHazards Model) 到底选用哪种回归分析 r到底选择哪种回归分析 r选择生存分析还是cox分析

(74条消息) 第二十八讲 R语言-Cox比例风险模型1 如何纳入因素 责骂知道风险因素是相对于谁来说的 reference control是谁 基准 对照 参照_YoungLeelight的博客-CSDN博客

Cox比例风险回归(Cox ProportionalHazards Model)

在医学研究中,观察对象生存时间往往受到多个因素的影响。例如,研究某肿瘤患者生存时间与治疗措施的关系,患者的生存时间不仅与治疗措施有关,还受病人的年龄、性别、病情、心理、环境、社会等因索的影响,如果要显示治疗措施的效果,除了治疗措施不同以外,其他影响因素应尽可能相同或相近.这时采用多变量分析方法能够分析包括治疗措施在内的可能因素对生存时间的影响。 因为生存时间资料的分布往往不服从正态分布(大多为正偏态分布),有时甚至不知道它的分布类型,这样就不能采用多重线性回归方法分析。本节介绍的 Cox比例风险回归模型(Cox proportional hazard model)可以分析多个因素对生存时间的影响, 而且允许有截尾数据存在,是生存分析中最重要的多因素分析方法。

例16.3 为研究急性淋巴细胞性白血病患者的生存时间与其预后因素的关系,某研究者随访了50例急性淋巴细胞性白血病患者,获得其生存时间(月)及有关预后因素资料。其中, x1 为入院时白细胞数( ×109/L ) , x2 为淋巴结浸润度(分为0,1,2三级), x3 为缓解出院后的巩固治疗( x3=1 为有巩固治疗, x3=0 为无巩固治疗),随访的终点事件是死于白血病。

由于此资料为随访的生存资料,且影响因索有多个,故需采用Cox比例风险回归分析解决。本节将以此为例,介绍Cox比例风险回归分析的模型构建、分析步骤及实际应用等。

一、 Cox比例风险回归分析的基本原理

(一)基本概念

生存分析的主要目的是研究协变量(自变量) X 与观察结果即生存函数 S(t,X) 之间的关系,当 S(t,X) 受到协变量的影响时,传统的方法是考虑回归分析,即各协变量对 S(t,X) 的影响。由于生存数据中包含有截尾数据,用一般的回归分析难以解决上述问题。生存分析中一个很重要的内容是探索影响生存时间或生存率的危险因素,这些危险因素可通过影响各时刻的死亡风险(即风险率)而影响生存率, 不同特征的人群在不同时刻的风险率函数不同,通常将风险率函数表达为 基准风险率函数与相应协变量函数的乘积,即

h(t,X)=h0(t)∙f(X)

注:我们假设最开始的风险是一致的,不同协变量函数可以认为是在这个基准之上的作用。这样就可以区分不同协变量之间是有利于减小风险率还是增大风险率。即可以知道哪些是危险因素。

式中, h(t,X) 表示t时刻的风险率函数又称瞬时死亡率。 h0(t) 表示t时刻的基准风险率函数,即t时刻所有的协变量取值为0时的风险率函数; f(X) 为协变量函数。最常用协变量函数模型是对数线性模型,即 f(X)=e∑j=1mβjxj ,j=1,2,…,m为模型中协变量的个数,当基准风险率函数 h0(t) 已知时, h(t,X)=h0(t)∙f(X) 为参数模型。例如,当 h0(t)=λ 时,为指数回归模型; h0(t)=λtγ−1 时,为Weibull模型。 1972年,英国生物统计学家D.R Cox提出 在基准风险率函数未知的情况下估计模型参数的方法。后人将该模型称为Cox比例风险回归模型,简称Cox回归。

注:因为基准风险率函数未知,所以不能称之为参数模型。只能说是半参数模型。

(二)Cox回归模型的基本形式

基本形式为:

h(t,X)=h0(t)∙e(β1×1+β2×2+…+βmxm)

式子中 β1,β2,…,βm 为自变量的偏回归系数。

h0(t) 分布无明确的假定,一般也是无法估计的,这是非参数部分;另一部分是参数部分,其参数是可以通过样本的实际观察值来估计的。正因为Cox回归模型由非参数和参数两部分组成,故又称为半参数模型。

对上式做对数变换可得:

ln[h(t,X)/h0(t)]=β1×1+β2×2+…+βmxm

因此,Cox回归模型与一般的回归分析不同,协变量对生存时间的影响是通过风险函数和基准风险函数的比值反映的。其中的风险函数和基准风险函数是未知的。在完成参数估计的情况下,可对基准风险函数和风险函数做出估计,并可计算每一个时刻的生存率。

(三) Cox回归模型的建模假设

1、比例风险假定 各危险因素的作用不随时间变化而变化,即 h(t,X)/h0(t) 不随时间变化而变化。因此应注意Cox回归模型要求风险函数与基准风险函数呈比例。如果这一假定不成立,则不能用Cox回归模型进行分析。

2、对数线性假定 模型中的协变量应与对数风险比呈线性关系。

(四)Cox回归模型中偏回归系数的意义

模型中偏回归系数 βj 的意义是当其他协变量固定不变时,协变量 xj (j=1,2,…,m)变化一个单位,其对数风险比的改变量。假定只有一个协变量 x ,其为二分类变量( x=1 为暴露于某因素, x=0 为未暴露于该因素),建立的Cox回归模型为 h(t,X)=h0(t)∙e(βx) 。 则暴露与未暴露的相对危险度RR的计算为

RR=h(t,X|x=1)h(t,X|x=0)=h0(t)∙e(β×1)h0(t)∙e(β×0)=eβ

可见,回归系数 βj 又可解释为固定其他自变量时,自变量 xj 每改变一个单位,得到的相对危险RR的对数值。这个解释在生存时间的危险因素分析中更常用。若 βj>0,则 RR>1 ,该因素为危险因素;若 βj

Original: https://blog.csdn.net/qq_52813185/article/details/127318659
Author: YoungLeelight
Title: Cox比例风险回归(Cox ProportionalHazards Model) 到底选用哪种回归分析 r到底选择哪种回归分析 r选择生存分析还是cox分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/635354/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球