（生物信息学）R语言与统计学入门（九）—— 单因素cox回归分析

2023年6月19日上午9:09 • 人工智能 • 阅读 228

## 近期将推出苦逼医学生R语言入门;R语言与高级统计学付费专栏，感谢大家支持 ##

COX回归模型，又称”比例风险回归模型(proportional hazards model，简称Cox模型)”，是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为因变量，可同时分析众多因素对生存期的影响，能分析带有截尾生存时间的资料，且不要求估计资料的生存分布类型。由于上述优良性质，该模型自问世以来，在医学随访研究中得到广泛的应用，是迄今生存分析中应用最多的多因素分析方法。

下面我们直接测试代码：

数据准备如下存成CSV格式，方便R语言读取：

setwd("D:\\")
dir()
data  head(data)
        sampleID RFS.time RFS    ALY
#1 TCGA-2A-A8VL-01      621   0 2.0320
#2 TCGA-2A-A8VO-01     1701   0 1.8710
#3 TCGA-2A-A8VT-01     1373   0 0.7952
#4 TCGA-2A-A8VV-01      671   0 2.6270
#5 TCGA-2A-A8VX-01     1378   0 2.3310
#6 TCGA-2A-A8W1-01      112   0 1.9390

下面我们下载coin软件包：

install.packages("coin")
library(coin)
cox  cox
#Call:
#coxph(formula = Surv(RFS.time, RFS) ~ data$ALY, data = data)
#
          coef exp(coef) se(coef)     z      p
#data$ALY 0.2845    1.3291   0.1143 2.489 0.0128
#
#Likelihood ratio test=5.34  on 1 df, p=0.02089
#n= 421, number of events= 52

注意我们这里研究的RFS，无病生存期。

结果显示P值是有意义的。

summary(cox)

> summary(cox)
#Call:
#coxph(formula = Surv(RFS.time, RFS) ~ data$ALY, data = data)
#
 n= 421, number of events= 52
#
          coef exp(coef) se(coef)     z Pr(>|z|)
#data$ALY 0.2845    1.3291   0.1143 2.489   0.0128 *
#---
#Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#
        exp(coef) exp(-coef) lower .95 upper .95
#data$ALY     1.329     0.7524     1.062     1.663
#
#Concordance= 0.607  (se = 0.049 )
#Likelihood ratio test= 5.34  on 1 df,   p=0.02
#Wald test            = 6.2  on 1 df,   p=0.01
#Score (logrank) test = 6.08  on 1 df,   p=0.01

这里的exp(coef)就是风险比HR的意思。Lower95和upper95是HR置信区间的上下限。

这是针对连续性变量，我们研究的基因表达就是连续性变量。

cox回归也可以进行分类变量的分析，下面我们将基因的表达分为高低表达组：

data$ALY median(data$ALY),"High expression","Low expression")
head(data)

> head(data)
        sampleID RFS.time RFS             ALY
#1 TCGA-2A-A8VL-01      621   0 High expression
#2 TCGA-2A-A8VO-01     1701   0  Low expression
#3 TCGA-2A-A8VT-01     1373   0  Low expression
#4 TCGA-2A-A8VV-01      671   0 High expression
#5 TCGA-2A-A8VX-01     1378   0 High expression
#6 TCGA-2A-A8W1-01      112   0  Low expression

此时是二分类变量：

cox  summary(cox)
#Call:
#coxph(formula = Surv(RFS.time, RFS) ~ data$ALY, data = data)
#
 n= 421, number of events= 52
#
                         coef exp(coef) se(coef)      z Pr(>|z|)
#data$ALYLow expression -0.6992    0.4970   0.2922 -2.393   0.0167 *
#---
#Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#
                      exp(coef) exp(-coef) lower .95 upper .95
#data$ALYLow expression     0.497      2.012    0.2803    0.8812
#
#Concordance= 0.56  (se = 0.039 )
#Likelihood ratio test= 6.04  on 1 df,   p=0.01
#Wald test            = 5.73  on 1 df,   p=0.02
#Score (logrank) test = 5.96  on 1 df,   p=0.01

其中High expression组被设置成了reference，这里的exp(coef)是针对Low expression组的，意思是这个ALY基因低表达的患者死亡风险是ALY基因高表达患者的0.497倍。

除了二分类变量以外，还可以分析多分类，无论是哪种分类变量，都会设置某一个类为一个参照。

Original: https://blog.csdn.net/weixin_46500027/article/details/124428439
Author: 楷然教你学生信
Title: （生物信息学）R语言与统计学入门（九）—— 单因素cox回归分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/638484/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

YOLOv1学习笔记

YOLOv1复现笔记文章目录 YOLOv1复现笔记 * 一.yolov1的提出二.yolov1的原理、思想 – (1)端到端的训练思想 (2)encoder操作 (…

人工智能 2023年7月9日
0068
论文阅读-GiraffeDet: A Heavy-Neck Paradigm for Object Detection

GiraffeDet: A Heavy-Neck Paradigm for Object Detection一般我们遇见的检测器都是更偏重于骨干网络的设计，采用重骨干轻neck的设…

人工智能 2023年7月10日
00130
Unsupervised Data Augmentation for Consistency Training

当标准数据不足时，半监督学习展现出很大的优势。近期方法的一个共同点是在大量无标注数据上使用 consistency training 来约束模型预测结果，使其具有输入噪音不变…

人工智能 2023年5月28日
0077
Python爬虫，私活接单记录，假日到手5500，美滋滋

前言每年的元旦节前后，都会是Python兼职接单的小高潮，这段时间各个行业对爬虫类的需求会暴增，圈子里很多朋友在元旦假期都没闲着，两天赚上万的不在少数。所以近来问我技术变现+兼…

人工智能 2023年6月19日
0079
语义分割系列7-Attention Unet（pytorch实现）

继前文Unet和Unet++之后，本文将介绍Attention Unet。 Attention Unet地址，《Attention U-Net: Learning Where to…

人工智能 2023年7月20日
0069
python大数据可视化分析淘宝商品，开专卖店不行啊

python大数据可视化分析淘宝商品，开专卖店不行啊现如今大数据分析异常火爆，如何正确分析数据，并且抓住数据特点，获得不为人知的秘密?今天沉默带你用python爬虫，爬取淘宝网站…

人工智能 2023年7月16日
0074
Codeforces Round #829 Div. 2 D. Factorial Divisibility(结论&数学)

Codeforces Round #829 Div. 2 D. Factorial Divisibility(结论&数学) 注意1 ≤ a i ≤ x 1\le a_i\l…

人工智能 2023年6月28日
0092
开源SPL强化MangoDB计算

MongoDB是NoSQL数据库的典型代表，支持文档结构的存储方式数据存储和使用更为便捷，数据存取效率也很高，但计算能力较弱，实际使用中涉及MongoDB的计算尤其是复杂计算会很麻…

人工智能 2023年7月31日
0049
C++学习笔记——opencv2模块（图像处理）

用于计算图像处理的opencv2，只不过这次用的不是python的版本，而是C++的版本。参考书籍：《视觉SLAM十四讲-从理论到实践》——高翔 CMakeLists.txt写法…

人工智能 2023年6月18日
0083
ABB机器人RobotStudio编程指令大全

ABB编程指令大全指令类型指令说明程序的调用 ProcCall 调用例行程序程序的调用 CallByVar 经过带变量的例行程序名称调用例行程序程序的调用 RETURN 返…

人工智能 2023年6月15日
00239
C1 – week1 – Neural Networks and Deep Learning

可居住人口 + 步行化程度 + 周围学校质量 -> 房价图示如下，蓝色连线表示某种相关性，灰色圆圈表示映射关系。这个例子中，x是房屋大小、卧室数量、邮政编码、富裕程度四个…

人工智能 2023年7月14日
0092
利用Python OpenCV进行圆孔检测、计算半径、圆心到四边距离

先上最终检测视频： OpenCV实时检测圆孔本文重在实操，就不赘述背景意义等内容。给定问题：假如有一个配件，此时需要检测配件上的圆孔坐标、半径、个数、圆孔到配件四边的距离。由…

人工智能 2023年6月19日
00184
torch文件保存与加载——【torch学习笔记】

引用翻译：《动手学深度学习》到目前为止，我们讨论了如何处理数据，如何建立、训练和测试深度学习模型。然而，在某些时候，我们很可能对我们获得的结果感到满意，我们希望保存结果以便以后使…

人工智能 2023年6月16日
00127
Mac BERT 论文解读 Revisiting Pre-trained Models for Chinese Natural Language Processing

这里是对 EMNLP 2020 的 Mac BERT 的分享作者是哈工大刘挺老师的团队个人看法欢迎指正文章对近几年的预训练模型做了对比总结，并在此基础上提出了MacBERT 首先…

人工智能 2023年7月14日
0058
加拿大，日本，墨西哥等认证标准更新

2022年9月13日，IFT 批准移动电话因风险或紧急情况接收警报信息的技术规范（IFT-011-2022 第 3 部分）。该标准规范了移动终端设备（手机和/或智能手机）通过蜂窝…

人工智能 2023年6月4日
0081
智慧工厂数字孪生建设方案

数字化转型是我国经济社会未来发展的必由之路，数字孪生技术作为推动实现企业数字化转型、促进数字经济发展的重要抓手，并在产品设计制造、生产监管、工艺优化、仿真验证起到重要作用。通过多…

人工智能 2023年6月25日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

（生物信息学）R语言与统计学入门（九）—— 单因素cox回归分析

大家都在看