1.INTRODUCTION(介绍)
1.数据来源
- GDC Legacy Archive
- GDC Harmonized database
2.barcode
2.Install.packages(包安装)
3.数据下载
我们以胆管癌数据为例进行展示
- *下载表达数据
#数据查询(就像你在页面网站上点来点去)
query
- *数据整理
#数据准备
dataPrep
- *DESeq2差异分析
#差异表达分析
library(DESeq2)
expdat=10
ddslogFC_cutoff,
ifelse(DEG$log2FoldChange>logFC_cutoff,"UP","DOWN"),
"NOT"))
- *差异表达基因文件输出
#文件会默认储存在你所创建的根目录里,你也可以根据自己的需要进行调整
write.csv(DEG,file = "TCGA_CHOL_DEG.csv")
- *差异表达基因可视化(火山图)
#火山图可视化
library(ggplot2)
this_title
Original: https://blog.csdn.net/Joey_Liu666/article/details/124940605
Author: Joey_Liu666
Title: TCGA数据库与肿瘤数据分析(参考后整理)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/639735/
转载文章受原作者版权保护。转载请注明原作者出处!