整合多组学数据进行分型之MOVICS

2023年5月31日上午10:49 • 人工智能 • 阅读 85

简介

Immugent今天要介绍的是2020年发表在Bioinformatics(6.94)杂志上的一个R包–MOVICS，作者是国人(药大博士)。小编之前有一个推文介绍的IOBR包（IOBR:一个R包带你走进数据挖掘的殿堂)也是国人开发的，想到这内心犹生一股豪情，中华生信领域崛起的任务非我辈莫属！因为这个包的功能太多，本片推文只是开个头，后续还有几篇进行实操来介绍这个包的使用方法。

近些年产生了大量的高通量测序数据，新开发出的生物技术如新一代测序、微阵列和质谱技术使高维分子数据的不同形态的生成和收集成为可能。采用多组学数据进行聚类有潜力进一步的揭示系统水平的研究发现，但同时提出了巨大的计算和生物学的挑战。MOVICS包旨在展示如何使用其对癌症分型研究进行多组学综合聚类和可视化。这个R包为10种最先进的多组聚类算法提供了统一的接口，并对每个算法的输出进行了标准化，从而形成了下游分析的管道。10种算法是CIMLR、iClusterBayes、MoCluster、COCA、ConsensusClustering、IntNMF、LRAcluster、NEMO、PINSPlus和SNF，其中前三种方法也可以进行特征选择过程。

对于癌症亚型研究，MOVICS还为最常用的下游分析形成了一个管道，用于进一步的亚型描述，并创建可编辑的出版物质量插图。最重要的是，MOVICS目前最多可支持6个组学数据用于联合聚类，用户必须提供至少2个组学数据集作为输入文件。

主要流程

MOVICS目前要求R(≥4.0.1)，其主要包括三个模块(GET、COMP和RUN)。所有面向用户的函数都是从任何模块的标签开始命名的。

第一个模块：GET Module。是通过分析多组学数据综合聚类得到分子亚型第二个模块：COMP Module。是通过从多个角度来比较亚型间的分子特征差异第三个模块：RUN Module。是通过运行标记标识进而进一步验证分子亚型

以上三个连接的模块基本上解释了这个R包的工作流程。MOVICS首先使用一种或多种聚类算法来识别癌症亚型(CS);如果指定了多个聚类算法，强烈建议根据不同的子类型结果进行一致聚类，以得到稳定稳健的子类型。其次，在拥有子类型之后，自然会从尽可能多的角度利用子类型的异质性。第三，每个亚型都应该有一份亚型特异性生物标记的列表，用于在外部队列中复制这种亚型。

为了方便学习，MOVICS包含两个预处理的乳腺癌数据集。其中一个数据集是brca.tcga.RData，该数据集包含从TCGA-BRCA队列t3中检索的乳腺癌四种完整的组学数据类型(即mRNA表达、lncRNA表达、DNA甲基化图谱和体细胞突变矩阵)，以及相应的临床病理信息(如年龄、病理阶段、PAM50亚型、生命状态和总生存时间);该数据列表还包含相应的RNA-Seq原始计数表和Fragments Per Kilobase Million (FPKM)数据，用于测试下游分析的功能(如差异表达分析、药敏分析等)。另一个，brca.yau.RData是一个外部验证数据集，包含了从BRCA-YAU t4队列下载的682个样本(去除一个没有对PAM50亚型进行注释的样本)的基因表达谱和临床病理信息，可用于检测MOVICS中可用的预测功能

说在最后

随着各项生物技术的不断推广，光靠转录组的数据我们往往无法精准的找到候选基因，如果联合多组学数据，在不同层面上综合进行分析，这样做出的结果往往更可靠，MOVICS就是实现这样功能的一个R包。

这个包整合了多种算法和画图函数，它的功能强大到无法想象，不仅能出图，出表，还能出整理好的word文件(小编第一次遇到)。后续生信宝库会推出这个包的一系列推文，敬请期待！

Original: https://blog.csdn.net/weixin_46280807/article/details/122653927
Author: Immugent
Title: 整合多组学数据进行分型之MOVICS

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/550620/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于matlab点云工具箱对点云进行处理三：对点云进行欧式聚类，使用三角剖分处理后获取点云簇的外接凸多边形

基于matlab点云工具箱对点云进行处理三：对点云进行欧式聚类，使用三角剖分处理后获取点云簇的外接凸多边形步骤：读取velodyne数据包pcap文件内的点云数据使用pcdo…

人工智能 2023年6月2日
00115
【CV学习笔记】图像预处理warpaffine-cuda加速

1、前言在上个学习笔记中学习warpaffine,并且在opencv下面实现了图像的预处理，而warpaffine可以很好的利用cuda加速来实现，于是基于手写AI的项目，又学习…

人工智能 2023年5月28日
0092
神经网络模型的实际案例,神经网络模型应用实例

深度学习的职业发展方向有哪些？当前，人工智能发展借助深度学习技术突破得到了全面关注和助力推动，各国政府高度重视、资本热潮仍在加码，各界对其成为发展热点也达成了共识。本文旨在分析…

人工智能 2023年6月16日
0092
卷积神经网络CNN实现mnist手写数字识别

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月16日
0089
机器学习-决策树算法ID3实现，含例子(红酒分类）

决策树原理实现代码如下所示：（参考自机器学习实践 Peter Harrington)。 import math x=[[0,1,"no"],[0,1,&quot…

人工智能 2023年7月22日
0058
AAAI 2022 论文列表

链接及代码之后会更新 Scaled ReLU Matters for Training Vision TransformersPichao Wang, Xue Wang, Hao …

人工智能 2023年5月26日
00102
国产AI绘画软件“数画”刷爆朋友圈，网友到底在画什么

人们常说，眼见为实，只有自己亲眼见到的才会相信。但是我们都知道眼睛会产生错觉，而且人们在生活中被错觉误导的情况屡见不鲜。例如图中，你以为她们肯定是真人的照片。世界上有些事情，即使是…

人工智能 2023年6月28日
00102
Weblogic XMLDecoder 远程代码执行漏洞 CVE-2017-10271 漏洞复现

是Oracle Server中的一个。攻击者可以通过发送特制的HTTP请求来利用该，从而在受影响的系统上已经被公开披露，并且已经有一些工具可以用来。但是，我们不建议未经授权…

人工智能 2023年6月27日
0073
ModuleNotFoundError: No module named ‘torch‘ 解决方案

在运行python程序时遇到下面的问题：ModuleNotFoundError: No module named ‘torch’这是由于没有安装torch包…

人工智能 2023年7月21日
00197
第七届工程训练大赛垃圾分类

第七届全国大学生工程训练大赛垃圾分类前言一、机械结构设计 * 1.Solidworks建模 2.建模的不足以及改进 – 1.挡板的添加 2.履带防滑 3.整体实物 …

人工智能 2023年5月25日
0079
opencv 插值方式

一、插值方式与resize()的关系 resize()函数里面包含插值的几种方式： void resize(InputArray src, OutputArray dst, Siz…

人工智能 2023年5月28日
00120
【OpenCV 例程200篇】223. 特征提取之多边形拟合（cv.approxPolyDP）

『youcans 的 OpenCV 例程200篇 – 总目录』【youcans 的 OpenCV 例程 300篇】223. 特征提取之多边形拟合目标特征的基本概念 …

人工智能 2023年6月18日
00136
vue中调用高德地图

首先, 要去高德地图申请开发者key(戳这里) 然后进行安装 : npm install vue-amap –save main.js <script> impor…

人工智能 2023年6月27日
00114
Python每日一练（牛客数据分析篇新题库）——第29天：数据索引

文章目录 1. 修改属性1 2. 修改属性2 3. 重载运算《100天精通Python》专栏推荐白嫖80g Python全栈视频修改属性1 描述：请为牛客网的员工创建一个Em…

人工智能 2023年7月16日
0092
OpenCV笔记：cv2.VideoCapture 完成视频的跳帧输出操作

背景我开始关注这个问题，是在使用 PaddleOCR + OpenCV 进行视频文字识别的时候，因为OpenCV 需要循环读取视频的每一帧进行解析，这就导致视频播放特别卡顿。由于…

人工智能 2023年7月18日
0074
跟着Cell学单细胞转录组分析(十三):单细胞GSVA分析|这个包涵盖大多数物种

之前我们发过GSVA分析（有了这个包，猪的GSEA和GSVA分析也不在话下（第一集），【后续来了】有了这个包，猪的GSEA和GSVA分析也不在话下（第二集）），接着单细胞系列，重新…

人工智能 2023年5月31日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

整合多组学数据进行分型之MOVICS

主要流程

说在最后

大家都在看