机器学习-分类随机森林分析(randomForest模型构建、参数调优、特征变量筛选、模型评估和基础理论等)

2023年6月19日下午2:03 • 人工智能 • 阅读 109

此文主要涉及随机森林分类分析，主要包含以下几部分内容：

1）随机森林基础知识

2）randomForest()认识及构建分类判别模型；

3）随机森林参数调优

4）随机森林模型评估

classification rate、Sensitivity和specificity和ROC curve/AUC value

5）特征变量重要性筛选及绘图

重要性指数排序、交叉验证及Boruta算法筛选

一、准备数据

此处使用的包含分类信息的虚构微生物otu数据，用于构建随机森林分类模型。主要分析目的：1）构建准确率高的随机森林分类模型，2）检测分类水平间重要的OTUs(biomarkers)。

1.1 导入数据
setwd("D:\\EnvStat\\公众号文件\\随机森林分析") # 设置工作路径
#dir()
#file.show("otu.csv")
otu = read.csv("otu.csv",row.names = 1,header = TRUE,check.names = FALSE,stringsAsFactors = FALSE) # 微生物组数据
dim(otu)
head(otu)

# 1.2 计算相对丰度
spe = otu
spe[3:ncol(spe)]

Original: https://blog.csdn.net/qq_39859424/article/details/124777166
Author: EcoEvoPhylo
Title: 机器学习-分类随机森林分析(randomForest模型构建、参数调优、特征变量筛选、模型评估和基础理论等)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/639341/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

THCudaCheck FAIL file=/opt/conda/conda-bld/python/pytorch/work/aten/src/THC/THCCachingHostAllocator.

各位大佬好，我想跑YOLOV5，用极链云租了个实例，按照帮助文档：https://cloud.videojj.com/help/。配置好了环境，pycharm deployment…

人工智能 2023年7月10日
0046
pytorch–常用激活函数使用方法（21个）

1、torch.nn.ReLU() 数学表达式 ReLU的函数图示如下: 优点：（1）收敛速度比 sigmoid 和 tanh 快；（梯度不会饱和，解决了梯度消失问题）（2）计算复…

人工智能 2023年6月23日
00100
FastAPI使用教程（更新中）

文章目录一、安装命令二、模板三、启动命令四、访问测试 * 1.访问服务 2.访问API文档五、参数方法详解 * 1.路径参数 2.指定数据类型的路径参数 3.枚举路径参数…

人工智能 2023年6月15日
0095
3GPP R17 NR测量GAP增强

3GPP R17 NR测量GAP增强包含三个部分，(1) Pre-configured MG pattern(s), (2) Multiple concurrent and ind…

人工智能 2023年6月30日
0082
深度学习系列资料总结

👨‍💻 作者简介： CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨ 公众号：GoAI的学习小屋，免费分享书籍、简历、…

人工智能 2023年6月24日
0085
python数据分析的一些基础性知识（一）

1、pandas中的数据读写文本文件是由若干行字符构成的计算机文件，csv是一种用分隔符分隔的文件格式，相对简单，比较通用，是以纯文本形式存储表格数据（数字和文本），应用于程序之…

人工智能 2023年6月11日
00267
(滔的深度世界)-MixUp图像分类的代码讲解

关于MixUp主要做法: 第一步: 生成公式上的，这个主要是根据狄利克雷分布, 即抛出一个硬币, 正面1000，反面1000，那么下一次的概率值就接近于0.5了 np.random…

人工智能 2023年7月2日
00103
python实现简单的情感分析

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月27日
0078
数据安全刻不容缓，国产智能化厂商首获SOC 2鉴证报告有何意义?

数据安全刻不容缓，国产智能化厂商首获SOC 2鉴证报告有何意义? 了解SOC 2与ISO 27001的区别，你就知道SOC 2对智能自动化厂商的意义了文/王吉伟要问当前组织对于…

人工智能 2023年6月4日
00109
ACL2021 知识图谱、推荐系统相关论文

作者 | Ccxs整理 | NewBeeNLP 知识图谱 Robust Knowledge Graph Completion with Stacked Convolutions a…

人工智能 2023年6月1日
0071
AlexNet网络的搭建以及训练花分类

本学习笔记参考自B站up主霹雳吧啦Wz 其中也是首次再CNN中应用到了 ReLU和 Dropout 输入的数据特征为224×224×3，同时论文中采用双GPU并行运算的方法，我们…

人工智能 2023年7月2日
0064
Linux conda tensorflow-gpu安装及Not creating XLA devices, tf_xla_enable_xla_devices not set相关问题解决

0、首先介绍一下conda创建虚拟环境的基本操作。（1）创建Python的虚拟环境，并指定Python版本，不指定的话会使用默认的版本(Conda Base 环境中的Python版…

人工智能 2023年5月25日
0098
OpenCV（C++）入门示例 – 传统方法目标检测

前言：本示例是本人为了帮老师带实验课现学现卖做的一个小项目，使用的方法不一定是最合适的，大家可以作为参考。运行环境：Windows + OpenCV 3.4.1 + C++，环境…

人工智能 2023年7月10日
0075
ubuntu安装mysql8.0

这个mysql安装的我很累，特别是修改root登录密码那一步，如果安装的旧版本就不用看我这篇文章了，如果安装的8.0以上的可以参考本篇文章一步一步进行安装即可。第一步：更新软件…

人工智能 2023年7月29日
0061
机器学习_深度学习毕设题目汇总——图像分类

下面是该类的一些题目：题目基于三维卷积神经网络的高光谱遥感图像分类技术研究基于判别性特征学习的极化SAR图像分类基于卷积神经学习表征框架的高光谱图像分类基于卷积神经网络与邻域相关…

人工智能 2023年6月15日
00116
用Python实现简单的人脸识别，10分钟搞定！（附源码）

前言让我的电脑认识我，我的电脑只有认识我，才配称之为我的电脑！今天，我们用Python实现简单的人脸识别技术！ Python里，简单的人脸识别有很多种方法可以实现，依赖于pyt…

人工智能 2023年7月3日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习-分类随机森林分析(randomForest模型构建、参数调优、特征变量筛选、模型评估和基础理论等)

大家都在看