sklearn中随机森林和梯度提升树的一维回归比较

2023年6月18日下午3:00 • 人工智能 • 阅读 80

随机森林和梯度提升树都是集成评估器，它们由许多基评估器组成，而两种集成评估器的训练模式有所不同，前者是独立训练多个基评估器，基于它们结果的平均做出最终评价；后者则在每次训练中有所侧重，目的是降低集成评估器的偏差，最终将多个较弱的基评估器整合成一个强大的集成评估器

数据准备

此次演示用到的数据为一个普通的正弦函数变换，构造如下：

import numpy as np
x = np.linspace(0, 6, 100)
y = np.sin(x) + np.sin(6*x)

评估器的导入、训练与预测

这里调用sklearn库中的三个回归模型，依次为 DecisionTreeRegressor, AdaboostRegressor(以决策树回归器为基评估器), RandomForestRegressor

from sklearn.ensemble import AdaBoostRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
regr_1 = DecisionTreeRegressor(max_depth=4)
regr_2 = AdaBoostRegressor(
    DecisionTreeRegressor(max_depth=4), n_estimators=300
)
regr_3 = RandomForestRegressor(max_depth = 4,n_estimators=300)

这里不对模型的参数做过多调整。

下面让模型对原数据直接进行拟合，并进行直接预测。

regr_1.fit(x.reshape(-1,1), y)
regr_2.fit(x.reshape(-1,1), y)
regr_3.fit(x.reshape(-1,1), y)

y_1 = regr_1.predict(x.reshape(-1,1))
y_2 = regr_2.predict(x.reshape(-1,1))
y_3 = regr_3.predict(x.reshape(-1,1))

注意sklearn对特征变量和标签变量的维度要求。

为了后续更好地比较，这里使用三种模型默认的评分方法获得相应评分。

scores = []
for i in [regr_1,regr_2,regr_3]:
    scores.append(i.score(x.reshape(-1,1), y))
scores = np.array(scores).round(2)

评估器拟合效果展示

为了展示评估器的拟合与预测效果，这里将其预测结果和原始真值进行一并展示，如下图所示。

每个子图的表达含义与图标题相应。先由左侧汇总图可知，三种训练好的回归器对函数值的预测均有效，但各预测效果各不相同。右侧子图1(中上方子图)展示的是真实值分布，没啥实际意义，放过来起到对比作用，让图片美观。
右侧子图2(右上方子图)展示的是decision tree的预测结果，可以发现decision tree的预测结果很不灵敏，且预测效果较为保守，其预测的最值与真实值的最值有着一定距离。
右侧子图3(中下方子图)展示的是adaboost tree的预测结果，可以发现其预测效果相对单一的decision tree好了很多，明显更加灵敏，波动性更好。但是，其关于最值的预测还是有所欠缺。
右侧子图4展示的是random forest的预测结果，可以发现其预测效果处于decision tree 和adaboost tree之间，相对adaboost tree和decision tree，random forest的预测结果显得更加保守，距离最值有相当距离，但比decision tree 进行了更多的细节拟合(表现为更加平滑)。
此外，右侧子图2，3，4分别在图例下添加了模型得分，可以看见adaboost tree 的得分最高，达到0.97（满分为1），decision tree仅有0.86。

; 总结

此次演示使用的方法较为粗糙，许多处理工作没有涉及，如：变量噪声的设置、数据集的划分、模型的验证、参数的调试、重复训练等等。其背后内容可以展开很多，但该博客均没有涉及。目的是直接比较特定情况下，两种集成评估器的应用效果。从结果来看，相同的基评估器数量(300)，相同的深度(随机森林的深度和梯度提升树的深度含义可能有所差异)下，梯度提升树的效果是较优的。

关于后来：
在2022国庆期间，会更新在实际数据集上训练集成评估器，并进行相应的预测与评估

Original: https://blog.csdn.net/GuFeng1999/article/details/127095820
Author: 心事寄于秋
Title: sklearn中随机森林和梯度提升树的一维回归比较

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635560/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于Python构建机器学习Web应用

目录一、内容介绍 1.Onnx模型 ①skl2onnx库安装 2.Netron安装二、模型构建 1.数据加载 2.划分可训练特征与预测标签 3.训练模型 ①第三方库导入 ②数据…

人工智能 2023年6月23日
00111
Yolov5如何更换BiFPN?

🌟想了解YOLO系列算法更多教程欢迎订阅我的专栏🌟 对于基础薄弱的同学来说，推荐阅读《目标检测蓝皮书》 📘，里面涵盖了丰富的目标检测实用知识，是你迅速掌握目标检测的理想选择！如果…

人工智能 2023年7月27日
0085
ResNet实战：tensorflow2.X版本，ResNet50图像分类任务（小数据集）

摘要本例提取了植物幼苗数据集中的部分数据做数据集，数据集共有12种类别，今天我和大家一起实现tensorflow2.X版本图像分类任务，分类的模型使用ResNet50。通过本文…

人工智能 2023年5月25日
0071
html网页制作期末大作业成品：基于HTML+CSS+JavaScript简洁汽车网站(7页)

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月28日
0098
多分类逻辑回归 MNLogit python

多分类逻辑回归MNLogit 引言实例及python实现 * – + 数据集查看数据情况 Logistics回归 * 输出结果模型评价 + * Precision…

人工智能 2023年7月1日
0072
[机器学习与scikit-learn-25]：算法-聚类-KMeans的适用范围与评估指标

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/art…

人工智能 2023年6月16日
0061
java计算机毕业设计高校图书馆管理网站源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月29日
0083
美国数学建模

一、选题 MCM是真正意义上的数学建模竞赛，它是开始比较早。2000年的时候又开设了一个交叉学科的竞赛ICM，它们的赛题就是各有三道连续型，就是模型主要是建立在一些连续函数的基础…

人工智能 2023年7月17日
0047
机器学习笔记（聚类）层次聚类 Agglomerative Clutsering（Single-linkage、Complete-linkage，Group average）

1 Agglomerative Clutsering 这是一种自底而上的层次聚类方法。大致可以分为三步： 1.将每一个元素单独定为一类2.每一轮都合并指定距离(对指定距离的理解很重…

人工智能 2023年5月31日
0075
MongoDB-使用mongo/mongosh命令行连接数据库

之前的文章中有介绍：但是，直接介绍的都是通过GUI工具去连接数据库，并没介绍用命令行的方式去连接，今天补充一下： 1 使用mongo命令找到安装目录下的bin目录下，有一个mo…

人工智能 2023年7月30日
0045
python实现大疆Tello无人机控制平台并实现语音控制/手势控制/人脸跟踪/绿球跟踪/拍照录像

Tello智能信息处理平台介绍控制 * 键盘控制语音控制视觉功能 * 人脸跟踪绿球跟踪手势控制体态控制拍照录像结语介绍本项目是我的一个课程设计。本来打算做大型…

人工智能 2023年5月25日
00119
基于上下文的推荐算法

背景之前的算法主要研究了如何联系用户和物品，将最符合用户兴趣的物品推荐给用户，但这些算法都忽略了一点，就是用户所处的上下文（context）。这些上下文包括用户访问推荐系统的时间…

人工智能 2023年7月17日
0068
【目标检测】36、OTA: Optimal Transport Assignment for Object Detection

文章目录 * – 一、背景 – 二、方法 – + 2.1 Optimal Transport + 2.2 OT for label assign…

人工智能 2023年7月9日
0043
MySQL密码不要用0开头！！！

我是真的服了……花了大半天连云服务器上的数据库…… 开始时用SQLyog，显示 authentication plugin ‘cac…

人工智能 2023年7月30日
0076
基于matlab进行图像处理学习——从入门到入魔

第一天: ①直方图均衡 ②均值滤波、高斯滤波、中值滤波 ③拉普拉斯滤波器关于matlab matlab基本概况 MATLAB是矩阵实验室（Matrix Laboratory）之意…

人工智能 2023年6月18日
0068
如何将一个NumPy数组转变为Tensor对象

如何将一个NumPy数组转变为Tensor对象在深度学习中，使用Tensor对象是非常常见的，因为它们是一个多维数组（矩阵）的抽象表示。Tensor对象在很多深度学习库中都有支持…

人工智能 2024年1月1日
0033

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

sklearn中随机森林和梯度提升树的一维回归比较

数据准备

评估器的导入、训练与预测

评估器拟合效果展示

; 总结

大家都在看