机器学习第2集——回归决策树DecisionTreeRegressor() 附案例

2023年6月17日下午6:48 • 人工智能 • 阅读 85

先看看他在库中的类

class sklearn.tree.DecisionTreeRegressor (criterion='mse', splitter='best', max_depth=None,
min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None,
random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, presort=False)

重要参数详解：

1、 criterion ：可选三种

① mse（均方误差，父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准）
② friedman_mse（费尔德曼均方误差，标使用弗里德曼针对潜在分枝中的问题改进后的均方误差）
③ mae（绝对平均误差，使用叶节点的中值来最小化L1损失）

下面2-8个属性详见往期文章《机器学习第1集》

2、splitter

3、max_depth

4、min_samples_split

5、min_samples_leaf

6、max_features

7、random_state

8、min_impurity_decrease

重要属性：

1、feature_importances_

重要接口：

1、apply：

2、fit：用于导入数据集（训练集）

3、predict：

4、score：返回的是R²，可以为负，模型很糟糕的时候为负

建立模型还是三部曲：实例化、训练模型、评估模型

下面简单建立一颗回归树

先导入我们需要使用的库
使用环境是 jupyter notebook 或 jupyter lab
from sklearn.datasets import load_boston               # sklearn.datasets为调用sklearn中自带的经典数据集
from sklearn.model_selection import cross_val_score    # 导入给回归树评分的类
from sklearn.tree import DecisionTreeRegressor         # 导入回归树模型

regressor = DecisionTreeRegressor(random_state=0) # 实例化，其实就是建立模型的意思
                                                  # random_state=0 表示随机种子设为0
回归树的评价方法：交叉验证，cross交叉val验证score分数
cross_val_score(regressor                 # 输入模型
                , boston.data             # 输入特征矩阵
                , boston.target           # 输入目标矩阵
                , cv=10                   # 数据集分成10份进行交叉验证
            #    , scoring = 'neg_mean_squared_error'      # 选择该项则模型得分以mse的负数形式返回
               ).mean()                   # 十次交叉验证求平均

下面直接附案例，对（含有噪声的）正弦函数建立回归树

########################
导入库
########################
先导入需要的库
import numpy as np                              # 用于创建带有噪声的正弦函数的 一些点
from sklearn.tree import DecisionTreeRegressor  # 导入回归树模型
import matplotlib.pyplot as plt                 # 用于作图

########################
创建一条带有噪声的正弦函数的一些点
########################
rng = np.random.RandomState(1)           # 定义一个随机数种子
x = np.sort(5 * rng.rand(80,1), axis=0)  # 产生一个80行1列的数组，将数组扩大5倍并排序
y = np.sin(x).ravel()                    # 利用上面的x生成y=sinx的数组，并将二维降成一维
y[::5] += 3 * (0.5 - rng.rand(16))       # 添加噪声

在y的值中，从头到尾的数值中，每5步作如下操作：
3*（0.5-（16个0到1之间的随机数））得到的值，赋值给y中对应的数值
rand()方法是生成0到1之间的随机数，括号中可以填数字也可以填数组，例如rng.rand(10)、rng.rand(3,4)

把正弦函数图像画出来
plt.figure()       # 创建画板
plt.scatter(x, y, s=20, edgecolor="black",c="darkorange", label="data")    # scatter()用于画散点图

'''
plt.figure()  创建画板
figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True)
num:图像编号或名称，数字为编号 ，字符串为名称
figsize:指定figure的宽和高，单位为英寸；
dpi参数指定绘图对象的分辨率，即每英寸多少个像素，缺省值为80 1英寸等于2.5cm,A4纸是 21*30cm的纸张
facecolor:背景颜色
edgecolor:边框颜色
frameon:是否显示边框
'''

########################
建立模型三部曲
########################
实例化
regr_1 = DecisionTreeRegressor(max_depth=2)
regr_2 = DecisionTreeRegressor(max_depth=5)
训练模型
regr_1.fit(x, y)
regr_2.fit(x, y)
给模型评分
测试集导入模型，预测结果
X_test = np.arange(0.0, 5.0, 0.01)[:, np.newaxis]
y_1 = regr_1.predict(X_test)
y_2 = regr_2.predict(X_test)

########################
画图
########################
plt.figure()                            # 创建画板/画布
plt.scatter(x, y, s=20, edgecolor="black",c="darkorange", label="data")
                                        # s=图像的大小，edgecolor=边框颜色，c=点的颜色，label=标签
plt.plot(X_test, y_1, color="cornflowerblue",label="max_depth=2", linewidth=2)
                                        # plt.plot()画折线图，其他参数都很好理解，自己看看
plt.plot(X_test, y_2, color="yellowgreen", label="max_depth=5", linewidth=2)
                                        # 同上
plt.xlabel("data")                      # 横坐标标签
plt.ylabel("target")                    #纵坐标标签
plt.title("Decision Tree Regression")   #图的标题
plt.legend()                            #显示图例
plt.show()                              #把上面的代码的图画出来

得到的结果为：

机器学习第2集——回归决策树DecisionTreeRegressor() 附案例

Original: https://blog.csdn.net/m0_66470984/article/details/127047296
Author: 致力于成为卷王
Title: 机器学习第2集——回归决策树DecisionTreeRegressor() 附案例

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/631488/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SPSS/PROCESS-调节效应

想要学习更多数据分析知识，请关注”数据分析成长记”微信公众号，更多精彩文章等你来读！ 01 模型说明简单回归模型方程为： Y=i+c1X+c2M0+c3X…

人工智能 2023年7月17日
0049
利用matlab实现无约束最优化方法

目录 1.最速下降法 2.加速梯度法——最速梯度下降法的改进 3.Newton法—–多维 4.阻尼Newton法 5、FR共轭梯度法 6、变尺度法&#821…

人工智能 2023年6月19日
0057
Automatically Labeled Data Generation for Large Scale Event Extraction论文笔记

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、当年现状二、数据集三、方法 * 小结总结前言例如：本周阅读了这篇论文，特此记录笔记 …

人工智能 2023年6月1日
0083
【AI视野·今日Sound 声学论文速览第四期】Thu, 21 Apr 2022

AI视野·今日CS.Sound 声学论文速览Thu, 21 Apr 2022Totally 7 papers👉上期速览✈更多精彩请移步主页 ; Interesting: 📚基于生成…

人工智能 2023年5月25日
00117
Arduino从零开始(0)——介绍与点亮LED

0.前言 Arduino大致由两个要素构成。硬件，Arduino控制板，如Arduino Uno，Arduino Mega2560等这些；软件，Arduino IDE开发环境，通过…

人工智能 2023年6月28日
0080
多项式概率分布（Multinomial probability distribution）和分类分布（categorical distribution）

文章目录 * – + 多项式概率分布 + 分类分布多项式概率分布其由二项分布推广而来，从而更加普遍。所以我们先回顾一下二项分布。二项分布的典型例子是扔硬币，设硬币…

人工智能 2023年7月2日
0084
Skimage.measure 的compare_psnr和compare_ssim的改动

最近看一个代码里面计算psnr和ssim使用的是老版本的用法，代码跑不起来。 from skimage.measure import compare_psnr,compare_ss…

人工智能 2023年6月15日
00101
YOLOv5改进之一：添加SE注意力机制

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月25日
0074
opencv图像处理进阶——灰度直方图

1、灰度直方图概念灰度直方图反映一幅图像中各灰度级像素出现的频率与灰度级的关系，其中，灰度级为横坐标，频率为纵坐标。灰度级：图像中不同灰度的最大数量，灰度级越大，图像亮度范围越…

人工智能 2023年6月19日
0070
【AI全栈二】视频流多目标多类别无延迟高精度高召回目标追踪 YOLO+Deepsort 全解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0057
宋朝名画“虎戴VR”，在外网火了

金磊 Alex 发自凹非寺量子位 | 公众号 QbitAI 谁能曾想，宋朝的老虎们，有一天能在国外被玩儿火了。事情是这样的。前不久谷歌不是出了个AI创作神器 Imag…

人工智能 2023年7月14日
0065
【论文阅读】Unifying Knowledge Graph Learning and Recommendation

Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of Us…

人工智能 2023年6月1日
0078
keras模型转换为tensorflow的pb模型结构

官方文档介绍如下, 此时博主电脑环境配置为：tensorflow-gpu 2.4.0、python3.6、cuda11.0、cudnn8.0，详细信息可见博主这篇博客应用 Ap…

人工智能 2023年5月25日
0069
Python中eval()函数的使用

今天给大家分享一下Python中的eval()函数，如果感觉博主的文章还不错的话，希望大家点赞支持一下博主文章目录 eval()函数 * 语法实例 – 实例1 实例…

人工智能 2023年7月4日
0071
【深度学习】自编码器（AutoEncoder）

目录 * – + RDAE稳健深度自编码 + * 自编码器（Auto-Encoder） * DAE 深度自编码器 RDAE稳健深度自编码自编码器（Auto-Encod…

人工智能 2023年6月16日
0061
对线性回归的学习与总结

回归分析是指一种预测性的建模技术，主要是研究自变量和因变量的关系。通常使用线/曲线来拟合数据点，然后研究如何使曲线到数据点的距离差异最小。线性回归：假设目标值（因变量）与特征值…

人工智能 2023年6月18日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习第2集——回归决策树DecisionTreeRegressor() 附案例

大家都在看