机器学习之数据分离与混淆矩阵

简介

实例基本流程:
数据载入->数据可视化与预处理->模型创建->全数据用于模型训练->模型评估

数据分离可以用于模型评估

对全数据进行数据分离,部分用于训练,部分用于新数据的结果预测!

通常来说分为3步:

  1. 把数据分成两部分:训练集、测试集
  2. 使用训练集数据进行模型训练
  3. 使用测试集数据进行预测,更有效地评估模型对于新数据的预测表现

这里的训练集和测试集的比例可以灵活调整, 参考:训练集占70%,测试集占30%;也可能训练集占80%,测试集占20%。

混淆矩阵

在我们前面的分类任务中,都是计算测试数据集预测准确率以评估模型表现,但如果只用accuracy会有很大的局限性,无法真实反映模型针对各个分类的预测准确度

准确率(accuracy):没有体现数据预测的实际分布情况(0,1本身的分布比例), 没有体现模型错误预测的类型

机器学习之数据分离与混淆矩阵
TP: T预测准确,P实际为正样本
TN: T预测准确,N实际为负样本
FP: F预测错误,P实际为负样本
FN: F预测错误,N实际为正样本

可以计算更丰富的模型评估指标

机器学习之数据分离与混淆矩阵

参考链接

https://blog.csdn.net/weixin_46344368/article/details/106845649?spm=1001.2014.3001.5502

Original: https://www.cnblogs.com/eat-too-much/p/16189420.html
Author: HDU李少帅
Title: 机器学习之数据分离与混淆矩阵

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/9663/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部