如何确定分类的阈值，如何确定哪个模型好呢

2023年7月1日下午1:48 • 人工智能 • 阅读 141

当时使用sigmoid时，如果确定分类的阈值呢？

（使用sigmoid的多分类或者softmax的2分类，其实2分类的softmax就是sigmoid没区别）

一般我们喜欢使用0.5这个默认的值。但是如果有更好的阈值使得结果更好，那该如何处理呢。。。

可以使用ROC，如下例子所示，排好序的阈值以对应的10个阈值进行划分，得到对应的统计值。

根据你能接受的假阳性率FPR和召回率TPR来确定对应的点位，再根据点位来查找该点位对应的阈值。

有时候不清楚是召回更重要还是精确率更重要，此时该怎么选择分类模型呢？

可以使用F-score。

什么是F1-score

F1分数（F1-score）是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛，常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数，最大为1，最小为0。

此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重要，F2分数认为召回率的重要程度是精确率的2倍即beta取2，而F0.5分数认为召回率的重要程度是精确率的一半即beta取0.5。计算公式为：

G分数是另一种统一精确率和的召回率系统性能评估标准，G分数被定义为召回率和精确率的几何平均数。

计算过程

首先定义以下几个概念：

TP（True Positive）：预测答案正确

FP（False Positive）：错将其他类预测为本类

FN（False Negative）：本类标签预测为其他类标

通过第一步的统计值计算每个类别下的precision和recall

精准度 / 查准率(precision)：指被分类器判定正例中的正样本的比重

召回率 / 查全率 (recall)：指的是被预测为正例的占总的正例的比重

另外，介绍一下常用的准确率(accuracy)的概念，代表分类器对整个样本判断正确的比重。

通过第二步计算结果计算每个类别下的f1-score，计算方式如下：

通过对第三步求得的各个类别下的F1-score求均值，得到最后的评测结果，计算方式如下：

参考

机器学习中的F1-score_Yucen的博客-CSDN博客_f1 score

Original: https://blog.csdn.net/u013066730/article/details/120076565
Author: mjiansun
Title: 如何确定分类的阈值，如何确定哪个模型好呢

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663463/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Jetson nano上部署yolov5 6.0 tensorrt加速

一、所需文件 1.nano镜像 https://pan.baidu.com/s/1q7I3-p_vWtKOmCWyg1f89Q 2.yolov5 V6.0 GitHub &#821…

人工智能 2023年7月22日
00116
图像分类（一） ResNest——基于Channel-Wise的Split Attention及其block实现

一、回顾Resnet和Resnext Resnet的Residual结构 Resnext中的Multi-branch结构二、Channel-Wise 通道注意力三、Resnes…

人工智能 2023年7月2日
0090
Python之第六章内置容器 — 字符串

Python之第六章内置容器 — 字符串 1.概念 2.凭借字符串 — + 3.多行字符串 4.字符串的切片例输入员工省份证号，输出出生日期 5.分隔…

人工智能 2023年6月28日
00141
关于Focal Loss【转自以学习、回忆】

是解决样本不均衡问题的一种方法，面试常问，但是自己一知半解遂寻文学习来源：CSDN GHZhao_GIS_RS 链接：https://blog.csdn.net/u014311…

人工智能 2023年6月4日
0098
pytorch安装详细步骤

文章目录（一）win—配置tensorflow-GPU （二）安装 pytorch * 2.1 创建虚拟环境 2.2正式安装pytorch 2.3 验证是否安装成功（三）本文参…

人工智能 2023年7月21日
0086
多元线性回归问题——波士顿房价预测

波士顿房价预测数据集包括506个样本，每个样本包括12个特征变量和该地区的平均房价（单价）显然和多个特征变量相关，不是单变量线性回归（一元线性回归）问题，选择多个特征变量来建立线性…

人工智能 2023年5月26日
0091
TypeError: fit_transform() missing 1 required positional argument: ‘X‘——报错

文章目录 1 解决过程【成功】 2 学习Sklearn之数据预处理——StandardScaler * 2.1 数据处理——标准化、归一化 2.2 为什么要归一化？ 2.3 归一化…

人工智能 2023年7月22日
0088
R语言生存分析之COX比例风险模型构建及亚组森林图绘制示例

R语言生存分析之COX比例风险模型构建及亚组森林图绘制示例森林图(forest plots)是以统计指标和统计分析方法为基础, 用数值运算结果绘制出的图型。它在平面直角坐标系中,…

人工智能 2023年5月30日
00137
深度学习之Inception-ResNet

这篇文章由谷歌在17年提出，受启发于何凯明提出的ResNet在深度网络上较好的表现影响，作者将Residual connection加入到Inception结构中形成2个Incep…

人工智能 2023年6月24日
0094
利用MATLAB校准单目摄像头

首先编写图片采集程序，就是将摄像机采集到的图像保存成图片，程序如下，每点击一次’s’键记录一张照片： -*- coding: utf-8 -*- 用于获取单…

人工智能 2023年6月22日
0088
PySpark:使用RDD转化为DataFrame时报错TypeError: Can not infer schema for type: ＜class ‘str‘＞

Spark版本：V3.2.1 前文介绍过说可以将Spark RDD转化为Spark DataFrame，具体可以参考博客：https://blog.csdn.net/yeshang…

人工智能 2023年7月6日
00139
双光子荧光成像_为什么双光子成像如此重要？

成像技术一直是推动声明科学进步的主要动力。历史上，X射线、全息照相法、MRI核共振成像、超高分辨率显微成像技术都获得了Nobel奖。本文引用地址：http://www.eepw.c…

人工智能 2023年6月1日
0066
Prompt Learning详解

现阶段NLP最火的两个idea 一个是对比学习（contrastive learning）另一个就是 prompt prompt 说简单也很简单看了几篇论文之后发现其实就是构建…

人工智能 2023年7月27日
0080
Docker（感谢狂神）

Docker(kuangsheng)B站狂神说java系列之docker笔记整理链接一、Docker概述 1.1、Docker为什么出现？一款产品：开发–上线两套环境！应用…

人工智能 2023年6月28日
0081
论文推荐：TResNet改进ResNet 实现高性能 GPU 专用架构并且效果优于 EfficientNet

TResNet: High Performance GPU-Dedicated Architecture 来自阿里的达摩院，发布于2021 WACV,该论文引入了一系列架构修改，旨…

人工智能 2023年7月13日
0096
web前端期末大作业——基于HTML+CSS+JavaScript实现中国茶文化(30页)

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月26日
00107

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

如何确定分类的阈值，如何确定哪个模型好呢

什么是F1-score

计算过程

大家都在看