六、分类问题和逻辑回归

2023年7月2日上午8:11 • 人工智能 • 阅读 43

文章目录

1、分类问题-classification
2、逻辑回归-Logistic Regression
*
2.1 决策边界
THE END

1、分类问题-classification

\qquad 区分垃圾邮件(0-1分类问题)，网上交易是否诈骗(0-1分类问题)，判断肿瘤是否为良性(0-1分类问题)都为简单的二元分类问题。用线性回归方式来解决分类问题的思路为：首先根据给定的训练数据来拟合一条线性函数，之后找到纵坐标为0.5的对应的横坐标的值v a l val v a l，之后将小于v a l val v a l的值标记为分类1，将大于v a l val v a l的值标记为分类0。这种方法会受到训练数据较大的影响，若有一个偏离较大的训练数据，则会让回归函数出现较大的偏离，使得预测结果变得很差。

; 2、逻辑回归-Logistic Regression

\qquad使用线性回归来解决分类问题的另一大弊端在于当前需要的预测值y ∈ { 0 , 1 } y \in {0,1}y ∈{0 ,1 }，而线性回归函数的值包含任意值，为了解决这个问题，可以将假设函数的形式进行更改，使得0 ≤ h θ ( x ) ≤ 1 0 \leq h_{\theta}(x)\leq 1 0 ≤h θ(x )≤1，从而引出 Logistic Functin或者叫做 Sigmoid Function。 Sigmoid Function的函数表达式和函数图像如下所示：
h θ ( x ) = g ( θ T x ) h_{\theta}(x)=g(\theta^Tx)h θ(x )=g (θT x )g ( z ) = 1 1 + e − z g(z)=\frac{1}{1+e^{-z}}g (z )=1 +e −z 1 h θ ( x ) = 1 1 + e − θ T x h_{\theta}(x)=\frac{1}{1+e^{-\theta^Tx}}h θ(x )=1 +e −θT x 1

\qquad上述 Sigmoid Function将给出h θ ( x ) h_{\theta}(x)h θ(x )输出为1的概率，例如当
h θ ( x ) = 0.7 h_{\theta}(x)=0.7 h θ(x )=0 .7时，表示输出有70%概率为1，同时表示输出有30%概率为0。所以 Sigmoid Function可以很好地解决0-1分类问题。当输出不小于0.5将这个实验数据划分到1的分类中，否则划分到0的分类中。
h θ ( x ) = P ( y = 1 ∣ x ; θ ) = 1 − P ( y = 0 ∣ x ; θ ) h_{\theta}(x)=P(y=1|x;\theta)=1-P(y=0|x;\theta)h θ(x )=P (y =1 ∣x ;θ)=1 −P (y =0 ∣x ;θ)

2.1 决策边界

\qquad 上述提到，当h θ ( x ) h_{\theta}(x)h θ(x )的值不小于0.5将这个实验数据划分到1的分类中，否则划分到0的分类中，即h θ ( x ) ≥ 0.5 → y = 1 h_{\theta}(x) \geq 0.5 → y = 1 h θ(x )≥0 .5 →y =1 h θ ( x ) < 0.5 → y = 0 h_{\theta}(x) < 0.5 → y = 0 h θ(x )<0 .5 →y =0 \qquad根据上述 Sigmoid Function函数图像可以得出下述结论：g ( z ) ≥ 0.5 w h e n z ≥ 0 g(z)\geq0.5\ \ when\ \ z \geq 0 g (z )≥0 .5 w h e n z ≥0 \qquad 根据上述式子可以推出：h θ ( x ) = g ( θ T x ) ≥ 0.5 w h e n θ T x ≥ 0 h_{\theta}(x)=g(\theta^Tx)\geq0.5 \ \ when \ \ \theta^Tx\geq 0 h θ(x )=g (θT x )≥0 .5 w h e n θT x ≥0 \qquad所以有：θ T x ≥ 0 → y = 1 \theta^Tx\geq 0 → y = 1 θT x ≥0 →y =1 θ T x < 0 → y = 0 \theta^Tx < 0 → y = 0 θT x <0 →y =0 \qquad通过下述示例来进一步理解决策边界：

\qquad上例中决策边界为x = 5 x=5 x =5，当x ≤ 5 x\leq5 x ≤5时，y = 1 y=1 y =1；当x > 5 x>5 x >5时，y = 0 y=0 y =0。

\qquad同时需要注意，决策边界不一定为线性的形式，也可以为二次或者高次函数。

\qquad通过上述分析可以看出，训练数据集不是用来确定决策边界的，而是用来训练参数θ \theta θ的，一旦得到一组确定的参数θ \theta θ，就可以根据上述方法确定出决策边界。

; THE END

Original: https://blog.csdn.net/weixin_43160744/article/details/121939828
Author: Dragon Fly
Title: 六、分类问题和逻辑回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665045/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

灰色预测GM(1,1)模型

目录简介数学模型分析步骤对数据进行准指数规律检验对预测效果进行评价 GM(1,1)模型拓展 MATLAB源码简介在这里，灰色的意思是系统的信息只有一部分，不完整，与之…

人工智能 2023年6月25日
0053
对遥感图像的分类处理综合应用

此次作业为作者&#…

人工智能 2023年7月3日
0070
大数据分析-实验四情感分析

Tec4-情感分析 TextBlob – 英文分析如果没有库，需要先安装: pip install textblob from textblob import Tex…

人工智能 2023年5月31日
0064
Pyspark聚类–PowerIterationClustering

PowerIterationClustering class pyspark.ml.clustering.PowerIterationClustering(k=2, maxIter…

人工智能 2023年5月31日
0085
Java 中文情感分类(or 文本分类)：Alink 中文情感分析、HanLP 中文情感分析、SparkML 中文情感分析(待定)

文章目录 * – + 一、项目目录与地址 + 二、Alink 中文情感分析：微博评论情感分析 + 三、HanLP 中文情感分析 + 四、SparkML 中文情感分类(待…

人工智能 2023年5月31日
0064
AcWing_4262

差分 + 贪心。先将两个序列做差，对作完差的序列取差分序列 s s s 。我们需要求将 s s s 转化为全零差分序列的最小操作次数 t t t 。证明：将相应的操作取逆操…

人工智能 2023年6月29日
0063
【python】pandas的excel处理：员工薪水分析

导入数据并把数据读出 import pandas as pd data = pd.read_csv("salaries.csv") data.head() 删除…

人工智能 2023年7月17日
0041
基于梅尔频谱的音频信号分类识别(Pytorch)

基于梅尔频谱的音频信号分类识别(Pytorch) 目录基于梅尔频谱的音频信号分类识别(Pytorch) 1. 项目结构 2. 环境配置 3.音频识别基础知识 (1) STFT和声…

人工智能 2023年7月23日
0070
参考 | 如何利用 ffmpeg/python/飞书自制字幕

参考 | 如何利用 ffmpeg/python/飞书自制字幕文章目录参考 | 如何利用 ffmpeg/python/飞书自制字幕 1. ffmpeg设置默认音频 2. py…

人工智能 2023年5月25日
00104
[论文笔记][半监督语义分割]Universal Semi-Supervised Semantic Segmentation

论文原文原文地址 Motivations 传统的训练方式需要针对不同 domain 的数据分别设计模型，十分繁琐（deploy costs）语义分割数据集标注十分昂贵，费时费力 …

人工智能 2023年6月6日
0069
关于跳跃连接卷积网络

在训练深度神经网络时，模型的性能随着架构深度的增加而下降。这被称为退化问题。网络深度的增加，模型的性能下降的原因可能是什么？ a，过度拟合。随着深度的增加，模型往往会过度拟合 b…

人工智能 2023年6月23日
0075
YOLOX改进之一：添加CBAM、SE、ECA注意力机制

前言：之前发布系列已经有对2020年发布的YOLOv5进行改进，不少朋友咨询YOLOX改进方法，本系列就重点对YOLOX如何改进进行详细介绍，基本跟YOLOv5一致，有细微差异。…

人工智能 2023年6月23日
00100
【爬虫系列】Python 爬虫入门（2）

接上篇，继续梳理 Python 爬虫入门的知识点。这里将重点说明，如何识别网站反爬虫机制及应对策略，使用 Selenium 模拟浏览器操作等内容，干货满满，一起学习和成长吧。 1、…

人工智能 2023年6月27日
0077
ROS Noetic+OpenCV 3.2 保姆级安装教程

前言：随着时间的推移导师的研究方向推向了定位这一块，Opencv不由地说就成了最好的软件了解到leo vin orb 这些算法都在opencv的基础上，查阅了各种资料，花费了小一…

人工智能 2023年7月18日
00109
机器学习 1-4节机器学习定义模型描述代价函数梯度下降多元线性回归特征缩放法均值归一化判断梯度下降是否收敛学习率多项式回归正规方程

机器学习文章目录机器学习 * 1.2 机器学习定义 1.3-4 机器学习的分类 2.1 模型描述（线性回归模型） 2.2-4 代价函数 2.5-6 梯度下降算法 2.7 线性回…

人工智能 2023年6月18日
0090
头歌平台-机器学习-4.朴素贝叶斯分类器

EduCoder：机器学习—朴素贝叶斯分类器第1关：条件概率 ; 第2关：贝叶斯公式第3关：朴素贝叶斯分类算法流程编程要求：根据提示，完成fit与predict函数，分别实现…

人工智能 2023年7月3日
00469

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

六、分类问题和逻辑回归

文章目录

2.1 决策边界

大家都在看