分类问题：Logistic回归算法

2023年7月2日上午1:46 • 人工智能 • 阅读 74

分类问题

Logistic回归算法

如果使用直线来拟合数据的话，我们将分类器输出阈值设为0.5，若h θ ( x ) ⩾ 0.5 h_\theta(x)\geqslant0.5 h θ(x )⩾0 .5，则可以预测y = 1 y=1 y =1，否则认为y = 0 y=0 y =0。但是如果我们再训练集中再添加一个Tumor Size很大的点，再运行线性回归我们会得到另一条直线去拟合数据，此时如果再选择0.5作为阈值则分类结果不理想。所以线性回归通常不是解决分类问题的好方法。

当面对一个分类问题时，我们应该如何选择假设方程？

在logistic回归模型中我们通常将假设函数定义为h θ ( x ) = g ( θ T x ) h_\theta(x)=g(\theta^Tx)h θ(x )=g (θT x )，其中g g g是关于z z z的函数：g ( z ) = 1 1 + e − z g(z)=\frac{1}{1+e^{-z}}g (z )=1 +e −z 1 ，称为logistic函数或sigmoid函数。由此我们可以得到假设函数的形式为：h θ ( x ) = 1 1 + e − θ T x h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}h θ(x )=1 +e −θT x 1 。有logistic函数的图像可以看出，其定义域为(− ∞ -\infty −∞,+ ∞ +\infty +∞)值域为(0,1)，因此假设函数h θ ( x ) h_\theta(x)h θ(x )的值就一定在0和1之间。

; 决策界限(decision boundary)

上面我们知道了logistic回归的假设函数形式，那么这个假设函数在何时会预测y = 1 y=1 y =1，何时预测y = 0 y=0 y =0呢？具体地说，这个假设函数输出的是给定x x x和参数θ \theta θ时，y = 1 y=1 y =1的估计概率。因此我们可以设定当h θ ( x ) ⩾ 0.5 h_\theta(x)\geqslant0.5 h θ(x )⩾0 .5时认为y = 1 y=1 y =1，否则认为y = 0 y=0 y =0。

由sigmoid函数图像可以看出，当z ⩾ 0 z\geqslant0 z ⩾0时，g ( z ) ⩾ 0.5 g(z)\geqslant0.5 g (z )⩾0 .5，即θ T x ⩾ 0 \theta^Tx\geqslant0 θT x ⩾0时，h θ ( x ) ⩾ 0.5 h_\theta(x)\geqslant0.5 h θ(x )⩾0 .5，此时我们预测y = 1 y=1 y =1。

例如，假设我们已经拟好了参数θ = [ − 3 , 1 , 1 ] T \theta=[-3,1,1]^T θ=[−3 ,1 ,1 ]T，由上述可知，当假设函数h θ ( x ) ≥ 0.5 h_\theta(x)\ge0.5 h θ(x )≥0 .5，即θ T x ≥ 0 \theta^Tx\ge0 θT x ≥0时，我们可以预测y = 1 y=1 y =1，所以只要任何一个x x x满足等式x 1 + x 2 ≥ 3 x_1+x_2\ge3 x 1 +x 2 ≥3，那么我们就能预测y = 1 y=1 y =1。

其中x 1 + x 2 = 3 x_1+x_2=3 x 1 +x 2 =3这条直线也就是决策边界，他将整个平面分成了两部分，其中一片区域假设函数预测y = 1 y=1 y =1，另一区域预测y = 0 y=0 y =0。

决策边界是假设函数的一个属性，他包括参数θ 0 , θ 1 , θ 2 \theta_0,\theta_1,\theta_2 θ0 ,θ1 ,θ2 ，在上图例子中我们给出了一个训练集，但是即使我们去掉这个数据集，这条决策边界以及我们预测的y = 1 y=1 y =1和y = 0 y=0 y =0的区域，他们都是假设函数的属性，决定于其参数，与具体的数据集无关。 只要我们有具体的参数θ \theta θ ，我们就将完全确定决策边界。

如何拟合Logistic回归模型中参数 θ \theta θ 的值？

在线性回归中，我们定义代价函数J ( θ ) = 1 2 m ∑ i = 1 m ( h θ ( x i ) − y i ) 2 J(\theta)={ \frac{1}{2m}\sum_{i=1}^{m}\left ( h_{\theta}\left ( x^{i} \right )-y^{i} \right )^2}J (θ)=2 m 1 ∑i =1 m (h θ(x i )−y i )2，但是在Logistic回归模型中假设函数的形式为h θ ( x ) = 1 1 + e − θ T x h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}h θ(x )=1 +e −θT x 1 ，此时将其代入代价函数中，得到的代价函数是一个非凸函数，存在多个局部最优解（如下图左），此时若运行梯度下降算法计算代价函数的最小值，那么很可能得不到全局最优解。因此我们需要另外找一个代价函数来保证利用梯度下降法能够找到全局最小值。

下面是我们针对Logistic回归模型定义的代价函数C o s t ( h θ ( x ) , y ) Cost(h_\theta(x),y)C o s t (h θ(x ),y )（注意：代价函数是为了根据训练集的数据来找到代价最小时的参数θ \theta θ，因此关于x , y x,y x ,y的值都是训练集中已经给出的，我们要做的是找到合适的θ \theta θ来拟合数据。）

如果y = 1 y=1 y =1时：

如果y = 0 y=0 y =0时：

下面我们使用稍微简单一点的方法来写代价函数来替换上面的写法。这个式子是根据统计学中的极大似然估计得到的。

根据这个代价函数，我们要找出使得J ( θ ) J(\theta)J (θ)取得最小值的参数θ \theta θ。如果我们试着减小代价函数j ( θ ) j(\theta)j (θ)的取值，我们将得到某组参数θ \theta θ，最后，如果给我们一个新的样本具有某些特征值x x x，我们就可以用拟合训练样本的参数θ \theta θ来输出这种预测。此外，假设函数输出的取值h θ ( x ) h_\theta(x)h θ(x )实际上就是y = 1 y=1 y =1的概率。

接下来要做的就是弄清楚如何最小化代价函数J ( θ ) J(\theta)J (θ)，这样我们才能为训练拟合出参数θ \theta θ。

最小化代价函数J ( θ ) J(\theta)J (θ)使用的是梯度下降法：

这里的1 m \frac{1}{m}m 1 是常数，应该可以并入到学习率α \alpha α里面，最后得到的代价函数为：

我们可以看到Logistic回归的代价函数和线性回归的代价函数式子是完全一样的，但是我们要注意的是，Logistic回归算法中的假设函数h θ ( x ) h_\theta(x)h θ(x )的定义发生了变化。因此，即使更新参数的规则看起来基本相同，但由于假设函数的定义不同，所以他和线性回归的梯度下降实际上是两个完全不同的东西。

; 多元分类：一对多

下面就是一个多元分类的例子，我们要做的就是把这个训练集转化为三个独立的二元分类问题。

实际上每个分类器h θ ( i ) ( x ) h_{\theta}^{(i)}(x)h θ(i )(x )计算的是正类别的概率，例如第二个分类器将正方形作为正类别，那么h θ ( 2 ) ( x ) h_{\theta}^{(2)}(x)h θ(2 )(x )的值就等于给定x x x和θ \theta θ时，y = 2 y=2 y =2的概率。

Original: https://blog.csdn.net/weixin_44320429/article/details/122728164
Author: 周八营业的代码人
Title: 分类问题：Logistic回归算法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664473/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

语音质量的评价指标介绍及MATLAB实现（一）

主观指标 MOS 最常用和相对简单的主观质量指标是分级判断方法，采取５个级别对被测语音的质量进行评价。待测语音的质量是在所有试听人员的评分上求平均得到的。这种方式被称作平均意见得分…

人工智能 2023年5月25日
0077
pytorch初学笔记（二）：TensorBoard的使用

目录一、SummaryWriter类的介绍 1. 定义 2. SummaryWriter初始化 2.1 初始化 2.2 帮助文档给出的使用范例 2.3 常用方法二、add_sc…

人工智能 2023年7月22日
0067
部分设计模式对比分析

桥接模式与装饰者模式区别：桥接模式类图装饰者模式类图 1、定义： (1)桥接模式：将抽象部分与它的实现部分分离，使它们都可以独立地变化 (2)装饰者模式：动态地给一个对象 …

人工智能 2023年6月6日
0080
【NLP】非监督文本匹配算法——BM25 Python实现

算法原理与程序使用 BM25算法原理参见我的博文：【NLP】非监督文本匹配算法——BM25，代码已上传至Github：https://github.com/Htring/BM25，…

人工智能 2023年5月28日
0066
python虚拟环境的建立和使用

为什么要建立虚拟环境？之前我也一直搞不清楚这个问题，直到有一次我安装TensorFlow，然后安装opencv-python，还安装了Pytorch等一系列库，最后共同依赖的其他…

人工智能 2023年5月24日
0057
泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络

1摘要文中提出了一种新的学习框架PixelNeRF，针对的是原本NeRF的不足。即现有的构建神经辐射场的方法往往需要大量的已知观察视角的图片作为输入并且需要花费大量的训练时间。P…

人工智能 2023年7月28日
0043
ROS的基本介绍及基本实践操作案例

目录 * – + ROS实践-小乌龟 + 传感器的基础节点使用 + IMU传感器 + RealSense D435相机 + RS-Helios-16P雷达 + 每文一语…

人工智能 2023年7月25日
0060
Python 元组tuple详解（超详细）

元组是有序且不可更改的集合。在Python中，元组使用圆括号 () 编写的。 1、创建元组元组的创建很简单，使用圆括号 () 直接创建或者使用 tuple() 函数创建，只需…

人工智能 2023年7月4日
0078
电源学习-DCDC电源分类

电源学习-DCDC电源分类 前提说明：本&amp…

人工智能 2023年6月30日
00102
产品速递 | 璞华易投估值管理系统，灵活多样的数据模型让估值更加精准高效！

PE·TOU-估值管理系统随着近年来上市企业队伍快速扩张，行业资本化成为热门话题，上市企业在技术创新、业务模式、管理模式、产品服务等方面的探索，逐渐成为了行业发展的风向标。但与此…

人工智能 2023年6月28日
0068
零基础学python（5/7）|pandas|DataFrame/Series

数据序列 ⭕创建序列：pd.Series() ⭕序列转换为numpy：series.to_numpy() ⭕序列转换为list：series.values.tolist() ⭕创建…

人工智能 2023年7月9日
0084
yolov7开源代码讲解–训练代码

以前看CNN训练代码的时候，往往代码比较易懂，基本很快就能知道各个模块功能，但到了后面很多出来的网络中，由于加入了大量的trick，导致很多人看不懂代码，代码下载以后无从下手。训练…

人工智能 2023年7月25日
0086
【目标检测】YOLOV1详解

前言最近在公司实习，看到其实很多落地的模型都是基于yolo来改进的。在闲暇之余又重新温故了一下yolo系列，并想着将它们进行一个总结。今天就从V1下手，接下来的几个系列也会分别进…

人工智能 2023年7月12日
0087
吃透Chisel语言.39.Chisel实战之单周期RISC-V处理器实现（一）——需求分析和初步设计

Chisel实战之单周期RISC-V处理器实现（上）——需求分析和初步设计需求分析首先明确我们要做的是什么，这个在标题里面已经说明了，我们要做的是一个单周期RISC-V处理器…

人工智能 2023年7月30日
0071
数据分析 | R语言绘制中国地图

1、重现CB中的采样方案图首先，小编先用R重现一下CB中的采样方案图，该文的链接如下： https://doi.org/10.1038/s42003-021-02907-3 1）…

人工智能 2023年6月11日
00193
GAnet A Keypoint-based Global Association Network for Lane Detection 代码调试与阅读笔记

首先从train.py文件开始阅读 trian.py args = parse_args(）调用parse_args()函数为解析命令行参数进行配置 def parse_args…

人工智能 2023年7月27日
0069

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30