逻辑回归如何进行模型的训练和优化

2024年1月6日上午1:46 • 人工智能 • 阅读 41

介绍

逻辑回归是分类问题中常用的机器学习算法之一。它使用逻辑函数将输入特征映射到一个概率值，并基于该概率进行分类预测。本文将详细介绍逻辑回归模型的训练和优化过程。

算法原理

逻辑回归模型采用sigmoid函数作为激活函数，将线性回归的结果映射到一个范围在0到1之间的概率值。sigmoid函数的定义如下：

$$
g(z) = \frac{1}{1 + e^{-z}}
$$

逻辑回归模型的预测函数为：

$$
h_\theta(x) = g(\theta^Tx) = \frac{1}{1 + e^{-\theta^Tx}}
$$

其中，$\theta$是模型的参数向量，$x$是输入特征向量。

公式推导

逻辑回归使用最大似然估计法来估计模型参数。假设给定训练集$D = {(x^{(i)}, y^{(i)})}_{i=1}^m$，其中$x^{(i)}$是第$i$个样本的特征向量，$y^{(i)}$是样本的真实标签（0或1）。模型参数$\theta$的似然函数定义如下：

$$
L(\theta) = \prod_{i=1}^m h_\theta(x^{(i)})^{y^{(i)}} \cdot (1 – h_\theta(x^{(i)}))^{1 – y^{(i)}}
$$

为了方便计算，通常使用对数似然函数：

$$
l(\theta) = \log(L(\theta)) = \sum_{i=1}^m y^{(i)}\log(h_\theta(x^{(i)})) + (1 – y^{(i)})\log(1 – h_\theta(x^{(i)}))
$$

目标是最大化对数似然函数，即最小化损失函数$J(\theta)$的负值：

$$
J(\theta) = -\frac{1}{m} \cdot l(\theta) = -\frac{1}{m} \sum_{i=1}^m y^{(i)}\log(h_\theta(x^{(i)})) + (1 – y^{(i)})\log(1 – h_\theta(x^{(i)}))
$$

为了找到使损失函数最小化的参数$\theta$，可以使用梯度下降法进行优化。

计算步骤

初始化模型参数$\theta$，可以采用随机初始化或者将所有参数初始化为0；
使用梯度下降法迭代更新参数$\theta$，直到收敛或达到最大迭代次数：
计算预测值$h_\theta(x)$；
根据梯度下降的更新公式更新参数$\theta$；
返回训练好的模型参数$\theta$。

Python代码示例

下面是一个使用Python实现逻辑回归模型训练和优化的代码示例：

import numpy as np
import matplotlib.pyplot as plt

def sigmoid(z):
 return 1 / (1 + np.exp(-z))

def compute_cost(X, y, theta):
 m = len(y)
 h = sigmoid(X @ theta)
 cost = (1 / m) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.sum(-y artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.log(h) - (1 - y) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.log(1 - h))
 return cost

def gradient_descent(X, y, theta, alpha, num_iters):
 m = len(y)
 J_history = []

 for _ in range(num_iters):
 h = sigmoid(X @ theta)
 gradient = (1 / m) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls (X.T @ (h - y))
 theta -= alpha artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls gradient
 J_history.append(compute_cost(X, y, theta))

 return theta, J_history

# 虚拟数据集
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
y = np.array([0, 0, 1, 1])

# 在X前添加一列1作为截距
X = np.insert(X, 0, 1, axis=1)

# 初始化参数
theta = np.zeros(X.shape[1])

# 设置超参数
alpha = 0.1
num_iters = 100

# 梯度下降优化
theta, J_history = gradient_descent(X, y, theta, alpha, num_iters)

# 绘制损失函数的迭代曲线
plt.plot(range(num_iters), J_history)
plt.xlabel('Iterations')
plt.ylabel('Cost')
plt.title('Cost function convergence')
plt.show()

# 打印训练得到的参数
print('Optimized parameters:', theta)

代码解释：

sigmoid()函数计算sigmoid函数的值；
compute_cost()函数计算损失函数的值；
gradient_descent()函数使用梯度下降法更新参数；
定义虚拟数据集X和y；
在X前添加一列1，以便计算截距；
初始化参数theta；
设置学习率alpha和迭代次数num_iters；
使用梯度下降法进行训练，返回训练得到的参数theta和损失函数的迭代曲线J_history；
绘制损失函数的迭代曲线；
打印训练得到的参数theta。

希望以上示例能帮助你理解逻辑回归模型的训练和优化过程。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824159/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测指标mAP详解

前言相信刚刚接触目标检测的小伙伴也是有点疑惑吧，目标检测的知识点和模型属实有点多，想要工作找CV的话，目标检测是必须掌握的方向了。我记得在找实习的时候，面试官就问到了我目标检测的…

人工智能 2023年7月25日
0045
Unity文字转语音

仅限于Windows系统PC端，如果是webgl需要接入讯飞语音SDK。插件链接：https://download.csdn.net/download/ThreePointsHe…

人工智能 2023年5月27日
0068
torch 中的 uniform 具体用法

背景在陈云的书上看到这个：下面那几个随机函数rand啥的都好理解，就是不知道 uniform怎么用，查了官方文档写的太简略了，所以找了下例子，总结一下。常见两种用法。先给用例…

人工智能 2023年7月6日
0064
Opencv之图像滤波：6.双边滤波(cv2.bilateralFilter)

前面我们介绍的滤波方法都会对图像造成模糊，使得边缘信息变弱或者消失，因此需要一种能够对图像边缘信息进行保留的滤波算法，双边滤波是综合考虑空间信息和色彩信息的滤波方式，在滤波过程中能…

人工智能 2023年6月18日
0069
人工智能-机器学习-深度学习-概述

文章目录本文说明一：人工智能需要的基础和涉及内容二：数学基础 * （1）线性代数（2）概率论（3）数理统计（4）最优化方法（5）信息论三：机器学习 * （1）线性回…

人工智能 2023年7月29日
0057
Android + OpenCV 入门教程笔记（保姆级）

笔记基于Android+openCV培训进行记录源码：github记录不易，喜欢的可以给个三连，感谢感谢！！！ OpenCV概述什么是OpenCV OpenCV是一个基于Apa…

人工智能 2023年5月26日
0091
论文研读笔记（一）——多智能体强化学习的相对分布编队和避障

Relative Distributed Formation and Obstacle Avoidance with Multi-Agent Reinforcement Learn…

人工智能 2023年7月27日
0073
计算机视觉项目实战-基于特征点匹配的图像拼接

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉深度学…

人工智能 2023年7月29日
0054
【DEBUG】解决pandas与numpy版本不协调导致的：Unable to import required dependencies: numpy: DLL load failed找不到指定的模块

Traceback (most recent call last):File “D:\hq_test.py”, line 74, infrom pytdx….

人工智能 2023年7月5日
0064
Java分片上传全解决方案，真香

因为我们是做语音识别的，在离线的情况下，需要上传语音，但是因为语音很大，所以需要拆分进行上传，要不然如果网络波动就前功尽弃了，今天就来复述下这个方案 1、解决方案我们的方案是 …

人工智能 2023年5月25日
0078
Deformable Convolution Networks 代码思路及解析

最近在看一篇CV任务中的Attention机制综述时，觉得其中一篇于2017年发表在CVPR上的Deformable ConvNets很有意思，觉得文章中思路及公式都是清晰明了，…

人工智能 2023年7月12日
0055
Transformer课程第39章：面向Knowledge-intensive任务的Transformer模型RAG的架构及完整源码实现

1，为何Transformer网络能够存储factual knowledge信息？ 2，pretrained dense retrieval数学原理分析 3，sequence-to…

人工智能 2023年5月30日
0078
pandas行和列的获取

DataFrame的行和列：df[‘行’, ‘列’] DataFrame行和列的获取分三个维度行和列选取：df[]，一次只能选取行…

人工智能 2023年6月11日
0094
基于GMM-HMM的语音识别系统

本文介绍GMM-HMM语音识别系统，虽然现在主流端到端系统，但是传统识别系统的学习是很有必要的。阅读本文前，需要了解语音特征提取、混合高斯模型GMM、隐马尔科夫模型HMM的基础知识…

人工智能 2023年5月25日
0063
因子分解机 FM

特征组合/特征交叉为什么要特征交叉？特征交叉的目的是「提升模型的效果」：通过特征交叉，将样本映射至高维空间，从而增加模型的非线性能力，提升模型的预测效果。从辛普森悖论的角度…

人工智能 2023年6月4日
0087
在ubuntu18.04系统上使用ROS跑ORB-SLAM3时遇到的问题总结

1.跑TUM_VI数据集 dataset-corridor4_512 时，从 tum_vi_example.sh 中复制对应的运行命令，输入命令后提示找不到对应的 TUM_512….

人工智能 2023年7月28日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

逻辑回归如何进行模型的训练和优化

介绍

算法原理

公式推导

计算步骤

Python代码示例

大家都在看