逻辑斯蒂（logistic）回归学习+手撕代码

2023年6月18日下午2:53 • 人工智能 • 阅读 111

Logistic回归

最近面试的朋友有被要求现场手写logistic模型，再加上本身有些厂面试爱手撕logistic公式，再加上有些面试会让你介绍一个自己最熟悉的机器学习模型，我寻思这会了一个logistic不就齐活了，话不多说，直接开整！
逻辑回归被广泛应用于估算某个实例属于某个特定类别的概率
1.公式推导（不想编辑公式就手写了友友们）：

使用梯度下降的方向作为参数θ更新的方向，一般在训练时会设置学习率α作为学习的步长，参数更新的公式即为：
θi+1 = θi – α*(y_pre – y)·x

2.逻辑回归的优缺点：
优点：
1）实现简单，计算量小
2）概率推导得到，理论可靠
3）值域为[0,1]，具有概率意义
4）参数代表每个特征对输出的影响，可解释性强
缺点：
1）容易欠拟合，一般准确度不是特别高
2）本质来说是一个线性分类器，对于线性不可分的问题处理的不好
3）特征空间很大的时候，性能不好

3.比较
1）与线性回归的比较：
线性回归的目标变量是连续变量，逻辑回归是类别型变量
线性回归模型的目标变量和自变量之间的关系假设是线性相关的，逻辑回归中则是非线性的
线性回归通常基于正态分布，逻辑回归则是基于二项分布或者多项分布
线性回归的参数估计使用最小二乘，逻辑回归使用最大似然
2）与朴素贝叶斯的比较：
朴素贝叶斯则是直接求出权重，逻辑回归是通过loss最优化求出分类概率
朴素贝叶斯基于条件独立假设，逻辑回归没有这个假设
朴素贝叶斯是生成模型，逻辑回归是判别模型
3）与SVM比较
SVM只输出类别，逻辑回归输出概率
二者的损失函数不同
逻辑回归的可解释性强
SVM自带有约束的正则化

4.代码
代码是找的本站其他帖子手撕的代码做了一些注释和一点点修改参考如下：

from math import exp
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

def create_data():

    iris = load_iris()
    X, y = np.array(iris.data), np.array(iris.target)

    return X[:100, 0:2], y[:100]

X, y = create_data()

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

class LogisticRegressionClassifier:
    def __init__(self, max_iter=200, learning_rate=0.01):

        self.max_iter = max_iter
        self.learning_rate = learning_rate
        self.loss = []

    def sigmoid(self, x):

        return 1 / (1 + exp(-x))

    def data_matrix(self, X):
        data_mat = []
        for d in X:
            data_mat.append([1.0, *d])
        return data_mat

    def fit(self, X, y):
        data_mat = self.data_matrix(X)

        self.weights = np.zeros((len(data_mat[0]), 1), dtype=np.float32)

        for iter_ in range(self.max_iter):
            errors = 0.0
            for i in range(len(X)):
                result = self.sigmoid(np.dot(data_mat[i], self.weights))
                error = result - y[i]
                errors += error
                self.weights -= self.learning_rate * error * np.transpose(
                    [data_mat[i]])
            self.loss.append(errors / len(X))
        print('LogisticRegression Model(learning_rate={},max_iter={})'.format(
            self.learning_rate, self.max_iter))

    def score(self, X_test, y_test):

        right = 0
        X_test = self.data_matrix(X_test)
        for x, y in zip(X_test, y_test):
            result = np.dot(x, self.weights)

            if (result > 0 and y == 1) or (result < 0 and y == 0):

                right += 1
        return right / len(X_test)

lr_clf = LogisticRegressionClassifier()
lr_clf.fit(X_train, y_train)
lr_clf.score(X_test, y_test)

plt.figure(1)
plt.scatter(X[:50, 0], X[:50, 1], label='0')
plt.scatter(X[50:, 0], X[50:, 1], label='1')
plt.legend()
plt.figure(2)
plt.plot(lr_clf.loss)
plt.show()

结果展示：
loss:

分类结果：

Original: https://blog.csdn.net/qq_36238499/article/details/119596766
Author: 北向晴
Title: 逻辑斯蒂（logistic）回归学习+手撕代码

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635528/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度强化学习技术概述

深度强化学习介绍强化学习主要用来学习一种最大化智能体与环境交互获得的长期奖惩值的策略，其常用来处理状态空间和动作空间小的任务，在如今大数据和深度学习快速发展的时代下，针对传统强化…

人工智能 2023年6月25日
0078
深度学习之如何使用Grad-CAM绘制自己的特征提取图-（Pytorch代码，详细注释）神经网络可视化-绘制自己的热力图

论文名称：Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization 论文下载…

人工智能 2023年6月16日
00112
TensorFlow中的递归神经网络是如何实现的

问题：如何在TensorFlow中实现递归神经网络？介绍：递归神经网络（Recurrent Neural Network，简称RNN）是一种具有循环连接的神经网络，在自然语言处…

人工智能 2023年12月31日
0036
Learning算法在大规模数据处理方面的挑战是什么

问题描述在大规模数据处理中，使用机器学习算法进行学习时会面临许多挑战。本文将详细探讨在大规模数据处理中使用机器学习算法的挑战，并为你提供一个实际的问题和解决方案。详细介绍随着…

人工智能 2024年1月1日
0028
在Logistic回归中，sigmoid函数被用来将线性模型的输出转换为一个概率值，使其落在0到1的范围内

问题背景在机器学习中，Logistic回归是一种常用的分类算法。它通过将线性模型的输出转换为一个概率值，从而将数据分为不同的类别。在Logistic回归中，sigmoid函数被用…

人工智能 2024年1月6日
0036
滤波算法——均值滤波，中值滤波，一阶(αβ)滤波，卡尔曼滤波

滤波算法——均值滤波，中值滤波，一阶(αβ)滤波，卡尔曼滤波因工作涉及到数据滤波(滤噪)处理，汇总了一些网上简单的滤波算法，方便日后查看。滤波算法包括：均值滤波，中值滤波，一阶…

人工智能 2023年7月6日
0080
误差反向传播算法中的损失函数是如何选择的

问题描述在误差反向传播算法中，我们需要选择一个合适的损失函数来衡量神经网络的输出和真实值之间的差异。本文将详细介绍如何选择损失函数，包括算法原理、公式推导、计算步骤和Python…

人工智能 2024年1月4日
0032
CSDN终于破2万粉了，几百块钱的课程可白嫖，就是宠粉！

首先声明一下，这篇文章没有营销，也不给培训机构打广告，纯粹庆祝自己突破2万粉丝大关，宠粉，东西可白嫖。这件事情我已经准备很久了，我一直想在自己的CSDN粉丝量突破1万粉的时候，给…

人工智能 2023年7月16日
0071
自动驾驶入门必须要学会的ADAS（详解）

ADAS详解一、信息辅助 * 1、行车监控类 2、危险预警类 3、驾驶便利类二、控制辅助 * 1、紧急应对类 2、驾驶便利类 3、是车道保持类 4、智能灯光类先丢一版ADAS…

人工智能 2023年7月29日
0066
torch.nn.Conv1d使用详解

pytorch卷积层的介绍：torch.nn.Conv1d介绍：torch.nn.Conv1d(in_channels, out_channels, kernel_size, st…

人工智能 2023年7月23日
0052
unet模型及代码解析

什么是unet 一个U型网络结构，2015年在图像分割领域大放异彩，unet被大量应用在分割领域。它是在FCN的基础上构建，它的U型结构解决了FCN无法上下文的信息和位置信息的弊端…

人工智能 2023年6月16日
00167
【目标检测实战学习】数据增强的几种方法：cutout，mixup，mosaic，rotate，HSV，随机抖动实战

最近在学习数据增强方面的东西，简单做个记录首先需要强调的是，数据增强是目标检测流程中的一个过程，通常是在对数据集完成打标签之后，在划分数据集之前，为了增大数据集的数量，获取更多的…

人工智能 2023年7月27日
00142
推荐系统的发展历程

1.协同过滤算法(Collaborative Filtering,CF)对于协同过滤的研究可以追溯到1992年，Xerox的研究中心开发了一种基于协同过滤的邮件筛选系统，用以过滤一…

人工智能 2023年7月16日
0049
Apriori算法python实现（数据挖掘学习笔记）

目录 1.算法伪代码 2.算法代码 3.测试数据 4.结果 1.算法伪代码输入：事务数据库D；最小支持度阈值。输出：D中的频繁项集L。方法： L1 = find_freque…

人工智能 2023年6月19日
0086
pandas已知数值怎么找位置_如何在pandas中找到模式

使用pandas和python，我想找到一个模式，其中流的流入量比平常大得多，并且在5天内跟随流量不小于流中流入量的5％。见下面的数据框我希望能够在第4列中标记此运动(让我们称为…

人工智能 2023年7月8日
0051
目标检测后处理中检测框不稳定的处理方式

前言经历了场景需求调研，方案技术路线。下面开始时间算法开发： ; 一、目标检测框不稳定类型 1.目标检测框的宽高比不稳定2.目标检测框的中心坐标稳定3.目标检测框连续若干帧检测不…

人工智能 2023年7月9日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

逻辑斯蒂（logistic）回归学习+手撕代码

大家都在看