python手写逻辑回归算法【机器学习】

2023年6月17日上午11:08 • 人工智能 • 阅读 91

算法介绍

在生活中，我们常常能听见这样的说法，”您的这辆车已经使用了5年了，有80%的概率会出一些小的故障。”

我们会不会觉得很奇怪，一件事情会发生就是会发生，不会发生就是不会发生，这80%是啥意思？于是我们点点头。虽然我们不是很理解这个数字的含义，但是我们知道这个车很有可能会出故障。

那这个概率究竟是怎么来的呢？其实这个概率是需要历史数据的，对于人来说就是经验。这个历史数据其实是一个分类的数据，即在自变量是多少的时候，因变量就会怎么样（即产生一个固定的状态的y）。在现实中，当我们这样的数据多了的时候，我们就能发现一些规律，（至于为什么会这个样子，其实我们也不会特别的明白）比如我们发现车在使用了10年的时候，很可能刹车片会出问题，如果现在有一辆使用了十年的车，即使它的刹车片没有出问题，但是我们也会认为很容易就会出现问题。但是这个很容易其实是一个很模糊的事情，为什么说它模糊呢？因为每个人对于”很”这个副词的理解都是不一样的。于是聪明的人类试图用数据的方式来告诉人们一个概率。我们应该怎么做？

人类们拿到的数据是一个分类数据，中间是不连续的，但是他们突发奇想，要不把这个数据连续起来预测一下？这样，概率和数字不久有了吗？就这样，他们高兴的把中间的状态也赋予了值和含义。但是存在的一个问题是，我们希望得到的概率是一个0-1之间的数字啊！随意这样做肯定是不可以的。于是乎，他们终于从数学的海洋里面，找出了最贴近现实的一个函数——sigmoid函数！这个函数的值域在0-1之间，而且对于拟合这种问题来说，函数的性质合适的可怕。函数在两头的极端的值的时候，都会偏向于0和1，这说明了，如果一个数据很极端的话，它属于某个类的可能性会非常的大，而一个数据如果很中庸的话，它很模糊，概率会处在50%左右。sigmoid函数完完全全说明了这个道理。

于是，逻辑回归就这样产生了。把x带入到sigmoid函数里面，求得一个概率，用这样的方式来对现实进行拟合，如果可以拟合现实，就可以对现实进行预测。因此我们说，sigmoid函数其实本质是在做回归，但是结果是在做分类。怎么分类呢？以0.5为界限吗。你倾向于谁，就把你判断成为谁。

但是如何判断这个函数的拟合的好坏呢？

从愿景的角度来说，我们希望自己的算法能进行判断的准确，因此对于不同的分类的Y,衡量估计的值的参照是不同的。于是我们构造了一个函数，可以用来表示估计的准确的概率（注意这个概率和上面我们估计的概率不是一个概率，这里的概率是为了衡量我们估计的准确而重新构建的指标）。我们希望自己准确的估计的概率是最大的，于是把这些概率都乘起来，然后希望求最大值就好了。以上，就是逻辑回归的整体的思路。需要明白的其实就是两个问题：1）sigmoid函数是用来干什么的？ 2）如何衡量模型拟合的好坏？（即代价函数的构建和我们的期望）

那为什么会说逻辑回归是一种分类的算法呢？
你看看我们有的原始数据，它产生的原因和它输出的结果不就知道了吗？嘿嘿。
那为什么逻辑回归叫做逻辑回归呢？
这个我就真的不知道了，也许，是为了方便称呼吧~

程序设计思路

逻辑回归从本质上和多元线性回归是一样的，用线性函数来拟合，但是参数的调整根据将拟合完的数经过一遍sigmoid函数，

程序代码


import numpy as np
def sigmoid(x):
    return 1.0/(1+np.exp(-x))

def cost_function(X,Y,ws):
    x = np.dot(X,ws)
    left = np.multiply(Y, np.log(sigmoid(x)))
    right = np.multiply(1 - Y, np.log(1 - sigmoid(x)))
    return np.sum(left + right) / -(len(X))

def logistic_gradient(X,Y,alpha = 0.1):
    import matplotlib.pyplot as plt

    num,col = X.shape
    ws = np.ones((col,1))
    epochs = 10000

    time = 0
    costs = []
    times = []
    for i in range(epochs):
        time = time + 1
        h = sigmoid(np.dot(X,ws))
        gradient = np.dot(X.T,(h-Y))/num
        ws0 = ws
        costbefore = cost_function(X,Y,ws)
        ws = ws - alpha*gradient
        costafter = cost_function(X,Y,ws)
        if costafter > costbefore:
            ws = ws0
            alpha = alpha/2
        else:
            times.append(time)
            costs.append(costbefore)
    plt.plot(times,costs)
    return ws

Original: https://blog.csdn.net/m0_46716894/article/details/122516753
Author: 小野堂
Title: python手写逻辑回归算法【机器学习】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629883/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Ubuntu20.04下安装 NVIDIADriver-460、CUDA-10.0、cuDNN、tensorflow、pytorch

Ubuntu下安装 NVIDIADriver、CUDA、cuDNN、tensorflow、pytorch 1、安装NVIDIA驱动首先，检测你的NVIDIA显卡型号和推荐的驱动程…

人工智能 2023年5月26日
00108
Transformer模型入门详解及代码实现

目录前言一.什么是Transformer 二.Encoder的组成 1.输入部分 2.注意力机制 2.1注意力机制的含义 2.2在TRM中的实现 3.前馈神经网络 3.1 前馈…

人工智能 2023年7月4日
0079
基于布谷鸟灰狼算法、灰狼算法求解复杂地形下三维无人机路径规划问题研究附matlab代码

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
00106
【量化】股市技术分析利器之TA-Lib（一）

作者：未来大佬来源：恒生LIGHT云社区 1、TA-Lib简介 TA-Lib，全称”Technical Analysis Library”, 即技术分析库…

人工智能 2023年6月11日
00143
nn.Sequential()引起的 forward() takes 1 positional argument but 2 were given

最近在训练模型时，想要将模型的分类层去除，输出模型的特征图，于是进行如下操作去除模型的最后两层结构，然后奇怪的事情就发生了，运行时程序老是报错， forward() takes 1…

人工智能 2023年6月17日
00105
ex1-linearRegression

在本练习中，您将实现线性回归并了解其在数据上的工作原理。在开始练习前，需要下载如下的文件进行数据上传： ex1data1.txt -单变量的线性回归数据集 ex1data2….

人工智能 2023年6月16日
00107
OpenCV学习笔记（一）Opencv4.5.5 VS2019永久开发环境配置

OpenCV 入门指南一、介绍 OpenCV（Open Source Computer Vision Library）开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和…

人工智能 2023年6月20日
00114
Python 音频处理：wave

wave 模块提供了一个处理 WAV 声音格式的便利接口。它不支持压缩/解压，但是支持单声道/立体声。用法： wave.open(file, mode=None)，其中， m…

人工智能 2023年5月27日
0090
SURF算法之Opencv代码详解

SURF特征点检测算法实现代码源自于Opencv2.4.11版本sources\modules\nonfree\src\surf.cpp文件中这篇文章只会对代码进行介绍（代码的介绍…

人工智能 2023年7月19日
00105
图像滤波简介

文章目录 1. 图像滤波 2. 图像滤波的常用方法 * 2.1 均值滤波 2.2 方框滤波 2.3 高斯滤波 2.4 中值滤波 2.5 双边滤波 2.6 低通滤波 2.7 高通滤波…

人工智能 2023年7月26日
00148
Windows10系统下C#部署Paddlex模型

Windows10系统下C#部署Paddlex模型一、部署环境介绍二、文件下载 * 2.1下载PaddleX源码 2.2下载C++ 预测库 paddle_inference 2…

人工智能 2023年5月30日
10252
样例：语义分割指标计算：GA,OA,mAcc,mIoU,IoU

举个例子，假设得到混淆矩阵如下：[ 真实标签真实标签真实标签真实标签真实标签 0 1 2 3 4 预测标签 0 16 0 1 1 4 预…

人工智能 2023年7月14日
00193
【项目实战】Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+代码讲解），如需数据+代码+文档+代码讲解可以直接到文章最后获取。 1.项目背景在衍生产品定价和风险管理中，对当前波动率…

人工智能 2023年7月15日
0091
三维重建方法汇总

一、什么是三维重建三维重建是用相机拍摄真实世界的物体、场景，通过计算机视觉技术进行处理，从而得到物体的三维模型。主要涉及技术包括：多视图立体几何、深度图估计、点云处理、网格重建…

人工智能 2023年6月16日
00101
Python 微信自动化工具开发系列01_自动获取微信聊天信息（2022年10月可用）

前言 一个需求 需要利&a…

人工智能 2023年7月5日
0097
【教学】图像分类算法中的召回率recall、精准率precision和f1score得分等计算。

首先我们来介绍一下这些名称的含义。 TP: 预测为1(Positive)，实际也为1(Truth-预测对了) TN: 预测为0(Negative)，实际也为0(Truth-预测对了…

人工智能 2023年7月3日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python手写逻辑回归算法【机器学习】

算法介绍

程序设计思路

程序代码

大家都在看