机器学习-白板推导学习笔记-4线性分类1

2023年7月2日上午1:41 • 人工智能 • 阅读 74

本篇文章是根据视频（ link.）所作的学习笔记，旨在对机器学习的相关知识更好的理解和巩固。本人基础较弱，推导中看不懂的公式可能会细究，如果有理解不当之处也欢迎指出。

线性分类概述

·数据介绍

线性分类可以理解在线性回归的基础上利用激活函数或者降维操作对数据进行分类。线性可理解为对二维数据，能用一条直线将正、负样本分开；对三维数据，线性可分意味着能用一个平面将正、负样本分开；对n维数据，线性可分意味着能用n-1维超平面将正、负样本分开。线性分类包括硬分类和软分类（以二分类为例）：

1）硬分类
，常见的硬分类模型有 感知机和 Fisher线性判别。
2）软分类
，常见的软分类模型有 概率判别模型（逻辑回归）和 概率生成模型（高斯判别分析和朴素贝叶斯）。

本篇主要介绍两种常见的硬分类模型——感知机和 Fisher判别，软分类见下篇。

线性分类之感知机

感知机算法由Rosenblatt在1957年提出，是一类简单的线性判别算法。如下图所示，黑色和红色分别为两类，S1,S2,S3为不同参数下的分界函数。

感知机思想——错误驱动学习，逐步使分类错误的样本数量减少至0。
感知机模型：

目标函数：

其中M为分类错误的样本数量，负号是因为在分错的时候才有，分对的时候看sign()函数，同正得正，负负得正。

求解目标函数中的参数时，采用随机梯度下降法（SGD）：

其中感知机学习算法是收敛的，定理此处不予证明。按照公式结果依次迭代，直到把训练样本中的数据全部分类正确，即L(w,b)=0。

引申——当数据线性不可分的时候，允许一点错误出现的感知机做法叫做pocket算法，感兴趣者自行了解。

线性分类之Fisher线性判别

Fisher线性判别可以理解为将不好分类的数据投影到其他的方向，从而达到容易区分的目的。

其中，投影方向为

，在该上面的投影值为

，（投影值为

设二分类分别为C1,C2类，对应于

，则有：

Lisher分类的基本思想——希望投影到

方向上的数据达到， 类内距离小，类间距离大。并以此来设置目标函数机器学习-白板推导学习笔记-4线性分类1

说明——是类C1投影值的均值，S1类C1投影值的方差；是类C1数据自身的均值，是类C1数据自身的方差。C2类同样如此。
随机向量自身的均值和方差公式（以类C1的投影Z1为例）：

下面对目标函数进行化简：

同理，

，分子分母上的向量不能随意化简约去，有方向

至此，我们就得到了fisher判别中的目标函数，下一步分析如何来确定投影方向

：

令
,叫做类间方差；，叫做类内方差。
此时
基于” 类内距离小，类间距离大“，可得:

两边同时乘以，得
分析：，与都为实数，不影响方向

其中，也是一个实数，不影响方向

推完啦同志们！提前给自己下班！新年快乐~

参考： https://blog.csdn.net/jian_qiao/article/details/85346664

https://blog.csdn.net/qq_18870127/article/details/79097735

Original: https://blog.csdn.net/gigglehuahua/article/details/122754338
Author: GiggleMiao
Title: 机器学习-白板推导学习笔记-4线性分类1

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664465/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【预测模型-ELAMN预测】基于哈里斯鹰算法优化ELMAN神经网络实现数据回归预测matlab代码

1 简介风能,作为一种重要,有潜力,无污染,可再生、可持续的能源,已经成为全球发电最为迅速的能源之一,越来越受到世界各国的青睐。近年来,为缓解能源短缺问题,改善环境,实现经济乃至…

人工智能 2023年6月18日
0077
DataFrame(12)：DataFrame的排序与排名问题

1、说明 DataFrame中的排序分为两种，一种是对索引排序，一种是对值进行排序。索引排序：sort_index()；值排序：sort_values()；值排名：rank(…

人工智能 2023年6月2日
0070
量化PM2.5数据

import pandas as pd from matplotlib import pyplot as plt file_path = "./PM2.5/Beijing…

人工智能 2023年7月8日
0090
SeNet || 注意力机制——源代码+注释

文章目录 1 SeNet介绍 2 SeNet优点 3 Se模块的具体介绍 4 完整代码 1 SeNet介绍 SENet是Squeeze-and-Excitation Network…

人工智能 2023年6月17日
00153
sklearn的系统学习——决策树分类器（含有python完整代码）

目录一、什么是决策树二、怎么使用决策树解决分类问题 1、重要参数（1）Criterion （2）random_state （3）splitter (4) 剪枝参数（5）目标…

人工智能 2023年6月15日
00106
[CV] 高斯金字塔与拉普拉斯金字塔

高斯金字塔与拉普拉斯金字塔高斯金字塔一个下采样的序列，例如原始尺寸是512×512，那么一个图像序列，尺寸例如，512，256，128，…，4，2.这样一…

人工智能 2023年6月4日
0073
羊了个羊，但是Python简(li)单(pu)版

大家好，欢迎来到 Crossin的编程教室！要说最近最热门的游戏，那肯定是《羊了个羊》没跑了。连续上了好几天热搜，火到连央视都来提醒谨防有人利用游戏之名诈骗。但游戏爆火的另一面…

人工智能 2023年6月4日
0088
OpenCV图像处理入门

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉pyt…

人工智能 2023年6月18日
0074
Jetson Xavier安装使用多个摄像头

效果展示： 单目全向视觉感…

人工智能 2023年7月9日
00110
CNN卷积神经网络简单示例(PyTorch)

CNN卷积神经网络示例PyTorch 导入Python库和相关模块转换为图像格式将数据格式numpy转换为tensor，并打包成batch 构建CNN网络定义损失函数训练网…

人工智能 2023年7月22日
00118
ggplot2绘制双坐标轴图

R包ggplot2绘图精美，可以做出很复杂的图形，深受用户喜爱。它的作者hadley并不推荐使用ggplot2绘制双坐标轴图，认为这样会增加读图的难度，但是目前需要双坐标轴图应用的…

人工智能 2023年7月15日
0077
机器学习笔记 – 线性回归与逻辑回归

一、线性回归概述 1、概述线性回归算法是一种预测连续型变量的方法。它的基本思想是通过已给样本点的因变量和自变量的关系，设定一个数学模型，来拟合这些样本点。线性回归算法就是为了找到…

人工智能 2023年5月31日
0076
MoCha——单调块注意力模型

MoCha——单调块注意力模型 1.概述加了soft attention的seq2seq模型，在很多领域取得了广泛的应用，例如机器翻译、词性标注等NLP任务，因为它们都可以看成是…

人工智能 2023年5月25日
0080
机器学习——决策树

目录一、决策树定义：二、决策树特征选择 2.1 特征选择问题 2.2 信息增益 2.2.1 熵 2.2.2 信息增益三、决策树的生成 3.1 ID3算法 3.1.1理论推导 …

人工智能 2023年7月6日
0088
图像处理40-goodFeaturesToTrack角点检测

一提到角点检测，最常用的方法莫过于Harris角点检测，opencv中也提供了Harris角点检测的接口，即cv::cornerHarris()，但是Harris角点检测存在很多缺…

人工智能 2023年6月20日
00111
subprocess.CalledProcessError: Command ‘[‘where‘, ‘cl‘]‘ returned non-zero exit status 1

最近正在学习pytorch-CUDA并行，跑这位大神的代码https://github.com/godweiyang/NN-CUDA-Example，因为我没有学过C++，电脑上…

人工智能 2023年6月17日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习-白板推导学习笔记-4线性分类1

线性分类概述

线性分类之感知机

线性分类之Fisher线性判别

大家都在看