小小白从零进行机器学习(多个特征量的线性回归算法)

2023年6月18日下午2:19 • 人工智能 • 阅读 98

本文开始介绍一种新的线性回归版本，此版本适用于多个变量或多个特征量的情况，下图为假设函数对应多个变量和多个特征量时的假设形式

接下来为一些具体补充

以下是当只有一个变量和有多个变量的梯度下降（多元梯度下降法）更新时的对比

梯度下降的一种实用方法（特征缩放）：

如果你有一个机器学习问题，这个问题具有多个特征量，如果你能确保这些特征量都在一个相近的范围内，这样梯度下降算法就能更快的收敛

可以看到上两个例子是可以的，下两个例子因范围精度或大小差距与1到-1过大而不符合标准

特征缩放的另一种方式（均值化一）：

如果遇到这一种情况，这些房子中平均每个房子的大小为2000，并且这些房子平均每个房子都含有两个卧室，那么可以进行下图的变换

学习率：

一般进行梯度下降算法时最好绘制出代价函数值图像，正常来说图像应该如上图所示，代价函数的值越来越小，随着迭代次数的增加代价函数的值图像曲线也应该会变得越来越平坦，也就是收敛，以下为常见异常情况的应对方法

第一类：

如果代价函数的值图像越来越大，在代码没问题的情况下，应该就是学习率太大的问题，而代价函数的函数图像情况（大体相同）也应该如下图所示

因为学习率太大，当梯度下降算法接近最小值时会直接跳过最小值，这样反复横跳会就会使代价函数的值越来越大

第二类：

遇见上图这种情况时通常也是学习率太大的关系导致的，这里就不说明原因了

总结：

总的来说，学习率太小的话就会遇到梯度下降算法收敛速度过慢的一种情况，学习率太大的，代价函数的值可能不会在每次迭代时都下降，甚至可能不收敛，所以今后可能的从很小的学习率开始10倍10倍的进行增加，推荐使用3的倍数，直到找到最适合学习率

正规方程：

对于某些线性回归问题，正规方程会给我们更好的方法来求得代价函数的参数的最优值，正规方程给了我们一个解析解法让我们不用靠梯度下降算法迭代便能得到代价函数参数的最优值

如上图所示，面对这样的代价函数图像，如果对此代价函数求导，并令其导数等于零，就能得到令代价函数得到最小值的

举个例子，如果把m个数据的房价模型的特征量换为n+1维矩阵，那么它的特征方程就是X的矩阵的转置乘以X取逆乘以X的转置乘以y

梯度下降算法和正规方程的使用情景：

梯度下降算法需要多次选择学习率并且运行多次导致速度较慢，正规方程不需要选择学习率并且只运行一次，但当特征量极多时正规方程的运算量就会呈现三次方增长，故当有极多个特征变量时使用梯度下降算法，反之则使用正规方程

正规方程在矩阵不可逆情况下的解决方法：

正规方程在计算时难免会遇到矩阵不可逆的情况，但这是极少数的，如果遇到矩阵不可逆的情况，可以检查下问题特征里是否有多余特征，如果有的话可以对其进行删除不用全部保留，如果没有多余特征则可以检查是否有过多特征，可以进行一些删除

Original: https://blog.csdn.net/qq_66812327/article/details/124600385
Author: 夢在远方
Title: 小小白从零进行机器学习(多个特征量的线性回归算法)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635394/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

流媒体开源服务 MediaSoup 初识

目录前言正文一、简单介绍二、关键特色 1. 超强 SFU 功能 2. Node.js 模块 3. 客户端 SDK 三、架构组成 1. 关键实例 2. 重要模块四、发展现状…

人工智能 2023年7月30日
0053
Python数据分析入门笔记4——数据预处理之重复值

系列文章目录 Python数据分析入门笔记1——学习前的准备Python数据分析入门笔记2——pandas数据读取Python数据分析入门笔记3——数据预处理之缺失值 Python…

人工智能 2023年7月17日
0091
目标检测—利用yolov5s训练SIXray目标检测模型

VOC标签格式转yolo格式并划分训练集和测试集网上获取到的目标检测的SIXray数据集资源标签的格式是VOC(xml格式)的，而yolov5训练所需要的文件格式是yolo(tx…

人工智能 2023年7月12日
0096
[python]LDA模型使用流程及代码

目录数据预处理去除停用词构建LDA模型可视化——pyLDAvis 主题个数确认困惑度计算一致性得分数据预处理该步骤可自行处理，用excel也好，用python也罢，…

人工智能 2023年7月4日
0087
Intel的ipp库（Integrated Performance Primitives）

IPP库包含了许多底层优化的函数。如果已经安装了IPP库，opencv在运行时也会自动调用。NVIDIA公司针对GPU开发了的GPU加速的图像、视频、信号处理库NPP（NVIDIA…

人工智能 2023年7月18日
0063
对于云原生时代的后端业务开发和项目系统学习，选Go Or Java？

对于Go的一些思考沉淀前言开山之词：简洁度比较大不相同：Go的独特之处 * Go的并发 Go的指针 Go的性能分析器 Go的类型 Go的CGo Go的将函数作为参数瑕疵劣势…

人工智能 2023年5月31日
0080
d2l的一些库解析，用到什么补充什么【深度学习+d2l+torch】

d2l的一些图像调用图像查看与显示 * %matplotlib set_figsize() d2l.Image.open() show_images() 图像查看与显示因为全文…

人工智能 2023年6月16日
0092
什么是TCP/IP协议？

一、TCP/IP模型 TCP/IP协议模型（Transmission Control Protocol/Internet Protocol），包含了一系列构成互联网基础的网络协议，…

人工智能 2023年6月28日
00137
Python 数据分析 —— Matplotlib ②

文章目录前提工作 twinx() —— 双轴图（折线图＋柱状图）的绘制 plt.scatter() —— 散点图的绘制 plt.boxplot() —— 箱形图的绘制 seabo…

人工智能 2023年6月11日
0085
华为Atlas200DK开发从零开始3.目标检测模型CANN部署——以YOLOX、YOLOv5和Nanodet为例（1）CANN接口调用

目录前言深度学习模型在AI芯片上部署的一般流程 CANN模型部署流程 CANN ACL接口调用流程(python) * 步骤1.ACL环境初始化和资源申请步骤2.模型加载步…

人工智能 2023年7月12日
0099
(三)Omniglot Dataset介绍

欢迎访问个人网络日志🌹🌹知行空间🌹🌹 Omniglot Dataset介绍 * – 0.用来做什么 – 1.什么时候从哪来 – 2.包含什么内容…

人工智能 2023年5月28日
0066
语音信号处理-语音究竟要浮点还是整数？MFCC又是如何变化？

语音信号处理写作原因 wav文件读取 * wav格式读取wav文件（matlab/python） – matlab audioread() python 写入wav…

人工智能 2023年5月27日
0077
习题解答chapter09

1. Java中流的分类有哪些? 从流动的方向上看：一般为输入流（InputStream）和输出流（OutputStream）两类。从读取类型上看，一般分为字节流和字符流。字节流是…

人工智能 2023年6月4日
0089
神经网络如何调参、超参数的最优化方法、python实现

一、what is 超参数超参数是什么，其实就是，各层神经元数量、batch大小、学习率等人为设定的一些数。数据集分为训练数据、测试数据、验证数据。用测试数据评估超参数值的好…

人工智能 2023年7月14日
00152
基于骨骼关键点的动作识别（OpenMMlab学习笔记，附PYSKL相关代码演示）

一、骨骼动作识别骨骼动作识别是视频理解领域的一项任务 1.1 视频数据的多种模态 RGB：使用最广，包含信息最多，从RGB可以得到Flow、Skeleton。但是处理需要较大的计…

人工智能 2023年7月28日
0056
uni-app – 在纯 JS 文件中调用自定义弹框组件 / 封装全局 API 调用弹框组件（解决小程序、APP 无法使用 document.body.appendChild 插入组件节点）适配全端

如果您自定义了一个弹框组件，想要在纯 JS 文件或组件中进行灵活调用，本文可以帮到您。例如，我们通常都会在请求配置中写好拦截器，当服务器状态码（code）为 500 时，表示用户…

人工智能 2023年5月30日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

小小白从零进行机器学习(多个特征量的线性回归算法)

梯度下降的一种实用方法 （特征缩放）：

特征缩放的另一种方式（均值化一）：

学习率：

正规方程：

大家都在看

梯度下降的一种实用方法（特征缩放）：