蜥蜴书学习day1-机器学习概述

2023年5月26日下午7:06 • 人工智能 • 阅读 82

1 概览

1.1 为什么使用机器学习
a）机器学习可以处理使用传统方法，太复杂，或者没有已知算法的问题
b）机器学习可以帮助人类学习，发现新趋势、新关联

1.2 机器学习应用例子
a）图像分类，用卷积神经网络CNN
b）自然语言处理NLP
c）强化学习（RL，reinforcement learn）：给定环境（如游戏），训练代理（如机器人），选择在一段时间内将他们的奖励最大化（如，机器人会在玩家失去一些生命值时获得奖励），alphaGo就是用RL实现的

1.3 机器学习的分类
a）有监督和无监督学习：
有监督学习，训练集是有标记的，常见的有：
k-邻近算法
线性回归
逻辑回归
支持向量机
决策树和随机森林
神经网络

无监督学习：
聚类算法
k-均值算法
DBSCAN
分层聚类分析（HCA）
异常检测和新颖性检测
单类SVM
孤立森林
可视化和降维
主成分分析（PCA）
核成分分析
局部线性嵌入
t-分布随机近邻嵌入
关联规则学习

降维的目的是在不丢失太多信息的前提下，简化数据，方法是将多个相关特征合并为一个，也叫特征提取
b）批量学习和在线学习

批量学习:

在线学习其实也是离线完成的，只是可以更新学习的数据流，在线学习的学习率越高，系统会迅速适应新数据，但同时会很快忘记就数据
c）基于实例的学习和基于模型的学习

基于实例的学习：系统通过实例的相似度来度量比较新实例和已经学习的实例，从而预测新实例的

基于模型的学习：构建实例的模型

1.4 机器学习的挑战
a）训练的数据量
b）训练数据不具有代表性
c）低质量数据
d）过拟合
解决过拟合的方法：
简化模型，减少参数
收集更多的数据
减少噪声
通过约束模型使其更简单，也被称为正则化：比如线性拟合中，规定截距为1
超参数：是学习算法的参数，不是模型的参数，在训练前确定，训练时不改变
e）欠拟合

1.5 测试和验证
分为测试集和训练集
防止调整超参数时，出现仅适用于测试集的最佳模型，却在实际应用中效果不佳，解决方法： 保持验证，即选取测试集的一部分作为验证集，用剩下的测试集去训练具有多种超参数的模型，选择验证集表现最佳的超参数，再用完整的训练集去训练模型

Original: https://blog.csdn.net/qq_44849814/article/details/124230127
Author: Mail Lee
Title: 蜥蜴书学习day1-机器学习概述

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/521307/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

《Rethinking Efficient Lane Detection via Curve Modeling》论文笔记

参考代码：pytorch-auto-drive 概述介绍：在这篇文章中对车道线建模表示进行了讨论和分析，文中指出现有的车道线检测方法大体为：segmentation-based、…

人工智能 2023年5月28日
0096
机器视觉可以应用到哪些场景中？

一、机器视觉的定义机器视觉是一种通过光学设备和非接触式传感器自动接收并处理真实物体的图像的设备，以获得所需信息或控制机器人的运动。机器视觉就是用机器代替人眼进行测量和判断。本质…

人工智能 2023年6月20日
0089
ConsensusClusterPlus，一步到位的一致性聚类！

欢迎关注”生信修炼手册”! 在之前的文章中分享了一致性聚类的原理，本文介绍下如何用R语言进行分析。ConsensusClusterPlus这个R包，就是专门…

人工智能 2023年5月31日
0099
mixup_ratio

目录 1.简介 2.背景 3.mixup_ratio主要工作 4.理解 5.讨论 6.计算loss时，关于label的选择 7.几种数据增强方式 8.对数据增强的讨论 mixup_…

人工智能 2023年7月3日
0084
cuda与torch的安装匹配

此博客主要用于记录个人的问题解决。如果能帮到路过的朋友那再好不过啦。我在某网站的评论所分享的链接下载的torch，似乎是阿里的源。是1.10.1的torch。 pip show…

人工智能 2023年7月21日
00117
用树莓派做一个语音机器人

早就想写一篇语音机器人的文章，凑巧这两天受委托做个树莓派语音机器人，又复习一下流程熟悉了过程才准备写一篇文章，这是基于图灵机器人和百度api的语音助手。目录准备 * 硬件准备 …

人工智能 2023年5月25日
0080
推荐算法（一）电影推荐系统

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月15日
0080
yolov5使用tensorboard可视化训练结果

tensorboard可视化可以实时跟进训练情况话不多说，直接记录！！！yolov5的可视化第一步找到yolo.py文件，将里面关于tensorboard的部分注释掉，如下图第二…

人工智能 2023年7月21日
00119
红黑树(4万字文章超详细,只为一个目的)

我写这篇文章的主要目的其次才是积累知识,主要是因为我想打一个同学的脸. 事情是这样的.我现在中学嘛,我们班上有一个同学他学了红黑树啊,就一副”不可一世”的样…

人工智能 2023年6月26日
0076
【弱监督显著目标检测论文】Weakly-Supervised Salient Object Detection Using Point Supervison

2022年在AAAI上发表的一篇使用点监督的弱监督显著目标检测论文论文原文代码地址文章目录摘要一、创新点二、方法 * 1.Adaptive Flood Filling 2….

人工智能 2023年7月12日
0061
opencv4.0学习笔记

目录课程来源：哔哩哔哩大学. 第一节课显示第一张图片环境配置了一个早上，到10.48分配置完毕，有点难受。还好最后显示出第一张图片。 #include<opencv2/…

人工智能 2023年7月19日
0064
【数据分享】1999-2020年全国地级市人口相关指标（shp格式/excel格式）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月30日
0066
pytorch利用hook【钩子】获取torch网络每层结构【附代码】

写本文的目的是为了方便在剪枝中或其他应用中获取网络结构，如何有效的利用hook获取每层的结构来判断是否可以剪枝。要对网络进行trace，或者获取网络结构，需要知道 &#8220…

人工智能 2023年7月23日
0064
为什么深度学习算法在AI领域中如此重要

为什么深度学习算法在AI领域中如此重要？深度学习算法在AI领域中如此重要是因为它可以通过模拟人工神经网络的工作原理来实现自动化学习。在AI领域中，深度学习算法被广泛应用于图像识别…

人工智能 2024年1月2日
0052
机器学习——时间序列ARIMA模型(三)：AR、MA、ARMA、ARIMA模型定义及公式介绍及股价预测案例代码

ARIMA模型文章目录 ARIMA模型 * 1、自回归模型（AR） – + * – 使用自身的数据进行预测，且只适用于预测与自身前期相关的现象。 2、移动…

人工智能 2023年6月16日
00118
R3live笔记：从代码看lio线程

r3live的LIO部分主要继承r2live、fast-lio部分，ros中主要体现在前端r3live_LiDAR_front_end和后端r3live_mapping节点中，对应…

人工智能 2023年6月10日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

蜥蜴书学习day1-机器学习概述

大家都在看