蜥蜴书学习day1-机器学习概述

1 概览

1.1 为什么使用机器学习
a)机器学习可以处理使用传统方法,太复杂,或者没有已知算法的问题
b)机器学习可以帮助人类学习,发现新趋势、新关联

1.2 机器学习应用例子
a)图像分类,用卷积神经网络CNN
b)自然语言处理NLP
c)强化学习(RL,reinforcement learn):给定环境(如游戏),训练代理(如机器人),选择在一段时间内将他们的奖励最大化(如,机器人会在玩家失去一些生命值时获得奖励),alphaGo就是用RL实现的

蜥蜴书学习day1-机器学习概述

1.3 机器学习的分类
a)有监督和无监督学习:
有监督学习,训练集是有标记的,常见的有:
k-邻近算法
线性回归
逻辑回归
支持向量机
决策树和随机森林
神经网络

无监督学习
聚类算法
k-均值算法
DBSCAN
分层聚类分析(HCA)
异常检测和新颖性检测
单类SVM
孤立森林
可视化和降维
主成分分析(PCA)
核成分分析
局部线性嵌入
t-分布随机近邻嵌入
关联规则学习

降维的目的是在不丢失太多信息的前提下,简化数据,方法是将多个相关特征合并为一个,也叫特征提取
b)批量学习和在线学习

批量学习:

蜥蜴书学习day1-机器学习概述

蜥蜴书学习day1-机器学习概述
在线学习其实也是离线完成的,只是可以更新学习的数据流,在线学习的学习率越高,系统会迅速适应新数据,但同时会很快忘记就数据
c)基于实例的学习和基于模型的学习

基于实例的学习:系统通过实例的相似度来度量比较新实例和已经学习的实例,从而预测新实例的

基于模型的学习:构建实例的模型

1.4 机器学习的挑战
a)训练的数据量
b)训练数据不具有代表性
c)低质量数据
d)过拟合
解决过拟合的方法:
简化模型,减少参数
收集更多的数据
减少噪声
通过约束模型使其更简单,也被称为正则化:比如线性拟合中,规定截距为1
超参数:是学习算法的参数,不是模型的参数,在训练前确定,训练时不改变
e)欠拟合

1.5 测试和验证
分为测试集和训练集
防止调整超参数时,出现仅适用于测试集的最佳模型,却在实际应用中效果不佳,解决方法: 保持验证,即选取测试集的一部分作为验证集,用剩下的测试集去训练具有多种超参数的模型,选择验证集表现最佳的超参数,再用完整的训练集去训练模型

Original: https://blog.csdn.net/qq_44849814/article/details/124230127
Author: Mail Lee
Title: 蜥蜴书学习day1-机器学习概述

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/521307/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球