目录
1.相关与回归
1.1 有监督的机器学习过程
●1.模式存在
●2.但无法用数学方式确定下来
●3.有数据可供学习
1.2 分类与回归
经过算法预测的结果是一个 连续的值,我们称这样的问题为回归问题。
算法能够学会如何将数据分类到 不同的类里,我们称这样的问题为分类问题。
回归问题:目标变量是连续值(数值预测) 分类问题:目标变量是离散值
1.3 回归的涵义
研究自变量与因变量之间的关系形式的分析方法。
目的:根据已知自变量来估计和预测因变量的值。
在回归分析中,把某一现象称为 因变量, 它是预测的对象,把引起这一现象变化的因素称为 自变量,它是引起这一现象变化的原因。 而因变量则反,映了自变量变化的结果。
1.4 案例分析
有20户家庭,冬天的取暖费用与3个因素有关:日间户外的平均温度,阁楼绝缘层的厚度,以及炉子的使用年数。如果某一家庭的平均户外温度是30F度,阁楼绝缘层的厚度为5英寸,炉子已使用过10年,它的冬天取暖费用为多少?
1.5 回归分析与相关分析
现实世界中,每一事物都与它周围的事物相互联系、相互影响,反映客观事物运动的各种变量之间也就存在着一定的关系。 变量之间的关系可以分成两类: 函数关系( 回归)和 相关关系。
相关关系:反映事物之间的 非严格、不确定的 线性依存关系。
有两个显著的特点:
①事物之间在数量上确实存在一定的 内在联系。 表现在一个变量发生数量.上的变化,要影响另一个变量也相应地发生数量上的变化。例如:劳动生产率越高====>成本越低
②事物之间的数量依存关系 不是确定的,具有一定的随机性。表现在给定自变量一个数值,因变量会有若干个数值和它对应,并且因变量总是遵循一定规律围绕这些数值平均数上下波动。 其原因是影响因变量发生变化的因素不止一个。
例:影响 工业总产值的因素除了 职工数外,还有 固定资产原值、 流动资金和 能耗等因素。
1.6 相关分析
研究和测度两个或两个以上变量之间关系的方法有 回归分析和 相关分析。
- 相关分析:研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用 相关系数表示,多元相关时用复相关系数表示。
- 回归分析:研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的数量变动的关系。更强调 因果关系。
r的取值范围是[-1,1] :
完全相关/完全正相关/完全负相关/不存在线性相关关系/负相关/正相关
◆|r|>0.7为高度相关;
◆|r| < 0.3为低度相关;
◆0.3
Original: https://blog.csdn.net/qingxiao__123456789/article/details/122542736
Author: VernonJsn
Title: 回归算法及应用
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/630608/
转载文章受原作者版权保护。转载请注明原作者出处!