# 05机器学习–多项式回归与模型泛化及python实现

①什么是多项式回归

②scikit-learn中的多项式回归和Pipelin

③过拟合与欠拟合

④验证数据集与交叉验证

⑤回顾网格搜索

⑥偏差方差权衡

⑦解决过拟合问题–模型正则化1–岭回归

⑧解决过拟合问题–模型正则化2–LASSO回归

## ①什么是多项式回归

import numpy as np
import matplotlib.pyplot as plt

x = np.random.uniform(-3, 3, size=100)
X = x.reshape(-1, 1)
y = 0.5 * x**2 + x + 2 + np.random.normal(0, 1, 100)

plt.scatter(x, y)
plt.show()


X2 = np.hstack([X, X**2])

lin_reg2 = LinearRegression()
lin_reg2.fit(X2, y)
y_predict2 = lin_reg2.predict(X2)

plt.scatter(x, y)
plt.plot(np.sort(x), y_predict2[np.argsort(x)], color='r')
plt.show()


## ②scikit-learn中的多项式回归和Pipelin

PolynomialFeatures(degree=3)时，最终会生成十列（0次幂、1次幂、2次幂、3次幂）

Pipeline方法：（没有专门的多项式回归类，用这个方法可以简单的创建自己的多项式回归类）

## ③过拟合与欠拟合

## ④验证数据集与交叉验证

## ⑤回顾网格搜索

## ⑦解决过拟合问题–模型正则化1–岭回归

## ⑧解决过拟合问题–模型正则化2–LASSO回归

LASSO回归输出：

L0正则：希望theta的个数尽量小

