机器学习-泛化能力

2023年5月30日下午2:06 • 人工智能 • 阅读 88

1.什么是泛化能力

百度百科解释：机器学习算法对新鲜样本的适应能力。

更加具体的解释：学习到的模型对未知数据的预测能力，这个未见过的测试数据必须是和训练数据处于同一分布,不在同一分布的数据是不符合独立同分布假设的（对同一规律不同的数据集的预测能力）。通常通过 测试误差来评价学习方法的泛化能力。

通俗+形象解释：
就是通过数据训练学习的模型，拿到真实场景去试，这个模型到底行不行，如果达到了一定的要求和标准，它就是行，说明泛化能力好，如果表现很差，说明泛化能力就差。为了更好的理解泛化能力，这里引入三种现象，欠拟合、过拟合以及不收敛。泛化能力的本质就是反映模型有没有对客观世界做真实的刻画，还是发生了过拟合。
考试成绩差的同学，有这三种可能：
一、泛化能力弱，做了很多题，始终掌握不了规律，不管遇到老题新题都不会做，称作 欠拟合；
二、泛化能力弱，做了很多题，只会死记硬背，一到考试看到新题就蒙了，称作 过拟合；
三、完全不做题，考试全靠瞎蒙，称作 不收敛。

什么是好的机器学习模型的提出

奥卡姆的威廉是 14 世纪一位崇尚简单的修士和哲学家。他认为科学家应该优先采用更简单（而非更复杂）的公式或理论。

奥卡姆剃刀定律在机器学习方面的运用如下：

机器学习模型越简单，良好的实证结果就越有可能不仅仅基于样本的特性。

现今，我们已将奥卡姆剃刀定律正式应用于统计学习理论和计算学习理论领域。这些领域已经形成了泛化边界，即统计化描述模型根据以下因素泛化到新数据的能力：

模型的复杂程度
模型在处理训练数据方面的表现

虽然理论分析在理想化假设下可提供正式保证，但在实践中却很难应用。机器学习速成课程则侧重于实证评估，以评判模型泛化到新数据的能力。

机器学习模型旨在根据以前未见过的新数据做出良好预测。但是，如果要根据数据集构建模型，如何获得以前未见过的数据呢？一种方法是将您的数据集分成两个子集：

训练集 – 用于训练模型的子集。
测试集 – 用于测试模型的子集。

一般来说，在测试集上表现是否良好是衡量能否在新数据上表现良好的有用指标，前提是：

测试集足够大。
您不会反复使用相同的测试集来作假。

3.泛化误差

首先给出泛化误差的定义，如果学到的模型是 f^ ，那么用这个模型对未知数据预测的误差即为泛化误差

泛化误差反映了学习方法的泛化能力，如果一种方法学习的模型比另一种方法学习的模型具有更小的泛化误差，那么这种方法就更有效，事实上，泛化误差就是所学到的模型的期望误差。

4.模型泛化能力的评价标准

回归任务常用的性能度量是”均方误差”。

1. 错误率与精度

&#x9519;&#x8BEF;&#x7387;&#x4E0E;&#x7CBE;&#x5EA6;&#x662F;&#x5206;&#x7C7B;&#x4EFB;&#x52A1;&#x4E2D;&#x6700;&#x5E38;&#x7528;&#x7684;&#x4E24;&#x79CD;&#x6027;&#x80FD;&#x5EA6;&#x91CF;&#x3002;&#x65E2;&#x9002;&#x7528;&#x4E8E;&#x4E8C;&#x5206;&#x7C7B;&#xFF0C;&#x4E5F;&#x9002;&#x7528;&#x4E8E;&#x591A;&#x5206;&#x7C7B;&#x3002;

 &#x9519;&#x8BEF;&#x7387;&#xFF1A;&#x5206;&#x7C7B;&#x9519;&#x8BEF;&#x7684;&#x6837;&#x672C;&#x6570;&#x5360;&#x603B;&#x6837;&#x672C;&#x6570;&#x7684;&#x6BD4;&#x4F8B;&#x3002;
 &#x7CBE;&#x5EA6; &#xFF1A; &#x5206;&#x7C7B;&#x6B63;&#x786E;&#x7684;&#x6837;&#x672C;&#x6570;&#x5360;&#x603B;&#x6837;&#x672C;&#x6570;&#x7684;&#x6BD4;&#x4F8B;&#x3002;

 &#x7CBE;&#x5EA6; + &#x9519;&#x8BEF;&#x7387; = 1

          &#x5047;&#x8BBE;&#xFF0C;&#x603B;&#x7684;&#x6837;&#x672C;&#x6570;&#x4E3A;m&#x4E2A;&#xFF0C;&#x6211;&#x4EEC;&#x5BF9;&#x8FD9;m&#x4E2A;&#x6837;&#x672C;&#x8FDB;&#x884C;&#x9884;&#x6D4B;&#xFF0C;&#x5176;&#x4E2D;&#x9884;&#x6D4B;&#x5BF9;&#x4E86;&#x7684;&#x6837;&#x672C;&#x6709;p&#x4E2A;&#xFF0C;&#x9884;&#x6D4B;&#x9519;&#x7684;&#x6837;&#x672C;&#x6709;n&#x4E2A;&#xFF08;p+n = m&#xFF09;&#xFF0C;&#x5219;&#xFF1A;
          &#x9519;&#x8BEF;&#x7387; = n/m
          &#x7CBE;&#x5EA6;  = p/m

2. 查全率、查准率、F1

   &#x5F53;&#x4EFB;&#x52A1;&#x6709;&#x6240;&#x504F;&#x597D;&#x65F6;&#xFF0C;&#x9519;&#x8BEF;&#x7387;&#x4E0E;&#x7CBE;&#x5EA6;&#x4FBF;&#x4E0D;&#x80FD;&#x6EE1;&#x8DB3;&#x4EFB;&#x52A1;&#x7684;&#x9700;&#x6C42;&#x3002;&#x6BD4;&#x5982;&#x6211;&#x4EEC;&#x5173;&#x5FC3;&#x7684;&#x662F;&#x201C;&#x68C0;&#x7D22;&#x51FA;&#x6765;&#x7684;&#x4FE1;&#x606F;&#x4E2D;&#x6709;&#x591A;&#x5C11;&#x662F;&#x7528;&#x6237;&#x611F;&#x5174;&#x8DA3;&#x7684;&#x201D;&#x6216;&#x8005;&#x201C;&#x7528;&#x6237;&#x611F;&#x5174;&#x8DA3;&#x7684;&#x4FE1;&#x606F;&#x6709;&#x591A;&#x5C11;&#x88AB;&#x68C0;&#x7D22;&#x51FA;&#x6765;&#x4E86;&#x201D;&#x3002;&#x6B64;&#x65F6;&#x5C31;&#x9700;&#x8981;&#x67E5;&#x5168;&#x7387;&#x3001;&#x67E5;&#x51C6;&#x7387;&#x3001;F1&#x503C;&#x6765;&#x8FDB;&#x884C;&#x6A21;&#x578B;&#x7684;&#x6027;&#x80FD;&#x5EA6;&#x91CF;&#x3002;

   &#x5047;&#x8BBE;&#xFF0C;&#x603B;&#x7684;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#x6709;m&#x4E2A;&#xFF0C;&#x5176;&#x4E2D;&#x6B63;&#x6837;&#x672C;&#x6709;z&#x4E2A;&#xFF0C;&#x8D1F;&#x6837;&#x672C;&#x6709;f&#x4E2A;&#x3002;

   &#x67E5;&#x5168;&#x7387;&#xFF1A;&#x5BF9;&#x8FD9;m&#x4E2A;&#x6837;&#x672C;&#x8FDB;&#x884C;&#x9884;&#x6D4B;&#xFF0C;&#x5176;&#x4E2D;z&#x4E2A;&#x6B63;&#x6837;&#x672C;&#x4E2D;&#x6709;zm&#x4E2A;&#x88AB;&#x9884;&#x6D4B;&#x5BF9;&#x3002;&#x67E5;&#x5168;&#x7387; = zm / z
   &#x67E5;&#x51C6;&#x7387;&#xFF1A; &#x5BF9;&#x8FD9;m&#x4E2A;&#x6837;&#x672C;&#x8FDB;&#x884C;&#x9884;&#x6D4B;&#xFF0C;&#x9884;&#x6D4B;&#x7684;&#x7ED3;&#x679C;&#x4E2D;&#x6709;ym&#x4E2A;&#x662F;&#x6B63;&#x6837;&#x672C;&#xFF0C;ym&#x4E2A;&#x6837;&#x672C;&#x4E2D;&#x6709;y&#x4E2A;&#x662F;z&#x7684;&#xFF0C;&#x5219;&#xFF1A;&#x67E5;&#x51C6;&#x7387; = y / ym
   ![&#x8FD9;&#x91CC;&#x5199;&#x56FE;&#x7247;&#x63CF;&#x8FF0;](https://img-blog.csdn.net/20170323192002648?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdnZ5dWVydnY=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
   &#x4E0A;&#x56FE;&#x4E3A;&#x6DF7;&#x6DC6;&#x77E9;&#x9635;&#xFF0C;TP + FN + FP + TN = &#x6837;&#x4F8B;&#x603B;&#x6570;&#x3002;
   &#x5BF9;&#x5E94;&#x7684;&#x67E5;&#x51C6;&#x7387;P&#x548C;&#x67E5;&#x5168;&#x7387;R&#x5206;&#x522B;&#x5B9A;&#x4E49;&#x4E3A;&#xFF1A;
   ![&#x8FD9;&#x91CC;&#x5199;&#x56FE;&#x7247;&#x63CF;&#x8FF0;](https://img-blog.csdn.net/20170323192302192?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdnZ5dWVydnY=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
  &#x67E5;&#x51C6;&#x7387;&#x548C;&#x67E5;&#x5168;&#x7387;&#x662F;&#x4E00;&#x5BF9;&#x77DB;&#x76FE;&#x7684;&#x5EA6;&#x91CF;&#x3002;
  &#x67E5;&#x51C6;&#x7387;&#x8D8A;&#x9AD8;&#x65F6;&#xFF0C;&#x67E5;&#x5168;&#x7387;&#x5F80;&#x5F80;&#x504F;&#x4F4E;&#x3002;&#x800C;&#x67E5;&#x5168;&#x7387;&#x8D8A;&#x9AD8;&#x65F6;&#xFF0C;&#x67E5;&#x51C6;&#x7387;&#x5F80;&#x5F80;&#x504F;&#x4F4E;&#x3002;

P-R曲线：（查准率-查全率曲线）

P-R曲线是以查全率为横轴，以查准率为纵轴的二维坐标图。

P-R曲线的建立过程：
根据学习器的预测结果对样例进行排序，排在前面的是学习器认为”最可能”是正例的样本，排在后面的则是学习器任务”最不可能”是正例的样本。按此排序，逐个把样本作为正例进行预测，则每次可以计算出当前的查全率和查准率。以此为纵轴和横轴作图，便得到了查全率-查准率曲线，即P-R曲线。

P-R曲线作用：
用来对比不同学习器的好坏的。例如上图2.3中学习器A包含学习器C，则说学习器A优于学习器C。但当两个学习器的P-R曲线有交叉时，难以判断那个学习器较好。通常的做法是计算每个学习器曲线所包含的面积，比较面积的大小。但这值不太容易估算。于是人们便使用”平衡点”（简称BEP）这一度量，即”查准率 = 查全率”时的取值。例如上图中的平衡点可判定，学习器A优于学习器B。

F1值：
F1值为查全率和查准率的协调平均值，

&#x5728;&#x4E00;&#x4E9B;&#x5E94;&#x7528;&#x4E2D;&#xFF0C;&#x5BF9;&#x67E5;&#x5168;&#x7387;&#x548C;&#x67E5;&#x51C6;&#x7387;&#x7684;&#x91CD;&#x89C6;&#x7A0B;&#x5EA6;&#x6709;&#x6240;&#x4E0D;&#x540C;&#xFF0C;F1&#x5EA6;&#x91CF;&#x7684;&#x4E00;&#x822C;&#x5F62;&#x5F0F;&#x80FD;&#x8BA9;&#x6211;&#x4EEC;&#x8868;&#x8FBE;&#x51FA;&#x5BF9;&#x67E5;&#x5168;&#x7387;&#x548C;&#x67E5;&#x51C6;&#x7387;&#x7684;&#x7684;&#x4E0D;&#x540C;&#x504F;&#x597D;&#x3002;
![&#x8FD9;&#x91CC;&#x5199;&#x56FE;&#x7247;&#x63CF;&#x8FF0;](https://img-blog.csdn.net/20170323200924929?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdnZ5dWVydnY=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)

&#x5176;&#x4E2D;&#x3B2; > 0 &#x5EA6;&#x91CF;&#x7684;&#x67E5;&#x5168;&#x7387;&#x5BF9;&#x67E5;&#x51C6;&#x7387;&#x7684;&#x76F8;&#x5BF9;&#x91CD;&#x8981;&#x6027;&#x3002;&#x3B2; = 1 &#x65F6;&#x4FBF;&#x4E3A;&#x6807;&#x51C6;&#x7684;F1&#x3002;&#x3B2; > 1&#x65F6;&#x67E5;&#x5168;&#x7387;&#x6709;&#x66F4;&#x5927;&#x7684;&#x5F71;&#x54CD;&#xFF0C;&#x3B2; < 1&#x65F6;&#x67E5;&#x51C6;&#x7387;&#x6709;&#x66F4;&#x5927;&#x7684;&#x5F71;&#x54CD;&#x3002;

&#x5F53;&#x6211;&#x4EEC;&#x5728;&#x591A;&#x4E2A;&#x4E8C;&#x5206;&#x7C7B;&#x6DF7;&#x6DC6;&#x77E9;&#x9635;&#x4E0A;&#x7EFC;&#x5408;&#x8003;&#x8651;&#x67E5;&#x5168;&#x7387;&#x548C;&#x67E5;&#x51C6;&#x7387;&#x65F6;&#x6709;&#x4E24;&#x79CD;&#x65B9;&#x6CD5;&#xFF1A;
&#x7B2C;&#x4E00;&#x79CD;&#xFF0C;&#x5148;&#x5728;&#x5404;&#x6DF7;&#x6DC6;&#x77E9;&#x9635;&#x4E0A;&#x5206;&#x522B;&#x8BA1;&#x7B97;&#x51FA;&#x67E5;&#x5168;&#x7387;&#x548C;&#x67E5;&#x51C6;&#x7387;&#xFF0C;&#x518D;&#x8BA1;&#x7B97;&#x5E73;&#x5747;&#x503C;&#x3002;&#x8FD9;&#x6837;&#x5C31;&#x5F97;&#x5230;&#x4E86;&#x201C;&#x5B8F;&#x67E5;&#x5168;&#x7387;&#x201D;&#x3001;&#x201C;&#x5B8F;&#x67E5;&#x51C6;&#x7387;&#x201D;&#x3001;&#x4EE5;&#x53CA;&#x201C;&#x5B8F;F1&#x201D;
![&#x8FD9;&#x91CC;&#x5199;&#x56FE;&#x7247;&#x63CF;&#x8FF0;](https://img-blog.csdn.net/20170323201635647?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdnZ5dWVydnY=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)

第二种，先将各混淆矩阵的对应元素进行平均，再基于这些平均值进行计算，得出”微查全率””微查准率”以及”微F1″，

3.ROC与AUC

ROC曲线与AUC常被用来评价一个二分类器的优劣。

和P-R曲线类似，”ROC曲线”是根据学习器的预测结果对样例进行排序，按此顺序逐个把样本作为正例进行预测，每次计算出两个重要的量值（真正例率TRP和假正例率FPR），分别以他们作为横、纵坐标作图，就得到了”ROC曲线”。

    &#x4E0A;&#x56FE;&#xFF08;a&#xFF09;&#x4E2D;&#x7684;&#x865A;&#x7EBF;&#x8868;&#x793A;&#x201C;&#x968F;&#x673A;&#x731C;&#x6D4B;&#x201D;&#x6A21;&#x578B;&#x3002;&#x5728;(0,1)&#x70B9;&#x5904;&#xFF0C;&#x5373;FPR=0, TPR=1&#xFF0C;&#x8FD9;&#x610F;&#x5473;&#x7740;FN = 0&#xFF0C;&#x5E76;&#x4E14;FP = 0&#x3002;&#x8FD9;&#x662F;&#x4E00;&#x4E2A;&#x5B8C;&#x7F8E;&#x7684;&#x5206;&#x7C7B;&#x5668;&#xFF0C;&#x5B83;&#x5C06;&#x6240;&#x6709;&#x7684;&#x6837;&#x672C;&#x90FD;&#x6B63;&#x786E;&#x5206;&#x7C7B;&#x3002;&#x5728;(1,0)&#x70B9;&#x5904;&#xFF0C;&#x5373;FPR=1&#xFF0C;TPR=0&#xFF0C;&#x7C7B;&#x4F3C;&#x5730;&#x5206;&#x6790;&#x53EF;&#x4EE5;&#x53D1;&#x73B0;&#x8FD9;&#x662F;&#x4E00;&#x4E2A;&#x6700;&#x7CDF;&#x7CD5;&#x7684;&#x5206;&#x7C7B;&#x5668;&#xFF0C;&#x56E0;&#x4E3A;&#x5B83;&#x6210;&#x529F;&#x907F;&#x5F00;&#x4E86;&#x6240;&#x6709;&#x7684;&#x6B63;&#x786E;&#x7B54;&#x6848;&#x3002;&#x5728;(0,0)&#x70B9;&#x5904;&#xFF0C;&#x5373;FPR=TPR=0&#xFF0C;&#x5373;FP = TP =0&#xFF0C;&#x53EF;&#x4EE5;&#x53D1;&#x73B0;&#x8BE5;&#x5206;&#x7C7B;&#x5668;&#x9884;&#x6D4B;&#x6240;&#x6709;&#x7684;&#x6837;&#x672C;&#x90FD;&#x4E3A;&#x8D1F;&#x6837;&#x672C;&#x3002;&#x5728;&#xFF08;1,1&#xFF09;&#x70B9;&#x5904;&#xFF0C;&#x5206;&#x7C7B;&#x5668;&#x5B9E;&#x9645;&#x4E0A;&#x9884;&#x6D4B;&#x6240;&#x6709;&#x7684;&#x6837;&#x672C;&#x90FD;&#x4E3A;&#x6B63;&#x6837;&#x672C;&#x3002;&#x7ECF;&#x8FC7;&#x4EE5;&#x4E0A;&#x7684;&#x5206;&#x6790;&#xFF0C;&#x6211;&#x4EEC;&#x53EF;&#x4EE5;&#x65AD;&#x8A00;&#xFF0C;ROC&#x66F2;&#x7EBF;&#x8D8A;&#x63A5;&#x8FD1;&#x5DE6;&#x4E0A;&#x89D2;&#xFF0C;&#x8BE5;&#x5206;&#x7C7B;&#x5668;&#x7684;&#x6027;&#x80FD;&#x8D8A;&#x597D;&#x3002;

现实任务中通常是利用有限个测试样本来绘制ROC图的，所以仅能或得有限个（真正例率TRP和假正例率FPR）坐标对，绘制出的图如上图中的（b）。

ROC曲线绘制过程：

   &#x7ED9;&#x5B9A;m&#x4E2A;&#x6B63;&#x4F8B;&#x548C;n&#x4E2A;&#x53CD;&#x4F8B;&#xFF0C;&#x6839;&#x636E;&#x5B66;&#x4E60;&#x5668;&#x9884;&#x6D4B;&#x7ED3;&#x679C;&#x5BF9;&#x6837;&#x4F8B;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#xFF0C;&#x7136;&#x540E;&#x628A;&#x5206;&#x7C7B;&#x9608;&#x503C;&#x8BBE;&#x7F6E;&#x4E3A;&#x6700;&#x5927;&#xFF0C;&#x5373;&#x628A;&#x6240;&#x6709;&#x6837;&#x4F8B;&#x5747;&#x9884;&#x6D4B;&#x4E3A;&#x53CD;&#x4F8B;&#xFF0C;&#x6B64;&#x65F6;&#x771F;&#x6B63;&#x4F8B;&#x7387;&#x548C;&#x5047;&#x6B63;&#x4F8B;&#x7387;&#x5747;&#x4E3A;0&#xFF0C;&#x5728;&#x5750;&#x6807;&#xFF08;0&#xFF0C;0&#xFF09;&#x51FA;&#x6807;&#x8BB0;&#x4E00;&#x4E2A;&#x70B9;&#x3002;&#x7136;&#x540E;&#xFF0C;&#x5C06;&#x5206;&#x7C7B;&#x7684;&#x9608;&#x503C;&#x4F9D;&#x6B21;&#x8BBE;&#x7F6E;&#x4E3A;&#x6BCF;&#x4E2A;&#x6837;&#x4F8B;&#x7684;&#x9884;&#x6D4B;&#x503C;&#xFF0C;&#x5373;&#x4F9D;&#x6B21;&#x5C06;&#x6BCF;&#x4E2A;&#x6837;&#x4F8B;&#x5212;&#x5206;&#x4E3A;&#x6B63;&#x4F8B;&#x3002;&#x8BBE;&#x524D;&#x4E00;&#x4E2A;&#x6807;&#x8BB0;&#x7684;&#x5750;&#x6807;&#x4E3A;&#xFF08;x,y&#xFF09;&#xFF0C;&#x5F53;&#x524D;&#x82E5;&#x4E3A;&#x771F;&#x6B63;&#x4F8B;&#xFF0C;&#x5219;&#x5BF9;&#x5E94;&#x7684;&#x6807;&#x8BB0;&#x70B9;&#x7684;&#x5750;&#x6807;&#x4E3A;&#xFF08;x, y+1/m&#xFF09;;&#x82E5;&#x5F53;&#x524D;&#x4E3A;&#x5047;&#x6B63;&#x4F8B;&#xFF0C;&#x5219;&#x5BF9;&#x5E94;&#x6807;&#x8BB0;&#x70B9;&#x7684;&#x5750;&#x6807;&#x4E3A;&#xFF08;x+1/n, y&#xFF09;&#xFF0C; &#x7136;&#x540E;&#x7528;&#x7EBF;&#x6BB5;&#x8FDE;&#x63A5;&#x76F8;&#x90BB;&#x7684;&#x70B9;&#x5373;&#x53EF;&#x3002;

学习器比较：

  &#x82E5;&#x4E00;&#x4E2A;&#x5B66;&#x4E60;&#x5668;A&#x7684;ROC&#x66F2;&#x7EBF;&#x5305;&#x542B;&#x53E6;&#x5916;&#x4E00;&#x4E2A;&#x5B66;&#x4E60;&#x5668;B&#x7684;ROC&#x66F2;&#x7EBF;&#xFF0C;&#x5219;&#x8BA4;&#x4E3A;&#x5B66;&#x4E60;&#x5668;A&#x7684;&#x6027;&#x80FD;&#x4F18;&#x4E8E;&#x5B66;&#x4E60;&#x5668;B&#x3002;
  &#x82E5;&#x4E24;&#x8005;&#x7684;ROC&#x66F2;&#x7EBF;&#x76F8;&#x4EA4;&#xFF0C;&#x5219;&#x9700;&#x8981;&#x5BF9;&#x5404;&#x81EA;ROC&#x66F2;&#x7EBF;&#x4E0B;&#x5F97;&#x9762;&#x79EF;&#xFF08;&#x5373;AUC&#xFF09;&#x8FDB;&#x884C;&#x6BD4;&#x8F83;&#x3002;

AUC可通过对ROC曲线下各部分面积求和而得。

4.代价敏感错误率与代价曲线

不同类型的错误所造成的后果不同。

为权衡不同类型错误造成的不同损失，可为错误赋予”非均等代价”。

以二分类为例，可设定一个”代价矩阵”

表中cost10 表示将第1类错分为第0类的代价，cost01同样，表示将第0类错分为第1类的代价。此二分类也可拓展为多分类costij表示将第i类错分为第j类的代价。

前面的性能度量都默认的假设了均等代价，所有错误率是直接计算错误的次数，并没有考虑不同错误会造成的不同的后果。在非均等代价下，我们希望的不再是简单地最小化错误次数，而是希望最小化”总体代价”。

上式中，D+和D-分别表示样例集D中的正例子集和反例子集。

在非均等代价下，ROC曲线不能直接反应学习器期望的总体代价，而”代价曲线”则可达到该目的。
代价曲线图的横轴是取值为[0,1]的正例概率代价：

上式中p是样例为正例的概率。

纵轴是取值为[0，1]的归一化代价：

FNR表示假正例率，FNR = 1 – TPR

代价曲线的绘制：

   ROC&#x66F2;&#x7EBF;&#x4E0A;&#x6BCF;&#x4E00;&#x70B9;&#x5BF9;&#x5E94;&#x4E86;&#x4EE3;&#x4EF7;&#x5E73;&#x9762;&#x4E0A;&#x7684;&#x4E00;&#x6761;&#x7EBF;&#x6BB5;&#xFF0C;&#x8BBE;ROC&#x66F2;&#x7EBF;&#x4E0A;&#x7684;&#x5750;&#x6807;&#x4E3A;&#xFF08;TPR&#xFF0C;FPR&#xFF09;&#xFF0C;&#x5219;&#x53EF;&#x76F8;&#x5E94;&#x7684;&#x8BA1;&#x7B97;&#x51FA;FNR&#xFF0C;&#x7136;&#x540E;&#x5728;&#x4EE3;&#x4EF7;&#x5E73;&#x9762;&#x4E0A;&#x7ED8;&#x5236;&#x4E00;&#x6761;&#x4ECE;&#xFF08;0&#xFF0C;FPR&#xFF09;&#x5230;&#xFF08;1&#xFF0C;FNR&#xFF09;&#x7684;&#x7EBF;&#x6BB5;&#xFF0C;&#x7EBF;&#x6BB5;&#x4E0B;&#x9762;&#x7684;&#x9762;&#x79EF;&#x5373;&#x8868;&#x793A;&#x4E86;&#x8BE5;&#x6761;&#x4EF6;&#x4E0B;&#x5F97;&#x671F;&#x671B;&#x603B;&#x4F53;&#x4EE3;&#x4EF7;&#x3002;&#x5982;&#x6B64;&#x5C06;ROC&#x66F2;&#x7EBF;&#x4E0A;&#x7684;&#x6BCF;&#x4E2A;&#x70B9;&#x8F6C;&#x5316;&#x4E3A;&#x4EE3;&#x4EF7;&#x5E73;&#x9762;&#x4E0A;&#x7684;&#x4E00;&#x6761;&#x7EBF;&#x6BB5;&#xFF0C;&#x7136;&#x540E;&#x53D6;&#x6240;&#x6709;&#x7EBF;&#x6BB5;&#x7684;&#x4E0B;&#x754C;&#xFF0C;&#x56F4;&#x6210;&#x7684;&#x9762;&#x79EF;&#x5373;&#x4E3A;&#x5728;&#x6240;&#x6709;&#x6761;&#x4EF6;&#x4E0B;&#x5B66;&#x4E60;&#x5668;&#x7684;&#x671F;&#x671B;&#x603B;&#x4F53;&#x4EE3;&#x4EF7;&#x3002;

提高泛化能力的方式大致有三种：1.增加数据量。2.正则化。3.凸优化。

5.举例

下面图片中每个点代表一棵树的位置，蓝点代表生病的树，橙点代表健康的树。

给你样本数据，要求提供一个机器学习算法算法，区分开两种树。

你千辛万苦画出来一条曲线能够很好地进行聚类， 而且模型的损失非常低(损失函数)，几乎完美的把两类点一分为二。但这个模型真的就是好模型吗？

用该算法预测新样本时，没有很好的区分两类点，表现得有些差劲。

上述模型 过拟合了训练数据的特性，过拟合模型在训练过程中产生的损失很低，但在预测新数据方面的表现却非常糟糕。如果某个模型在拟合当前样本方面表现良好，那么我们如何相信该模型会对新数据做出良好的预测呢？过拟合是由于模型的复杂程度超出所需程度而造成的。机器学习的基本冲突是适当拟合我们的数据，但也要尽可能简单地拟合数据。

https://zhuanlan.zhihu.com/p/59673364?utm_source=wechat_session

https://segmentfault.com/a/1190000016425702?utm_source=tag-newest

https://my.oschina.net/u/4604431/blog/4476343

https://www.jianshu.com/p/849423297c7f

https://blog.csdn.net/vvyuervv/article/details/65449079

Original: https://blog.csdn.net/qq_41877184/article/details/113902481
Author: Zero-place
Title: 机器学习-泛化能力

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/543003/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

报错解决：one of the variables needed for gradient computation has been modified by an inplace operation

### 回答1：这个错误通常出现在使用 PyTorch_进行反向传播计算时。它意味着在计算梯度时，某个变量已经被就地（ _inpl ace）操作修改了，导致梯度计算出错。解决_…

人工智能 2023年7月22日
0064
NetCDF数据在ArcMap中的使用

NetCDF又称科学数据集，可以存储温度、湿度、风速、风向等多个维度的文件格式。本次气象数据来源于地理遥感生态网平台。下面我们来介绍如何在ArcMap中使用NetCDF。在Ar…

人工智能 2023年6月30日
0055
统计学习-01统计学习概念

chapter 2 统计学习 2.1基本概念统计学习是关于估计 f ( ⋅ ) f(\cdot)f (⋅) 的一系列方法，其中f ( ⋅ ) f(\cdot)f (⋅)为一个定量…

人工智能 2023年7月1日
0075
OpenCV OCR实战文档扫描与文字检测

本文讲述使用OpenCV- python以及easyocr库实现文档扫描与文字检测的思路和具体实现过程。目录知识准备项目概述实现过程代码讲解 1.读入图片并进行预处理（灰…

人工智能 2023年6月19日
0071
NumPy数据分析基础：数组形态转换转置操作一文详解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月16日
0052
【数值预测案例】(5) LSTM 时间序列气温数据预测，附TensorFlow完整代码

大家好，今天和各位分享一下如何使用循环神经网络 LSTM 完成有多个特征的气温预测。上一节中我介绍了 LSTM 的单个特征的预测，感兴趣的可以看一下：https://blog.cs…

人工智能 2023年6月16日
00256
CMeKG代码解读(以项目为导向从零开始学习知识图谱)（五）

新的一个python文件，继续加油！！！ medical_ner.py medical_ner类： from_input(): from_text(): spilt_entity_…

人工智能 2023年6月1日
0097
Pytorch中几种调整学习率scheduler机制(策略)的用法即其可视化

申明此篇博文是以AlexNet为网络架构(其需要输入的图像大小为227x227x3)，CIFAR10为数据集，SGD为梯度下降函数举例。运行此程序时，文件的结构： /conten…

人工智能 2023年7月22日
0082
Python爬取京东商品评论数据

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月4日
0087
基于YOLOV5的FPS类游戏检测auto aim

Github地址：github 简介本项目基于yolov5,实现了一款FPS类游戏的检测，旨在使用现有网络结构实现一个完整的落地项目，…

人工智能 2023年7月27日
0052
【高级渲染特性】抗锯齿技术介绍

什么是锯齿图像的边缘有明显的像素边界，看起来不自然，好像锯齿一样什么是抗锯齿消除或者减轻锯齿为什么会出现锯齿计算器屏幕上显示的图像由一个个像素组成，绘制斜线的时候需要按照…

人工智能 2023年6月18日
00100
Python学习笔记：Pandas应用

使用列表创建DataframePandas优点：处理浮点与非浮点数据里的缺失数据，表示为 NaN；大小可变：插入或删除 DataFrame 等多维对象的列；自动、显式数…

人工智能 2023年7月7日
0099
Codeforces gym 103990

C – Correct prob.: ICPC赛制规则，九点开始的场，有个队只交了一发且直接AC，给出提交时间，问罚时 code： #include using nam…

人工智能 2023年6月29日
0066
ArcGIS与地理加权回归GWR【一】

公众号原文 ArcGIS与地理加权回归GWR【一】https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A ; 开个新坑啊，写一写关于地理…

人工智能 2023年6月16日
00107
A-Level经济真题（13）

A-Level有70多门科目，其中，A-Level经济是最受欢迎考试科目之一。英国大学很多专业都要求学生学习A-Level经济课程。但是，对于A-Level经济究竟偏文还是偏理，考…

人工智能 2023年5月30日
0096
一步搞定模型训练和商品召回：京东全新索引联合训练召回模型

©PaperWeekly 原创 · 作者 |张菡单位 |京东算法工程师研究方向 |信息检索简介基于深度学习的语义检索已经广泛应用于互联网应用中。早在 2018 年，京东搜索…

人工智能 2023年6月2日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习-泛化能力

大家都在看