半监督学习方法在小样本场景下的效果如何

2024年1月1日上午12:49 • 人工智能 • 阅读 29

问题描述

在小样本场景下，传统的监督学习方法通常需要大量的标注数据进行训练，但是在现实中，很多时候难以获得充分标注的数据。这时，半监督学习方法可以利用未标注的数据来提高学习效果。本文将介绍半监督学习方法在小样本场景下的效果，并给出相关算法原理、公式推导、计算步骤以及复杂Python代码示例。

算法原理

半监督学习旨在利用未标注样本的信息来提高分类器的性能。它通过将未标注样本的标签作为学习过程中的约束条件，将未标注样本与标注样本一起使用。其中，协同训练算法是一种经典的半监督学习方法，它假设每个样本的特征存在互补性。

具体来说，协同训练算法的主要思想是基于两个分类器（也可以是多个）相互合作的方式来进行学习。在每一轮迭代中，算法会从未标注样本中选择一部分作为“伪标签”加入到训练集中，然后分别使用两个分类器对训练样本进行分类。通过对比两个分类器的分类结果，判断它们的一致性，并将一致的样本加入标注样本集中。重复这个过程直到满足停止条件。

公式推导

协同训练算法通过最大化互补性原则，利用未标注样本的信息来提高分类器的精度。

假设训练数据集包含有标注样本集$X_l = {(x_{1l}, y_{1l}), (x_{2l}, y_{2l}),…, (x_{nl}, y_{nl})}$，其中$x_{il}$是第$i$个有标注样本的特征，$y_{il}$是对应的标签；未标注样本集$X_u = {x_{(nl+1)u}, x_{(nl+2)u}, …, x_{nu}}$，其中$x_{iu}$是第$i$个未标注样本的特征。

协同训练算法假设两个分类器相互独立，分别为$C_1$和$C_2$。在第$t$轮迭代中，算法使用两个分类器对样本进行分类，并使用两个分类器的分类结果判断互补性。

假设$X_l^t$是第$t$轮迭代的标注样本集，包含标注样本集$X_l$和从未标注样本集$X_u$中选择出的样本，$X_l^{t+1}$是第$t+1$轮迭代的标注样本集。

对于已标注样本，两个分类器的一致性可以表示为：
$$s(x_i) = C_1(x_i) – C_2(x_i)$$

其中，$s(x_i)$表示样本$x_i$的一致性得分。

根据互补性原则，选取一致性得分最高的$u$个样本加入到标注样本集$X_l^{t+1}$中，并更新两个分类器的参数。

计算步骤

初始化两个分类器$C_1$和$C_2$，设置迭代次数、停止条件和未标注样本选择的规则。
在第$t$轮迭代中，使用分类器$C_1$和$C_2$对标注样本集$X_l^t$和未标注样本集$X_u$进行分类，得到分类结果。
计算每个样本的一致性得分，选取一致性得分最高的$u$个样本加入到标注样本集$X_l^{t+1}$中。
使用$X_l^{t+1}$重新训练分类器$C_1$和$C_2$的参数。
重复步骤2至步骤4，直到满足停止条件。

复杂Python代码示例

下面是一个使用协同训练算法实现半监督学习的示例代码：

import numpy as np
from sklearn.base import BaseEstimator, ClassifierMixin
from sklearn.utils import shuffle
from sklearn.svm import SVC

class CoTraining(BaseEstimator, ClassifierMixin):
 def __init__(self, base_estimator=None, n_estimators=10, u_ratio=0.5, random_state=None):
 self.base_estimator = base_estimator
 self.n_estimators = n_estimators
 self.u_ratio = u_ratio
 self.random_state = random_state

 def fit(self, X, y):
 X, y = shuffle(X, y, random_state=self.random_state)
 n_samples = X.shape[0]
 n_unlabeled = int(n_samples artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls self.u_ratio)
 n_labeled = n_samples - n_unlabeled

 X_labeled = X[:n_labeled, :]
 y_labeled = y[:n_labeled]
 X_unlabeled = X[n_labeled:, :]

 self.estimators_ = []

 for t in range(self.n_estimators):
 # Train classifiers
 clf1 = self.base_estimator.fit(X_labeled, y_labeled)
 clf2 = self.base_estimator.fit(X_labeled, y_labeled)

 # Generate pseudo-labeled samples
 y_unlabeled1 = clf1.predict(X_unlabeled)
 y_unlabeled2 = clf2.predict(X_unlabeled)

 # Select reliable samples
 idx1 = np.argsort(np.abs(y_unlabeled1 - y_unlabeled2))[-n_unlabeled:]
 idx2 = np.argsort(np.abs(y_unlabeled1 - y_unlabeled2))[-n_unlabeled:]

 X_pseudo_labeled = X_unlabeled[idx1, :]
 y_pseudo_labeled = y_unlabeled1[idx1]

 # Combine labeled samples with pseudo-labeled samples
 X_combined = np.concatenate((X_labeled, X_pseudo_labeled), axis=0)
 y_combined = np.concatenate((y_labeled, y_pseudo_labeled), axis=0)

 # Update labeled and unlabeled samples
 X_labeled = X_combined
 y_labeled = y_combined
 X_unlabeled = np.delete(X_unlabeled, [idx1, idx2], axis=0)

 self.estimators_.append((clf1, clf2))

 return self

 def predict(self, X):
 n_estimators = len(self.estimators_)
 y_pred = np.zeros((X.shape[0], n_estimators))

 for i, (clf1, clf2) in enumerate(self.estimators_):
 y_pred[:, i] = clf1.predict(X) + clf2.predict(X)

 y_pred_final = np.sum(y_pred, axis=1) > (n_estimators / 2)
 return y_pred_final.astype(int)

代码细节解释

代码中的CoTraining类继承自BaseEstimator和ClassifierMixin，是一个基于估计器的分类器。

在fit方法中，首先对输入样本进行洗牌，并将数据集分为有标注样本集和未标注样本集。然后使用base_estimator作为基分类器，在每一轮迭代中进行训练。

在训练过程中，生成伪标签样本并选择可靠样本加入有标注样本集中。然后使用更新后的有标注样本集重新训练分类器的参数，重复这个过程直到满足停止条件。

在predict方法中，根据训练过程中得到的多个分类器的预测结果，使用多数投票的方式来进行最终的预测。

这个示例代码展示了半监督学习中协同训练算法的基本思路和实现过程。勿忘对协同训练算法的参数和停止条件进行合适的调整，以获得最佳的学习效果。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822218/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【上】CS229 吴恩达机器学习习题作业答案 problem sets 03 PS03（全部问题解答，欢迎各位前辈指教）

(a) 首先写出forward过程：z [ 1 ] = W [ 1 ] x + W 0 [ 1 ] h = σ ( z [ 1 ] ) z [ 2 ] = W [ 2 ] h + …

人工智能 2023年5月28日
00104
Hive实战—时间滑动窗口计算

关注公众号： 大数据技术派，回复 &#x…

人工智能 2023年6月11日
0082
10.Opencv的重要结构体Mat—深拷贝与浅拷贝

目录 Mat深拷贝与浅拷贝访问图像(Mat)的属性通道的分离与合并 Mat是什么？是一个矩阵，灰色图像2通道，彩色图像3通道。 Mat的优点：可以Numpy以矩阵的方式进…

人工智能 2023年7月18日
0045
分布式电源接入对配电网影响的研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。🍎个人主页：Matlab科研工作室🍊个人信条：格物致知。更多Matlab仿真内容点击👇…

人工智能 2023年7月31日
0071
ML之ME：分类预测问题中评价指标lift曲线的简介、使用方法、代码实现、案例应用之详细攻略

ML之ME：分类预测问题中评价指标lift曲线的简介、使用方法、代码实现、案例应用之详细攻略 lift曲线的简介 1、基于depth得到LIft曲线 2、lift曲线对比ROC曲线…

人工智能 2023年7月2日
0074
干货！基于神经网络的多粒度图表征学习

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！图是建模实体与实体之间关系的常用数据结构。近年来，图数据挖掘引起了学术界和工业界广泛的关注，如分类、聚类等等。然而图…

人工智能 2023年7月17日
0045
多文档的抽取式自动文本摘要

1.抽取式自动文本摘要本文自动文本摘要实现的依据就是词频统计。文章是由句子组成的，文章的信息都包含在句子中，有些句子包含的信息多，有些句子包含的信息少。句子的信息量用&#82…

人工智能 2023年6月1日
00143
mNetAssist(arm64)linux下图形界面的网络调试助手

linux下图形界面的网络调试助手mNetAssist,网上均为x86 amd处理器的. 想在arm64上使用,所以,自己down了源码编译了一遍,方便大家使用. 项目地址码云h…

人工智能 2023年6月27日
0062
python pandas 怎么判断一天是否为工作日+计算距离特定时间之间的天数

本文实现：①计算距离特定时间之间的天数。②时间是否为工作日。准备数据：数据采用的是一个平台的登录数据，包含登录的时间。任务的要求是：选取用户最近的登录时间，同时判断距2020,6…

人工智能 2023年7月8日
0044
Python数据处理之数据可视化（二维、三维）

文章目录一、Matplotlib绘制图形 * 1.1 两种画图接口：MATLAB接口、面向对象接口 1.2 plot绘图 – 1.2.1 曲线图、折线图、散点图 1….

人工智能 2023年7月6日
00101
Anaconda安装之后Spyder打不开解决办法–亲测有用2022.3.27

小白一个，搜索了大半天，还重装了两次，快被折磨疯了，终于探索出解决之道了。分享出来，希望后来者少走一些弯路，不要在安装上费这么大劲。如果你遇到了跟我一样的问题，希望可以帮到你（…

人工智能 2023年5月31日
0065
深度学习中的随机种子torch.manual_seed(number)、torch.cuda.manual_seed(number)

训练模型过程中，会遇到很多的随机性设置，设置随机性并多次实验的结果更加有说服力。但是现在发论文越来越要求模型的可复现性，这时候不得不控制代码的随机性问题且每次随机的初始权重一样，有…

人工智能 2023年6月16日
0058
人家网站都免费了，你还用Python去爬？

文章目录 * – ⛳️ 实战场景 – ⛳️ 实战编码 ⛳️ 实战场景这次实战的目标是一个叫做猫肯的字体站点，该站点所有的字体都是免费可商用的，所以为什么还…

人工智能 2023年7月3日
0060
python实现API的调用

在日常工作中，可能需要结合网上现在的一些API或者公司提供的数据接口来得到相应的数据或者实现对应的功能。因此API的调用和数据接口的访问都是做数据分析的一个常用操作，如何快速实现A…

人工智能 2023年7月4日
0073
基于K-means算法的数码迷彩生成——python实现

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月2日
0089
第四章 SQL语法分类

第四章 SQL语法分类文章目录第四章 SQL语法分类 * 一、数据查询 – 1、简单查询 2、去除重复值 3、查询列的选择 4、别名 5、条件查询 6、join连接…

人工智能 2023年7月2日
0044

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30