几种典型的半监督学习方法

2023年6月15日上午3:22 • 人工智能 • 阅读 107

半监督学习前提假设

1.连续性假设（Continuity Assumption）

分类问题- input是比较接近的时候，ouput的后验概率矩阵也应该距离比较小

2.聚类假设（Cluster Assumption）

类类内聚，类间分开

3.流形假设（Manifold Assumption）

所有数据点可以被多个低维流形表达。简单理解就是，将高维冗余特征降维到低维空间
相同流形上的数据点，标签一样。换句话说，降维之后同样标签的数据要接近或一致

半监督学习数学定义

半监督学习本质上就是设计了一个损失函数，三个部分组成：有监督loss，无监督loss以及正则项

半监督学习的实施方法

生成式模型：Semi-supervised GANs ; Semi-supervised VAEs

Re-using Discriminator

Discriminator 鉴别器其实就充当的是二分类器，对输入或生成的图片判定真假；在半监督中重用这个鉴别器，是将这个鉴别器做成k分类分类器，构建方法是输入数据不仅是有标签的数据对，还有生成的数据，以及没有标签的数据。用这三块构建损失。

Generated Samples to regularize a classifier

图片表征学习。Discriminator还是一个二分类器，设计了输入。XG是生成样本，m：binary mask（矩阵，只有0和1）相当于特征抽取器

inference model

在Discriminator部分增加了C-类别。这里的是k+1类分类器，多的一类别是生成器产生，多出来的这个类别要跟真实的某一个类别接近。当模型训练完备以后，可以认为这个Discriminator具有分类能力。

Generate Data

增广数据，产生更多数据

一致性损失（Consistency Regularization一致性正则）

设计思路：

II Model

x是unlabeled数据，Aug是增广策略（随机翻转，增加噪声等等），送入模型进行识别，输出两个接近的后验概率或特征。每个训练的epoch，X会被前向推理两次，这两次的输入虽然经过不同的随机增广，但输出应该是具有一致性的。

图神经网络：AutoEncoder-based models ; GNN-based models

伪标签: Disagreement-based models ; Self-training models

Pseudo-label伪标签，标签是预测出来的。loss设计：第一项是有标记的损失，第二项是预测的伪标签进入模型的loss

伪标签方法设计：结构上，训练流程，伪标签预测方法上做设计。但是伪标签存在弊端，即1.标签选择不易，因为模型在训练初期并不是完备的模型，预测一个伪标签若是错的，那么在迭代过程中会使模型误差变大。2.alpha值（权重系数）很难确定。（也有基于这两个弊端进行改进的方法）

混合方法

结合上述方法的优点以提升训练结果。

Original: https://blog.csdn.net/qq_34539676/article/details/125142908
Author: Poppy679
Title: 几种典型的半监督学习方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/613529/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

视觉机械臂自主抓取全流程

目录简介相机标定手眼标定 Eye-In-Hand Eye-To-Hand 求解（Eye-In-Hand）求解AX=XB 手眼标定步骤读取出摄像头信息并确定目标物体的位姿 …

人工智能 2023年7月29日
0058
心跳信号分类预测（天池数据集）

前些时间，做了个阿里天池的练习赛，心跳预测。说是练习赛，实际也没赛，因为最后的结果也没拿去提交、上传之类的，最后做了个小展示，权当做练手，在这里和大家分享一下整体的思路，希望可以给…

人工智能 2023年7月1日
0066
perl下mysql同步监控

写了个perl下监控mysql同步状态的脚本，利用163的邮局进行发送邮件，避免本机用sendmail发送时出现问题，可以本机监控，也可以远程。在同步异常时候，将日志写入/var…

人工智能 2023年6月27日
0076
目标检测（降低误检测率及小目标检测系列笔记）

深度学习中，为了提高模型的精度和泛化能力，往往着眼于两个方面：（1）使用更多的数据（2）使用更深更复杂的网络。 ** 一、什么是负样本 **负样本是指不包含任务所要识别的目标的图像…

人工智能 2023年7月21日
0050
GYM雅达利打砖块环境安装

GYM雅达利打砖块环境安装前情提要 * 卸载之前安装的GYM 下载 VS build tools 运行 VS build tools并安装以下工具重启电脑安装cmake, a…

人工智能 2023年7月23日
0069
Transformer 详解(上) — 编码器【附pytorch代码实现】

Transformer 详解（上）编码器 Transformer结构文本嵌入层位置编码注意力机制编码器之多头注意力机制层编码器之前馈全连接层规范化层和残差连接代码实现…

人工智能 2023年5月30日
0088
【Python入门教程】第73篇写入CSV文件

本篇我们介绍如何使用 Python 内置的 csv 模块将数据写入 CSV 文件。写入 CSV 文件在 Python 代码中写入 CSV 文件的步骤如下：首先，使用内置的 o…

人工智能 2023年7月5日
0063
CS224N笔记(五) Lecture8 机器翻译、Seq2Seq以及Attention注意力机制

一、背景知识机器翻译，Machine Translation，简称MT，是一种运用计算机将一个句子从一种语言翻译成另一种语言的技术，是自然语言处理领域中一项重要的任务。机器翻译最…

人工智能 2023年5月28日
0059
mysql源码分析——InnoDB的磁盘结构之表空间格式

一、表空间的文件类型表空间的文件类型其实就文件的具体类型，在前面谈到过表空间的上层逻辑分层，最下面一层是通过Page来实现的，也就是说，文件的底层就是通过链表来控制这个页数据。而…

人工智能 2023年6月27日
0090
基于bert的命名实体识别任务（一）

自从bert提出后，nlp领域的预训练语言模型持续刷新各种任务榜单，各种预训练语言模型不断提出并更新迭代，最新的GPT3以千亿级的参数再次刷新了榜单任务。但是在工业界，bert的预…

人工智能 2023年5月27日
0077
卡尔曼滤波算法的五大核心公式含义

卡尔曼滤波算法中的五大核心公式含义在SLAM中经常会用的卡尔曼滤波算法，这里简单的记录一下卡尔曼滤波算法的五大核心公式，以便后续查询，公式的推导不在作赘述，直接放出卡尔曼滤波算法…

人工智能 2023年6月29日
0064
PyTorch 最新安装教程（2021-07-27）

万事开头难！这句话又一次被我验证。记得前不久刚陷入 Tensorflow2.0的安装困境，这一次又被 PyTorch 搞哭辽。孩子太难了o(╥﹏╥)o，不过还好最终成功安装，…

人工智能 2023年5月24日
0074
opencv 学习笔记（七）灰度变换

灰度变换一、灰度变换概念二、灰度变换的作用三、灰度变换的方法灰度化一、灰度的概念二、对彩色图进行灰度化 * 1.加权平均值法 2.取最大值 3.平均值灰度的线性变换 …

人工智能 2023年6月19日
0065
Conda配置清华源加速安装Python包（2021.11最新版）

本教程适用范围本教程适用于64位windows操作系统。其他操作系统可以根据本教程的思路以此类推，探索配置方法。目前网上给Conda配置清华源的教程很多，但是由于网上信息新老…

人工智能 2023年5月25日
00113
【微信小程序】全局配置 – tabBar

目录全局配置 – tabBar 1. 什么是 tabBar 2. tabBar 的 6 个组成部分 3. tabBar 节点的配置项 4. 每个 tab 项的配置选项…

人工智能 2023年5月30日
00110
深度学习参数初始化（二）Kaiming初始化含代码

目录一、介绍二、基础知识三、Kaiming初始化的假设条件四、Kaiming初始化的简单的公式推导 1.前向传播 2.反向传播五、Pytorch实现深度学习参数初始化系…

人工智能 2023年7月29日
0078

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30