Deep embedding network for clustering论文笔记

2023年5月31日上午10:34 • 人工智能 • 阅读 87

Deep embedding network for clustering

论文笔记
网络结构
*
损失函数
–
预训练

网络结构

Deep embedding network for clustering论文笔记

和普通autoencoder相似，区别在于损失函数上。

; 损失函数

损失函数分为三部分，一个是重构误差，和普通的autoencoder一样，就不赘述了；一个用来保持局部分布不变（Locality-preserving）；另外一个使隐层表达变得稀疏(Group Sparsity )。

Locality-preserving

其中，k （ i ） k（i）k （i ）是点i i i的k k k个近邻（即knn算出的邻居），S i j S_{ij}S i j 衡量点i 、 j i、j i 、j之间的相似度。所以这个损失的含义就是，计算点i 、 j i、j i 、j在新的向量空间上的差异，S i j S_{ij}S i j 可以等价为权重，计算方式如下：

其中，t是超参。
这个损失可以保证每个点与它周围的k的点距离最小化。

; Group Sparsity

假设隐层向量表达的维度为d d d，数据中有G G G簇，将隐层表达的d d d个维度随机分为G G G份（互不相交），这样对分出的每一份就可以表达为f g ( x i ) f^g(x_i)f g (x i )。
前面的稀疏λ g \lambda_g λg 是权重，对于分出的第g g g组而言，这一组的规模越大，那么权重越大，计算方式如下：
Deep embedding network for clustering论文笔记

其中，n g n_g n g 代表第g g g组的大小，λ \lambda λ为常数。
可以看出，这个损失是对每个点的每一组的L1范式求和，造成的结果就是组间稀疏性，（论文中使用的词叫做block-diagonalized（块对角化））也就是说隐藏当中只有少量的组的值为非零的（论文中的理想情况是只有1组为非零的，然后这一组的g就对应了第g簇）。

总损失

α , β \alpha, \beta α,β都是超参。

; 预训练

使用了限制玻耳兹曼机来逐层优化，过程如网络架构中展示的一样，很好理解。

Original: https://blog.csdn.net/eternal_city/article/details/121585193
Author: 吾道长存
Title: Deep embedding network for clustering论文笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/550562/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于git，你需要了解这些

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月29日
0076
R语言对两个dataframe数据进行左连接（Left join）

R语言对两个dataframe数据进行左连接（Left join）目录 R语言对两个dataframe数据进行左连接（Left join） R语言数据连接（join、merge）…

人工智能 2023年7月15日
0053
KL散度损失函数

2021SC@SDUSC 之前学习了信息熵损失函数，之后来学习KI散度损失函数在我们使用的模型中，这个模型的输入样本和样本标签已定，它们所对应的真实分布概率也确定 KL散度（K…

人工智能 2023年6月17日
0083
超级跳跃日Super Leap Day for mac(跑酷冒险游戏)

Original: https://www.cnblogs.com/aurora-123/p/16731453.htmlAuthor: 佛系女孩Title: 超级跳跃日Super …

人工智能 2023年6月3日
0066
人工智能在脑电情感分类上干了啥?(二)

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月13日
0057
2小时完成的第一个副业单子：Python修正excel表格数据

一、前言大家好，今天我来介绍一下我接的zhenguo老师的第一个Python单子。我完成这个单子前后不到2小时。首先我接到这个单子的想法是处理Excel表，在两个表之间建立联系…

人工智能 2023年7月16日
0060
asp.net+sqlserver教学大纲管理系统C#

1 引言 11.1 课题背景 11.2 本课题研究的意义 11.3 本课题的研究思路和方法 21.4 本文的主要工作 22 开发工具介绍 42.1 .NET介绍 42.2 MICR…

人工智能 2023年6月26日
0061
Halcon 第六章『图像分类Classification』◆第2节：MLP神经网络分类器

一、介绍人工神经网络（Artificial Neural Network，ANN）简称神经网络（Neural Network，NN）或类神经网络，是一种模仿生物神经网络的结构和功…

人工智能 2023年6月16日
0086
Opencv-python——视频帧的读取和重新保存

大家在做传统的图像处理和深度学习时经常用到对视频的处理，这里放上python的opencv库实现的源码，功能是读取视频的每一帧，将每一帧进行操作后重新整合成一个新的视频，供大…

人工智能 2023年6月18日
0084
遗传算法Python代码实现

遗传算法的科学定义遗传算法（Genetic Algorithm, GA）是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最…

人工智能 2023年6月15日
0085
计算机视觉系列（六）——图像增强

系列文章 \text{\bf 系列文章}系列文章计算机视觉系列（一）——CNN基础计算机视觉系列（二）——AlexNet 计算机视觉系列（三）——VGG与NiN 计算机视觉系列…

人工智能 2023年5月26日
0075
今天教你快速查到英语原版书蓝思指数

先介绍一下蓝思指数（Lexile）蓝思分级阅读测评体系可以匹配读者的阅读能力和读物的难度等级，从而辅助教师、家长为孩子选择适合的读物。蓝思阅读测评体系是美国Metametircs…

人工智能 2023年6月1日
00243
最全Python绘制饼形图（饼状图）

饼状图（pie chart）一般用于描述分类型数据的相对频数或百分数频数分布，呈现部分与总体的关系。 ; 一、导入绘图数据首先导入绘图所需的数据。 import os impor…

人工智能 2023年7月15日
0085
什么是零填充操作？它在张量中的应用是什么

什么是零填充操作？在深度学习中，卷积神经网络（Convolutional Neural Network, CNN）通常用于图像处理任务。在CNN中，输入图像通常表示为一个多维数组…

人工智能 2024年1月1日
0047
python怎么写入聚类标签_如何从k均值聚类算法中生成聚类的输出标签？

我的输入特性集是csv文件的形式。我用过 http://scikit-learn.org/stable/auto_examples/cluster/plot_kmeans_silh…

人工智能 2023年6月2日
0068
VScode搭建Opencv（C++开发环境）

VScode配置Opencv * – 一、准备软件 – 二、下载软件 – + 1、MinGw下载 + 2、 Cmake下载 + 3、Openc…

人工智能 2023年7月20日
00111

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Deep embedding network for clustering论文笔记

Deep embedding network for clustering

; 损失函数

Locality-preserving

; Group Sparsity

总损失

大家都在看