1.聚类简介
在”无监督学习”中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是”聚类”。
聚类将数据集中的样本划分为若干个通常不相交的子集,每个子集称为一个”簇”(类别)。聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名。
形式化表达如下:
假定样本集
包含m个无标记的样本,每个样本是一个n维特征向量,则聚类算法将样本集D划分为k个不相交的簇,其中且Original: https://blog.csdn.net/Vicky_xiduoduo/article/details/126235309
Author: Vicky_xiduoduo
Title: 机器学习算法——聚类1(性能度量——外部指标Jaccard系统,FM指数,Rand指数;内部指标:DB指数,Dunn指数)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/550954/
转载文章受原作者版权保护。转载请注明原作者出处!