无监督学习–聚类算法

2023年6月2日上午8:22 • 人工智能 • 阅读 168

无监督学习–聚类算法

聚类算法是一种无监督学习算法,监督学习指的是我们的训练数据有一系列标签,我们通过假设函数去拟合它,而在无监督学习中，我们的数据不带有任何标签

聚类的定义

将物理或抽象的对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。同一类中的对象之间具有较高的相似度，而不同类中的对象差别较大。

注:相似度是基于描述对象的属性计算的,计算是对对象之间距离进行计算

基于划分的方法–K-means聚类

; 例题

下表 密度和含糖率为西瓜两个属性，按两属性对西瓜聚类

假定 聚类簇数 k= 3，算法开始时随机选取三个样本x_6,x_12,x_24作为初始均值向量，

即：μ1=(0.403;0.237),μ2=(0.343;0.099),μ3=(0.478;0.437).

算法第一步是要进行簇分配

考察样本 x1=(0.697;0.460)，它与当前均值向量μ1,μ2,μ3的距离(欧几里得距离)分别为 0.369, 0.506, 0.166，因此 x1将被划入簇 C3中.

类似的，对数据集中的所有样本考察一遍后，可得当前簇划分为

C1={x3,x5,x6,x7,x8,x9,x10,x13,x14,x17,x18,x19,x20,x23}

C2={x11,x12,x16 }

C3={x_1,x_2,x_4,x_15,x_21,x_22,x_24,x_25,x_26,x_27,x_28,x_29,x_30}

算法第二步移动聚类中心

于是，可从 C1、C2、C3分别求出新的均值向量：

μ1′=(0.473;0.207),μ2′=(0.394;0.066),μ3′=(0.602;0.396)

更新当前均值向量后，不断重复上述过程，如下图所示，第五轮迭代产生的结果与第四轮迭代相同，于是算法停止，得到最终的簇划分。

k-平均法算法分析

复杂度：计算复杂度是 O(nkt)，其中，n是所有对象的数目，k是簇的数目，t是迭代的次数。通常地，k<

Original: https://blog.csdn.net/qq_40691189/article/details/126981204
Author: 在路上的工程师
Title: 无监督学习–聚类算法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/560298/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

北大邹磊：图数据库中的子图匹配算法

导读：本次讲座从图数据库中的核心查询算子——子图匹配入题，介绍了图数据库的基本概念、子图匹配的算法，以及在图数据库环境下的子图匹配查询优化等内容。具体包括下面三个方面：什么是图数…

人工智能 2023年5月27日
0075
机器学习各种小问题

1 机器学习相关安装问题 1.1 pytorch安装慢问题问题描述要安装pytorch包时，因为包源在国外，所以下载很缓慢，甚至出现直接卡死的情况，下面就是快速安装pytorc…

人工智能 2023年5月24日
0053
学生HTML个人网页作业作品：基于HTML实现教育培训机构网站模板毕业源码(8页)

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月28日
0060
引入概念的多文本标签分类：Concept-Based Label Embedding via Dynamic Routing for Hierarchical Text Classification

Zhang, Jiong, Wei-Cheng Chang, Hsiang-Fu Yu, and Inderjit Dhillon. “Fast Multi-Resol…

人工智能 2023年7月2日
0088
基于TensorFlow2.x卷积神经网络的智能小车寻迹

概述在写OpenCV+TensorFlow简单的机器小车传统视觉寻迹之时，可以预见的是，由于环境因素，传统小车寻迹的效果可能会受到环境因素的影响，例如地上的污渍在进行二值化时就有…

人工智能 2023年5月26日
0095
ML class Note——回归

Step1:Models ; Step2:Goodness of Function 如何寻找最优的Function ——利用 Loss function L： Input: a f…

人工智能 2023年6月17日
0099
深度学习之图像分类（十一）–MobileNetV2 网络结构

深度学习之图像分类（十一）MobileNetV2 网络结构目录 * – 深度学习之图像分类（十一）MobileNetV2 网络结构 – + 1. 前言 +…

人工智能 2023年6月24日
00201
YOLOv4训练自定义数据集

目录 * – + 一. darknet + 1.环境配置 + 2.权重下载 + 3.数据集处理 + 4.修改配置文件 + * 4.1 修改data/voc.names …

人工智能 2023年7月9日
0051
基于python利用statsmodels实现一元线性回归、高阶回归以及自变量为分类变量的回归（逐行代码解读，超细节）

一元线性回归 #导入要用的包，没有下载包的要用pip install安装对应的包 import numpy as np import matplotlib.pyplot as pl…

人工智能 2023年7月1日
0085
【附源码】Python计算机毕业设计三亚技师学院远程作业提交系统

项目运行环境配置：Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+Navicat11+Django+nodejs。 …

人工智能 2023年6月27日
0049
全站最详细OpenCV AI开发套件OAK（OpenCV AI Kit）介绍

消息快播：OpenCV众筹了一款ROS2机器人rae，开源、功能强、上手简单。来瞅瞅~ 编辑：OAK中国来源：oakchina.cn内容可能会不定期更新，最新内容请参考源地址。前…

人工智能 2023年7月18日
00186
fine-tuning（微调）的理解

fine-tuning 介绍 * 什么情况下使用微调微调指导事项不同数据集下使用微调涉及到的其他知识 * 学习率（learning-rate）卷积神经网络的核心迁移学习与…

人工智能 2023年5月26日
0078
docker学习笔记

文章目录一基本概念二安装三使用 * 架构配置镜像加速器服务命令镜像命令 – 查看镜像搜索镜像下载镜像删除镜像容器命令 – 创建容器…

人工智能 2023年6月30日
00119
MMDetection（三）：公开数据集上测试和训练模型

MMDetection（三）：公开数据集上测试和训练模型 1. 准备数据集 2. 测试数据集 * 2.1 举例 2.2 网络摄像头演示 2.3 测试图像和视频的同步接口 3. 训练…

人工智能 2023年7月9日
00111
机器学习-knn(k近邻)算法原理及实现

前言经典的knn了解一下。 1.算法思路 1.1算法基本思想 knn的基本思想:需要确定一个样本A的类别，可以计算出它与所有训练样本的距离，然后找出和该样本距离最小的k个样本，对…

人工智能 2023年7月2日
0061
应用freetype-py进行汉字图形化处理

一、环境准备1.相关资源官网官网文档示例程序后面的代码都基于这个官方示例，就不贴完整代码了，学习不能只copy2.环境安装我自己是win7 + Anaconda3，直接pip…

人工智能 2023年6月21日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

无监督学习–聚类算法

无监督学习–聚类算法

基于划分的方法–K-means聚类

; 例题

k-平均法算法分析

大家都在看