热门算法总结 —— AP聚类

2023年6月19日上午10:45 • 人工智能 • 阅读 70

1、算法简介

（1）概述：AP聚类是在2007年的《Clustering by Passing Messages Between Data Points》一文中首次提出的一种新的聚类算法。该算法无需事先定义类数，而是在迭代过程中不断搜索合适的聚类中心，自动从数据点间识别类中心的位置及个数，使所有的数据点到最近的类代表点的相似度之和最大。算法开始时把所有的数据点均视作类中心，通过数据点间的”信息传递”来实现聚类过程。与传统的K-均值算法对初始类中心选择的敏感性相比，AP算法是一种确定性的聚类算法，多次独立运行的聚类结果一般都十分稳定。AP算法是在数据点的相似度矩阵上进行聚类的，聚类的目标是使数据点与其类代表点之间的距离达到最小化。

（2）主要用途：聚类分析。

（3）优缺点

[1] 优点：第一，与众多聚类算法不同，AP聚类不需要指定K(经典的K-Means)或者是其他描述聚类个数(SOM中的网络结构和规模)的参数；第二，一个聚类中最具代表性的点在AP算法中叫做E（Examplar），与其他算法中的聚类中心不同，E是原始数据中确切存在的一个数据点，而不是由多个数据点求平均而得到的聚类中心(K-Means)；第三，多次执行AP聚类算法，得到的结果是完全一样的，即不需要进行随机选取初值步骤；第四，对距离矩阵的对称性没要求。AP通过输入相似度矩阵来启动算法，因此允许数据呈非对称，数据适用范围非常大，且误差平方和低。

[2] 缺点：第一，算法复杂度较高，比而K-Means的复杂度高很多。因此当n比较大时(n>3000)，AP聚类算法往往需要算很久；第二，依赖参考度P的初值。

2、算法流程

3、模拟例子

（1）说明

[1] 数据情况：小明班上30名同学的成绩数据。

[2] 研究目的：将小明班上的同学进行聚类。

（2）分析步骤

[1] 第一步：输入小明班上30名同学的成绩；

[2] 第二步：使用AP聚类对小明班上30名同学的成绩进行聚类分析；

[3] 第三步：输出聚类结果。

（3）结果模拟：模型自动将小明班上30名同学分为了3类，经过数据研究，将第1类命名为学霸组（共6名学生），第2类命名为普通学生组（共17名同学），第3类命名为学渣组（共7名同学）。

——————————————————★

互联网数据分析岗位求职备战手册

Original: https://blog.csdn.net/A_1245/article/details/123576959
Author: 稀饭居然不在家
Title: 热门算法总结 —— AP聚类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/638853/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Xgboost回归四种调参方法及Python简单实现

前言 Xgboost对特征工程和数据处理比较友好，相比之下调参成为用好Xgboost重要的一环，本文分别从参数、调参方法、Python实现的维度进行梳理，作为调参思路的记录。本文…

人工智能 2023年6月13日
0072
ORB-SLAM3笔记（编译、踩坑、论文、看代码）

目前基于orb_slam想做的方向提升动态建图精度（ √东西Map就是上不去 KITTI有几个groundtruth官网下架了找不到而且红外相机退化环境下的点线融合数据集h…

人工智能 2023年6月19日
0058
EISeg——应用于语义分割的自动标注软件

1、基本介绍 EISeg(Efficient Interactive Segmentation)是以RITM及EdgeFlow算法为基础，基于飞桨开发的一个高效智能的交互式分割标注…

人工智能 2023年6月16日
0080
不知道天气咋样？一起用Python爬取天气数据分析告诉你

前言今天我们分享一个小案例，获取天气数据，进行可视化分析，带你直观了解天气情况！一、核心功能设计总体来说，我们需要先对中国天气网中的天气数据进行爬取，保存为csv文件，并将这…

人工智能 2023年7月14日
1087
计算机视觉教程0-3：为何拍照会有死亡视角？详解相机矩阵与畸变

目录 0 拍照的死亡角度 1 透视相机模型 2 相机矩阵 3 镜头畸变 0 拍照的死亡角度拍照死亡角度一般指的是将自己脸盆子拍得特别大，拍出用鼻孔看人的狰狞面目，比如下面这张照片…

人工智能 2023年7月27日
0053
神经辐射场NeRF之Instant-ngp环境搭建与应用

1.环境搭建硬件环境：ubuntu1804，nvidia-470，cuda-11.1，Docker-19.03这里采用的Docker的方式进行搭建，便于移植部署，涉及cuda和d…

人工智能 2023年7月28日
00145
Score-based Generative Model：一统DDPM和SMLD两大生成式模型

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月13日
0074
如何用OpenCV改变图片的大小？

改变图片的大小(resize)是一项很有用的基本技能，它能让图片拥有我们想要的大小。比如在初学阶段，我们在实践时所用的图片的太大，屏幕上显示时观感不好，可以利用这一项技能把图片变小…

人工智能 2023年6月18日
0062
SimCSE：用于句子嵌入的对比学习

目录引言对比学习Contrastive Learning SimCSE思想 * 无监督下的SimCSE 有监督下的SimCSE 连接各向异性Connection to Anis…

人工智能 2023年5月28日
0062
R语言为dataframe添加新的数据列（add new columns）：使用R原生方法、data.table、dplyr等方案

[ 数据_运营作用&意义知错能改，善莫大焉 —错在哪里， _数据分析_告诉你运筹帷幄，决胜千里 —怎么做好”运筹”， _数据分析_告诉你以往…

人工智能 2023年6月15日
0056
Python的数据分析中超参数调优方法：网格搜索

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python的数据分析中超参数调优方法：网格搜索…

人工智能 2023年7月14日
0067
世界各国当日数据探索性分析

2.2 读取世界各国当日数据 import chardet import pandas as pd 查看文&amp…

人工智能 2023年6月16日
0081
CMAKE 编写 FindXXX.cmake

首先为什么要写 FindXXX.cmake 对于一个大型项目，作为一个合格的开发人员来说，特别是C/C++开源人员。会一门编译工具非常重要。在一个大型项目中，使用过Makefile…

人工智能 2023年6月10日
0058
《Python实例》震惊了，用Python这么简单实现了聊天系统的脏话，广告检测

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月15日
0068
Python 人脸识别系统

简介人脸识别不同于人脸检测。在人脸检测中，我们只检测了人脸的位置，在人脸识别任务中，我们识别了人的身份。本文重点介绍使用库 face_recognition 实现人脸识别，该库…

人工智能 2023年6月18日
0070
[Python]-opencv-python模块(cv2)-图片读取和格式转换

python常常用opencv模块来处理图像。 import cv2 as cv 读取图片：imread() 默认按照彩色三通道读取： img = cv2.imread(path)…

人工智能 2023年6月4日
00108

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

热门算法总结 —— AP聚类

大家都在看