机器学习 – 聚类基于网格的聚类算法（学习笔记）

2023年5月31日上午7:25 • 人工智能 • 阅读 65

Grid-based methods：其原理是将数据空间划分为网格单元，将数据对象映射到网格单元中，并计算每个单元的密度。根据预设阈值来判断每个网格单元是不是高密度单元，由邻近的稠密单元组成”类”。

1.将数据空间划分为网格单元
2.依照设置的阈值，判定网格单元是否稠密
3.合并相邻稠密的网格单元为一类

优点：执行效率高，因为其速度与数据对象的个数无关，而只依赖于数据空间中每个维上单元的个数。

缺点：对参数敏感、无法处理不规则分布的数据、维数灾难等。

鉴于基于划分和层次聚类方法都无法发现非凸面形状的簇，真正能有效发现任意形状簇的算法是基于密度的算法，但基于密度的算法一般时间复杂度较高，1996年到2000年间，研究数据挖掘的学者们提出了大量基于网格的聚类算法，网格方法可以有效减少算法的计算复杂度，且同样对密度参数敏感。

典型算法：

STING（Statistical Information Grid ）：基于网格多分辨率，将空间划分为方形单元，对应不同分辨率

CLIQUE（Clustering In Quest）：结合网格和密度聚类的思想，子空间聚类处理大规模高维度数据

WaveCluster：用小波分析使簇的边界变得更加清晰

补充：Model-based methods：主要是指基于概率模型的方法和基于神经网络模型的方法，尤其以基于概率模型的方法居多。这里的概率模型主要指概率生成模型（generative Model），同一”类”的数据属于同一种概率分布。这中方法的优点就是对”类”的划分不那么坚硬，而是以概率形式表现，每一类的特征也可以用参数来表达；但缺点就是 执行效率不高，特别是分布数量很多并且数据量很少的时候。其中最典型、也最常用的方法就是高斯混合模型（GMM，Gaussian Mixture Models）。基于神经网络模型的方法主要就是指SOM（Self Organized Maps）了，

Original: https://blog.csdn.net/m0_65392155/article/details/123017914
Author: corina_qin
Title: 机器学习 – 聚类基于网格的聚类算法（学习笔记）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/549744/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

1046 Shortest Distance

The task is really simple: given N exits on a highway which forms a simple cycle, you are …

人工智能 2023年6月30日
0066
只要5秒就能“克隆”本人语音！美玉学姐不再查寝，而是吃起了桃桃丨开源

博雯萧箫发自凹非寺量子位报道 | 公众号 QbitAI 现在，AI已经能克隆任意人的声音了！比如，前一秒的美玉学姐还在宿舍查寝：后一秒就打算吃个桃桃：简直就是鬼畜区…

人工智能 2023年7月28日
0063
chatGPT代码写的有点好啊，程序员要失业了？

最近，这个聊天机器人有点火啊，是OpenAI推出的chatGPT，它能够回答各种各样的问题，还能生成代码，修复bug。 ChatGPT 是一个基于对话的原型 AI 聊天机器人，12…

人工智能 2023年7月31日
0040
ReInceptionE: Relation-Aware Inception Network with Joint Local-Global Structural Information

研究问题提出一种关系敏感且能充分利用局部和全局结构信息的嵌入模型背景动机 ConvE模型的交互数受限，且没有充分考虑结构信息，论文使用Inception卷积网络以增强交互 KB…

人工智能 2023年6月1日
0057
Pandas 五：怎样新增数据列

在进行数据分析时，经常需要按照一定条件创建新的数据列，然后进行进一步分析。1.直接赋值2.df.apply方法3.df.assign方法4.按条件选择分组分别赋值1 import …

人工智能 2023年7月7日
0070
目标追踪—-卡尔曼滤波算法

卡尔曼滤波是什么：只要存在不确定信息的动态系统，卡尔曼滤波就可以对系统下一步要做什么做出有根据的推测。即便有噪声信息干扰，卡尔曼滤波通常也能很好的找出现象间不易察觉的相关性。优点…

人工智能 2023年6月25日
0072
深度学习之BP神经网络

前言 bp神经网络是模拟人体中神经元结构而设计出来的: 神经元大致可以分为树突、突触、细胞体和轴突。树突为神经元的输入通道，其功能是将其它神经元的动作电位传递至细胞体。其它神经元的…

人工智能 2023年6月24日
0079
linux嵌入式 espeak的移植和注意事项

1.移植portaudio_v18_1 配置： ./configure CC=arm-linux-gnueabihf-gcc RANLIB=arm-linux-gnueabihf-…

人工智能 2023年5月27日
0048
目标检测NMS非极大值抑制及改进

非极大值抑制问题，解决同一个物体有多于一个候选框输出的问题。NMS用于过滤掉重叠的候选框。（1）算法输入：包含各框的位置坐标，以及置信度得分（2）算法步骤：设定IOU阈值，比如0….

人工智能 2023年7月10日
0085
数学建模：评价性模型学习——灰色关联分析法（GRA模型）

目录前言一、灰色关联分析 1.什么是灰色关联分析？ 2.流程介绍二、综合评价 1.数据无量纲化处理 2.确定参考序列 3.确定权重 4.计算灰色关联系数 5.计算灰色加权关联…

人工智能 2023年7月16日
0059
多元线性回归算法预测房价

目录一、前言（一）多元线性回归模型（二）表达式和计算模型二、EXCEL求解回归方程三、用机器学习库Sklearn库重做上面的多元线性回归。四、参考文章一、前言（一）…

人工智能 2023年6月17日
00102
网上商城项目（购物车下单、支付）

目录一、购物车结算前端功能实现 1.购物车页面实现结算功能，主要是拿到传入后台的gids 二、购物车结算后端功能实现 1.跳转订单页后台，主要是拿到订单页展示数据 2.订单页前台…

人工智能 2023年6月29日
0060
利用python在剪贴板上读取/写入数据

读取剪贴板上的数据先给大家介绍 pandas.read_clipboard，从剪贴板读取文本并传递到Read_csv。 pandas.read_clipboard(sep=’\\…

人工智能 2023年6月19日
0076
PaddleClas–部署并训练自定义数据集

https://github.com/PaddlePaddle/PaddleClas (尝鲜版)分类模型 PaddleClas 图像分类基础知识训练集（train dataset…

人工智能 2023年5月28日
00106
R语言实战应用精讲50篇（二十五）-时空数据统计模型：确定性预测模型

本章的主要目的是详细讨论时空统计建模的三个目标：在给定时空数据的空间新位置进行预测用时空数据进行参数推断预测未来的新值我们还强调了在我们的预测、参数估计和预测中量化不确定…

人工智能 2023年6月17日
0063
图像基本处理(灰度化)

项目场景：今天我们开始最基础的图像处理，将一张图片进行灰度化处理。我们将使用OpenCV来进行图像的处理基础知识图片主要包含以下内容：1.像素，也就是我们通常说的RGB模型，…

人工智能 2023年7月4日
0070

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

机器学习 – 聚类 基于网格的聚类算法（学习笔记）

大家都在看

机器学习 – 聚类基于网格的聚类算法（学习笔记）