使用PyMetis实现聚类融合算法

2023年6月20日上午12:06 • 人工智能 • 阅读 55

最近因为看文献看到了聚类融合技术，所以这里做一个简单的整理。

1. 聚类融合简介

任何聚类算法都对数据集本身对有一定的预先假设。根据”No Free Lunch” 理论，如果数据集本身的分布并不符合预先的假设，则算法的结果将毫无意义，甚至可以说该结果只是给出了一个错误的分布，或者给数据集强加了一个虚构的分布。因此，面对特定的应用问题，如何选择合适的聚类算法是聚类分析研究中的一个重要课题。
聚类融合将不同算法或者同一算法下使用不同参数得到的结果进行合并，从而得到比单一算法更为优越的结果。
在聚类融合中，先要产生数据集的多个聚类成员，然后对这些聚类成员的聚类结果采用共识函数进行合并。

1.1 聚类成员的产生

随机选择不同的初始点，运行多次k-means算法，从而产生所需要的聚类成员。优点：算法的复杂度低，运行方便等。但是对于分布非球形的数据以及处理高维数据是，该方法的效果并不理想。
使用随机抽样的方法产生数据子集，然后对每个数据子集使用k-means算法生成聚类，从而得到聚类成员。
“弱”聚类组成的聚类成员实现的聚类融合方法。弱聚类的产生方法：(1):将多维数据随机投影到一维空间，（2): 用一组随机的超平面将数据空间切割。然后用k-means算法分别对得到的子空间数据进行聚类，组成聚类成员。
使用随机投影将高维数据投影到低维空间，通过多次投影得到若干个数据子集，然后用EM聚类算法对每次的投影子集聚类，从而得到聚类成员。
综上：通过选择不同的算法，对一个算法选择不同的初始值、选择不同的对象子集、选择不同的特征子集投影到数据子空间等来产生聚类成员。

1.2 共识函数设计

Co-Association矩阵：用于衡量数据点之间的相似度，其中第i个点和第j个数据点之间的相似度为：a_ij=(i与j同属一聚类的次数)/(聚类算法总次数) co_association矩阵中大于0.5的点即认为属于最终聚类结果中的同一类。
基于超图的方法：CPSA、HGPA、MCLA
CPSA: 首先得到聚类成员的co-association值，然后用基于图论的聚类算法METIS算法进行聚类，得到最终的聚类成果.

2. Python实现

from sklearn.datasets import load_iris
import pandas as pd
from sklearn.cluster import KMeans
import numpy as np
import pymetis

X,y=load_iris(return_X_y=True)
X=pd.DataFrame(X)
X_result=[]

for k in [2,3,4,5,6]:
    kmeans=KMeans(n_clusters=k,random_state=0).fit(X)
    X_result.append(kmeans.labels_)

X_result=pd.DataFrame(X_result)
X_result=X_result.T
matrix=[]

for i in range(X_result.shape[0]):
    tmp=X_result.drop(i)
    tmp=(tmp==X_result.iloc[i,:]).sum(axis=1)
    matrix.append(tmp[tmp>=3].index)

n_cuts, membership = pymetis.part_graph(3, adjacency=matrix)

nodes_part_0 = np.argwhere(np.array(membership) == 0).ravel()
nodes_part_1 = np.argwhere(np.array(membership) == 1).ravel()
nodes_part_2 = np.argwhere(np.array(membership) == 2).ravel()

Original: https://blog.csdn.net/yeshang_lady/article/details/123846552
Author: Sun_Sherry
Title: 使用PyMetis实现聚类融合算法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/640370/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

AI大视觉（十八） | Yolo v5的改进思想

本文来自公众号”AI大道理”。这里既有AI，又有生活大道理，无数渺小的思考填满了一生。 Yolo v5一共有四个模型，分别为Yolov5s、Yolov…

人工智能 2023年6月23日
00682
【python】程序员最浪漫的表白方式，将情书写在她的照片里

前言大家早好、午好、晚好吖~ 这不光棍节快到了，表弟准备写一封情书给他的女神，想在光棍节之前脱单。为了提高成功率，于是跑来找我给他参谋参谋，本来我是不想理他的。不过谁让他是我…

人工智能 2023年7月6日
0070
python多条件判断筛选数据_Python实现多条件筛选目标数据功能【测试可用】

本文实例讲述了Python实现多条件筛选目标数据功能。分享给大家供大家参考，具体如下： python中提供了一些数据过滤功能，可以使用内建函数，也可以使用循环语句来判断，或者使用p…

人工智能 2023年7月8日
00136
knn算法，利用numpy简单实现

首先明确概念：回归：预测体重、预测房价、预测损失。结果是不容易确定的。分类：预测男女、预测是否能通过考试结果是容易确定的。我的理解：回归针对连续的数据、分类针对离散的数据。…

人工智能 2023年6月17日
0088
pip install tensorflow 失败（win10-64环境+Python3.7）

问题一：pip install tensorflow 报错如图，Error：异常，上网查了下，解决过程如下：升级最新的pip： pip install –upgra…

人工智能 2023年5月25日
00135
Autoware1.14安装calibration_toolkit相机激光雷达联合标定工具箱，安装及问题解决

默认是不带calibration_toolkit的，需要自行安装。拉取calibration_toolkit项目：git clone https://github.com/Xidi…

人工智能 2023年6月10日
00130
深度学习—三好学生各成绩所占权重问题（3）

🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🥰 博客首页：knighthood2001😗 欢迎点赞👍评论🗨️❤️ 热爱python，期待与大家一同进步成长！！❤️ 之前，我们从三好学生成绩问题开始，设…

人工智能 2023年7月28日
0068
Hough 变换检测圆—-Matlab实现（以虹膜检测为例）

一、hough变换的原理：圆方程（1）xy空间一个圆对应三维参数空间一个点（a,b,r)（2）xy空间圆上一个点(x,y)对应参数空间一条曲线（3）xy空间圆上n个点对应参数空…

人工智能 2023年6月17日
00111
如何看懂2021 Gartner 新兴技术和趋势影响雷达

每年Gartner都会对当前热点趋势进行追踪，并且探究其背后所依赖的技术，并通过将未来发展趋势与新兴技术作结合，将新兴技术划分成了三个雷达象限：界面和体验：从根本上改变我们与世界…

人工智能 2023年5月31日
0089
OpenCvSharp (C# OpenCV) 用鼠标在图像窗口绘图SetMouseCallback响应鼠标事件(附源码)

点击下方卡片，关注” OpenCV与AI深度学习“公众号！视觉/图像重磅干货，第一时间送达! 前言 Python和C++版本的OpenCV中都封装了滑动…

人工智能 2023年7月19日
0067
实战 | OpenCV实现多角度模板匹配(详细步骤 + 源码)

点击下方卡片，关注” OpenCV与AI深度学习“ 视觉/图像重磅干货，第一时间送达! 本文将介绍使用OpenCV实现多角度模板匹配的详细步骤 + 代码。…

人工智能 2023年5月26日
0077
数学建模学习（67）：XGBoost分类模型详细入门案例教程

一、案例介绍本案例对葡萄酒类进行分类，使用XGBoost模型实现，该数据来源：酒类。数据集信息：这些数据是对意大利同一地区种植但来自三种不同品种的葡萄酒进行化学分析的结果。该分…

人工智能 2023年7月1日
0098
什么是模型在AI算法中的作用

问题介绍在AI算法中，模型是一个非常重要的概念和工具。模型可以通过学习训练数据中的模式和规律，使得算法能够在未知数据上做出预测或者分类。本文将详细介绍模型在AI算法中的作用，并提…

人工智能 2024年1月4日
0061
独热(One-Hot)编码简述

目录 1.前言 2.什么是 one-hot 编码？ 3.Python 代码 1.前言今天看Colab上的代码的时候突然看到了这个概念，抱着好奇的心态学习了一下，挺基础也很重要的一…

人工智能 2023年6月13日
00122
对齐工具MFA

MFA（Montreal Forced Aligner）是一种forced alignment工具。MFA底层是使用了kaldi工具，相对于其它的工具MFA使用triphone a…

人工智能 2023年5月25日
00159
【Python】数据分析：pd.pivot_table

很久没有写数据处理的相关啦。今天正好遇到这个相关问题，用到是数据透视表，所以过来做个笔记，也复习一下啦。 import pandas as pd df = pd.DataFrame…

人工智能 2023年7月7日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

使用PyMetis实现聚类融合算法

1. 聚类融合简介

1.1 聚类成员的产生

1.2 共识函数设计

2. Python实现

大家都在看