DBSCAN聚类学习-matlab代码撰写-2022-08-10

2023年6月2日上午7:26 • 人工智能 • 阅读 106

对于dbscan的学习，来自于以下的博主，非常的感谢

所以，博主再这里不阐述dbscan的原理了，直接上代码，所有注释都有，可以直接吃和改进：

1 dbscan在matlab中的实现

% dbscan&#x5B66;&#x4E60;
% &#x6A21;&#x62DF;&#x6570;&#x636E;
clc
clear
rng('default') % For reproducibility

% Parameters for data generation
N = 300;  % Size of each cluster
r1 = 0.5; % Radius of first circle
r2 = 5;   % Radius of second circle
theta = linspace(0,2*pi,N)';

X1 = r1*[cos(theta),sin(theta)]+ rand(N,1);
X2 = r2*[cos(theta),sin(theta)]+ rand(N,1);
data = [X1;X2]; % Noisy 2-D circular data set
scatter(data(:,1),data(:,2))
title('&#x805A;&#x7C7B;&#x4E4B;&#x524D;')

% &#x8BBE;&#x7F6E;&#x53C2;&#x6570;&#xFF0C;esp&#x4E3A;&#x9886;&#x57DF;&#x5927;&#x5C0F;&#xFF0C;minpt&#x4E3A;&#x6700;&#x5C0F;&#x6570;&#x91CF;&#x70B9;
esp = 1;
minpt = 5;

% &#x8BA1;&#x7B97;&#x70B9;&#x4E0E;&#x70B9;&#x4E4B;&#x95F4;&#x7684;&#x8DDD;&#x79BB;,&#x4E09;&#x7EF4;&#x70B9;&#x540C;&#x6837;&#x9002;&#x7528;
% pdist2(a,b)&#xFF0C;&#x8BA1;&#x7B97;a&#x4E2D;&#x7684;&#x70B9;&#x5230;b&#x4E2D;&#x7684;&#x70B9;&#x7684;&#x8DDD;&#x79BB;
% &#x7B2C;&#x4E00;&#x884C;&#x4E3A;a&#x4E2D;&#x7B2C;&#x4E00;&#x4E2A;&#x70B9;&#x5230;b&#x4E2D;&#x6240;&#x6709;&#x70B9;&#x7684;&#x8DDD;&#x79BB;
% d = pdist2(data,data);
% Rgion = find(d(1,:)<=esp); 0 % rangesearch功能为搜索esp内的所有点 d="rangesearch(data,data,esp);" 计算数据的大小 [n,m]="size(data);" 设置访问标记 vist="zeros(n,1);" 设置聚类组 idx="zeros(n,1);" 设置聚类标签 lab="0;" 循环整个点组 for i="1:n" 是否第i个点已经被访问过，如果被访问过，就下一个点 如果没有被访问过，则继续处理 if vist(i,:)="=" 访问设置为1，没被访问为0 提取集合 neig="d{i};" 判断是否满足阈值条件，即是否可以聚类 numel(neig)>=minpt
            % &#x5982;&#x679C;&#x5BC6;&#x5EA6;&#x53EF;&#x4EE5;&#x805A;&#x7C7B;&#xFF0C;&#x521B;&#x5EFA;&#x7C7B;&#x7684;&#x6807;&#x7B7E;
            lab = lab+1;
            % &#x4E3A;&#x5F53;&#x524D;&#x70B9;&#x5F52;&#x7C7B;
            idx(i,:) = lab;
            % &#x8BBE;&#x7F6E;&#x5FAA;&#x73AF;&#x6307;&#x9488;
            k = 1;

            % &#x8FDB;&#x884C;&#x5BC6;&#x5EA6;&#x53EF;&#x8FBE;&#x5BFB;&#x627E;
            while neig
                % &#x5BFB;&#x627E;d&#x96C6;&#x5408;&#x4E2D;&#x7B2C;i&#x4E2A;&#x70B9;&#x7684;esp&#x90BB;&#x57DF;&#x7684;&#x7B2C;k&#x4E2A;&#x70B9;
                j = neig(k);

                % &#x5224;&#x65AD;&#x5F53;&#x524D;&#x70B9;&#x662F;&#x5426;&#x88AB;&#x8BBF;&#x95EE;&#x8FC7;
                if  vist(j,:) == 0
                    % &#x5982;&#x679C;&#x6CA1;&#x88AB;&#x8BBF;&#x95EE;&#xFF0C;&#x5219;&#x8BBE;&#x7F6E;&#x4E3A;1&#xFF0C;&#x5373;&#x8BBF;&#x95EE;&#x8FC7;
                    vist(j,:) = 1;
                    % &#x63D0;&#x53D6;&#x65B0;&#x7684;&#x96C6;&#x5408;
                    neig2 = d{j};

                    % &#x5224;&#x65AD;&#x5F53;&#x524D;&#x70B9;&#x7684;&#x9886;&#x57DF;&#x70B9;&#x6570;&#x91CF;&#x662F;&#x5426;&#x6EE1;&#x8DB3;&#x6761;&#x4EF6;
                    if numel(neig2)>=minpt
                        % &#x6EE1;&#x8DB3;&#x6761;&#x4EF6;&#xFF0C;&#x5373;&#x5C06;&#x5F53;&#x524D;&#x70B9;&#x7684;&#x6240;&#x6709;&#x90BB;&#x57DF;&#x70B9;&#x7EB3;&#x5165;&#x7B2C;i&#x70B9;&#x96C6;&#x5408;
                        neig = [neig,neig2];
                        neig = unique(neig);
                    end
                else
                    neig(k) =[];
                end

                % &#x5982;&#x679C;&#x7B2C;j&#x4E2A;&#x70B9;&#x6CA1;&#x6709;&#x4ECE;&#x5C5E;&#x7C7B;&#xFF0C;&#x5219;&#x5F52;&#x7C7B;
                if idx(j,:) == 0
                    idx(j) = lab;
                end

                % &#x6307;&#x9488;&#x5F80;&#x524D;&#xFF0C;&#x5982;&#x679C;&#x6307;&#x9488;&#x7684;&#x503C;&#x5927;&#x4E8E;neig&#x96C6;&#x5408;&#x7684;&#x70B9;&#x7684;&#x4E2A;&#x6570;
                % &#x8BF4;&#x660E;&#x6CA1;&#x6709;&#x5BC6;&#x5EA6;&#x53EF;&#x8FBE;&#x7684;&#x70B9;&#xFF0C;&#x5219;&#x7ED3;&#x675F;&#x5FAA;&#x73AF;
                % k = k+1;
                % if k > numel(neig)
                %   break
                % end
            end

        end

    end
end

gscatter(data(:,1),data(:,2),idx);
title('&#x805A;&#x7C7B;&#x4E4B;&#x540E;')
</=esp);>

结果如下：

自写得dbscan运行很慢，比起matlab自带得功能，慢上十倍，2w数量的点云分割，需要1分钟。

不知道问题出在哪里，已经看了很多博主写的代码了，仍然没有解决，痛苦。

2 matlab自带dbscan的功能

matlab2019b自带dbscan函数，应用如下：

<a href="https://localhost:31515/static/help/stats/dbscan.html?searchHighlight=dbscan&searchResultIndex=1#d117e261580" title="idx = dbscan(X,epsilon,minpts)">idx = dbscan(X,epsilon,minpts)</a> <a href="https://localhost:31515/static/help/stats/dbscan.html?searchHighlight=dbscan&searchResultIndex=1#d117e261632" title="idx = dbscan(X,epsilon,minpts,Name,Value)">idx = dbscan(X,epsilon,minpts,Name,Value)</a> <a href="https://localhost:31515/static/help/stats/dbscan.html?searchHighlight=dbscan&searchResultIndex=1#d117e261664" title="idx = dbscan(D,epsilon,minpts,'Distance','precomputed')">idx = dbscan(D,epsilon,minpts,'Distance','precomputed')</a> <a href="https://localhost:31515/static/help/stats/dbscan.html?searchHighlight=dbscan&searchResultIndex=1#d117e261712" title="[idx,corepts] = dbscan(___)">[idx,corepts] = dbscan(___)</a>

clc
clear
rng('default') % For reproducibility

% Parameters for data generation
N = 300;  % Size of each cluster
r1 = 0.5; % Radius of first circle
r2 = 5;   % Radius of second circle
theta = linspace(0,2*pi,N)';

X1 = r1*[cos(theta),sin(theta)]+ rand(N,1);
X2 = r2*[cos(theta),sin(theta)]+ rand(N,1);
data = [X1;X2]; % Noisy 2-D circular data set
scatter(data(:,1),data(:,2))
title('&#x805A;&#x7C7B;&#x4E4B;&#x524D;')
axis on

idx = dbscan(data,1,5);
gscatter(data(:,1),data(:,2),idx);
title('&#x805A;&#x7C7B;&#x4E4B;&#x540E;')

结果如下：

效果的差异不明显

此外博主写的k均值和欧式距离聚类如下：

Kmean（k均值聚类）学习-2022-08-09_~追风筝的猫的博客-CSDN博客

Matlab点云欧式距离聚类-2021-12-06_~追风筝的猫的博客-CSDN博客_matlab 欧式聚类

点云-均值漂移-均适用_点云均值漂移-数据集文档类资源-CSDN下载

3、 8月11更新，dbscan代码小优化，运行速度提升

借鉴于以下博主：

DBSCAN的理解和matlab实现_尼古拉斯.贝叶斯基的博客-CSDN博客_dbscan matlab

修改了密度可达的集合合并，比之前的运行速度快了十倍，但是比起matlab自带的函数还是慢着很多很多，不过已经很好了，感觉基本得到了解决。不列结果了，基本一样

clc
clear
rng('default') % For reproducibility

% Parameters for data generation
N = 300;  % Size of each cluster
r1 = 0.5; % Radius of first circle
r2 = 5;   % Radius of second circle
theta = linspace(0,2*pi,N)';

X1 = r1*[cos(theta),sin(theta)]+ rand(N,1);
X2 = r2*[cos(theta),sin(theta)]+ rand(N,1);
data = [X1;X2]; % Noisy 2-D circular data set
scatter(data(:,1),data(:,2))

% clear
% clc
% % &#x6A21;&#x62DF;&#x6570;&#x636E;
% [X,Y,Z] = sphere(100);
% loc1 = [X(:),Y(:),Z(:)];
% loc2 = 2*loc1;
% ptCloud = pointCloud([loc1;loc2]);
% pcshow(ptCloud)
% title('Point Cloud')
% data = ptCloud.Location;

tic
% &#x8BBE;&#x7F6E;&#x53C2;&#x6570;&#xFF0C;esp&#x4E3A;&#x9886;&#x57DF;&#x5927;&#x5C0F;&#xFF0C;minpt&#x4E3A;&#x6700;&#x5C0F;&#x6570;&#x91CF;&#x70B9;
esp = 1;
minpt = 5;

% &#x8BA1;&#x7B97;&#x70B9;&#x4E0E;&#x70B9;&#x4E4B;&#x95F4;&#x7684;&#x8DDD;&#x79BB;,&#x4E09;&#x7EF4;&#x70B9;&#x540C;&#x6837;&#x9002;&#x7528;
% pdist2(a,b)&#xFF0C;&#x8BA1;&#x7B97;a&#x4E2D;&#x7684;&#x70B9;&#x5230;b&#x4E2D;&#x7684;&#x70B9;&#x7684;&#x8DDD;&#x79BB;
% &#x7B2C;&#x4E00;&#x884C;&#x4E3A;a&#x4E2D;&#x7B2C;&#x4E00;&#x4E2A;&#x70B9;&#x5230;b&#x4E2D;&#x6240;&#x6709;&#x70B9;&#x7684;&#x8DDD;&#x79BB;
% d = pdist2(data,data);
% Rgion = find(d(1,:)<=esp); 0 % rangesearch功能为搜索esp内的所有点 d="rangesearch(data,data,esp);" 计算数据的大小 [n,m]="size(data);" 设置访问标记 vist="zeros(n,1);" 设置聚类组 idx="zeros(n,1);" 设置聚类标签 lab="0;" 循环整个点组 for i="1:n" 是否第i个点已经被访问过，如果被访问过，就下一个点 如果没有被访问过，则继续处理 if vist(i,:)="=" 访问设置为1，没被访问为0 提取集合 neig="d{i};" 判断是否满足阈值条件，即是否可以聚类 numel(neig)>=minpt
            % &#x5982;&#x679C;&#x5BC6;&#x5EA6;&#x53EF;&#x4EE5;&#x805A;&#x7C7B;&#xFF0C;&#x521B;&#x5EFA;&#x7C7B;&#x7684;&#x6807;&#x7B7E;
            lab = lab+1;
            % &#x4E3A;&#x5F53;&#x524D;&#x70B9;&#x5F52;&#x7C7B;
            idx(i,:) = lab;
            % &#x8BBE;&#x7F6E;&#x5FAA;&#x73AF;&#x6307;&#x9488;
            k = 1;

            % &#x8FDB;&#x884C;&#x5BC6;&#x5EA6;&#x53EF;&#x8FBE;&#x5BFB;&#x627E;
            while true
                % &#x5BFB;&#x627E;d&#x96C6;&#x5408;&#x4E2D;&#x7B2C;i&#x4E2A;&#x70B9;&#x7684;esp&#x90BB;&#x57DF;&#x7684;&#x7B2C;k&#x4E2A;&#x70B9;
                j = neig(k);

                % &#x5224;&#x65AD;&#x5F53;&#x524D;&#x70B9;&#x662F;&#x5426;&#x88AB;&#x8BBF;&#x95EE;&#x8FC7;
                if  vist(j,:) == 0
                    % &#x5982;&#x679C;&#x6CA1;&#x88AB;&#x8BBF;&#x95EE;&#xFF0C;&#x5219;&#x8BBE;&#x7F6E;&#x4E3A;1&#xFF0C;&#x5373;&#x8BBF;&#x95EE;&#x8FC7;
                    vist(j,:) = 1;
                    % &#x63D0;&#x53D6;&#x65B0;&#x7684;&#x96C6;&#x5408;
                    neig2 = d{j};

                    % &#x5224;&#x65AD;&#x5F53;&#x524D;&#x70B9;&#x7684;&#x9886;&#x57DF;&#x70B9;&#x6570;&#x91CF;&#x662F;&#x5426;&#x6EE1;&#x8DB3;&#x6761;&#x4EF6;
                    if numel(neig2)>=minpt
                        % &#x6EE1;&#x8DB3;&#x6761;&#x4EF6;&#xFF0C;&#x5373;&#x5C06;&#x5F53;&#x524D;&#x70B9;&#x7684;&#x6240;&#x6709;&#x90BB;&#x57DF;&#x70B9;&#x7EB3;&#x5165;&#x7B2C;i&#x70B9;&#x96C6;&#x5408;
                        neig2 = setdiff(neig2,neig);
                        neig = [neig,neig2];
                    end
              % else
                   % neig(k) =[];
                end

                % &#x5982;&#x679C;&#x7B2C;j&#x4E2A;&#x70B9;&#x6CA1;&#x6709;&#x4ECE;&#x5C5E;&#x7C7B;&#xFF0C;&#x5219;&#x5F52;&#x7C7B;
                if idx(j,:) == 0
                    idx(j) = lab;
                end

                % &#x6307;&#x9488;&#x5F80;&#x524D;&#xFF0C;&#x5982;&#x679C;&#x6307;&#x9488;&#x7684;&#x503C;&#x5927;&#x4E8E;neig&#x96C6;&#x5408;&#x7684;&#x70B9;&#x7684;&#x4E2A;&#x6570;
                % &#x8BF4;&#x660E;&#x6CA1;&#x6709;&#x5BC6;&#x5EA6;&#x53EF;&#x8FBE;&#x7684;&#x70B9;&#xFF0C;&#x5219;&#x7ED3;&#x675F;&#x5FAA;&#x73AF;
                k = k+1;
                if k > numel(neig)
                  break
                end
            end

        end

    end
end

toc

% pcshow(data,idx)
gscatter(data(:,1),data(:,2),idx);
</=esp);>

Original: https://blog.csdn.net/qq_39632121/article/details/126261935
Author: ~追风筝的猫
Title: DBSCAN聚类学习-matlab代码撰写-2022-08-10

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/560222/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

人工智能——大白话熟悉目标检测基本流程

👦👦一个帅气的boy，你可以叫我Love And Program🖱 ⌨个人主页：Love And Program的个人主页💖💖如果对你有帮助的话希望三连💨💨支持一下博主大白话熟悉…

人工智能 2023年7月26日
0075
OpenCV项目实战——使用Tesseract进行文本检测（非完全）

使用Tesseract进行文本检测 1. 下载、安装和配置Tesseract 我是直接根据该教程完成的配置，大家也可以看看进行参考：Tesseract安装和配置 win10进入环境…

人工智能 2023年7月19日
0061
基于MATLAB的车道线识别、自动驾驶识别

使用单目相机的视觉感知这个例子展示了如何构建一个能够进行车道边界和车辆检测的单眼摄像机传感器仿真。该传感器将在车辆坐标系中报告这些检测结果。在本例中，您将了解自动驾驶工具箱™使用…

人工智能 2023年6月17日
0077
在go中使用opencv

在go中使用opencv还是比较麻烦的，如果使用的是 mac 或 linux 还好，在windows下就比较痛苦。 GoCV 包提供了对 opencv 4.5.4 的支持，官方提供…

人工智能 2023年5月28日
00113
04 导师不敢和你说的水论文隐藏技巧，论文模型需不需要继承

江西周公子周公子的”苟利国家生死以，家庭传承吾辈责” 1：31 一定要代码白痴代码新手没有代码，又没有继承，你啥也不是有一个好的继承，我啥都有了，…

人工智能 2023年6月4日
0066
ICLR‘23论文得分排名! 多篇论文竟同时获1分和10分?

人工智能领域综合顶级会议ICLR2023（ International Conference on Learning Representations）审稿意见已出炉。ICLR的审稿…

人工智能 2023年6月30日
0083
双系统ubuntu18+melodic+zed双目相机运行orbslam2

最近为实现ORB-SLAM2算法，在电脑上安装了双系统ubuntu18+zed相机的驱动，在此作好记录：记录一下安装双系统中内存的分配，我的移动硬盘256G: 分区内存的大小swa…

人工智能 2023年6月10日
00109
【论文笔记】SVTR: Scene Text Recognition with Single Visual Model

文章目录 SVTR: Scene Text Recognition with Single Visual Model 基本信息摘要模型结构 * Patch Embedding …

人工智能 2023年5月26日
00104
[统计]_线性回归中因变量一定要正态分布吗？

先说结论，不需要线性回归的方程是：y=β0+β1×1+β2×2+……+μ 对于这个方程的假设是： 1.y与x呈线性关系 2.μ与x不相…

人工智能 2023年7月15日
0085
多分类问题的“宏平均”（macro-average）与“微平均”(micro-average)

机器学习中的监督学习主要包括分类问题和回归问题，二分类问题是多分类问题的基础。对于二分类问题，在测试数据集上度量模型的预测性能表现时，常选择Precision（准确率）, Reca…

人工智能 2023年6月24日
0089
【火灾检测】基于matlab GUI森林火灾检测系统（带面板）【含Matlab源码 1921期】

⛄一、火灾检测简介 1 引言目前森林火灾是破坏森林的最主要的灾害之一, 影响很大。森林是各种珍禽异兽的家园, 森林遭受火灾后, 会破坏野生动物赖以生存的环境。严重的森林火灾不仅能引…

人工智能 2023年6月20日
00105
【项目实战】基于Python实现xgboost回归模型(XGBRegressor)项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+代码讲解），如需数据+代码+文档+代码讲解可以直接到文章最后获取。 1.项目背景随着大数据时代的到来，具备大数据思想至关…

人工智能 2023年6月16日
0064
Python划分图像文件夹为训练集、验证集和测试集——split-folders

文章目录简介安装初试用法命令行参考文献简介深度学习图像分类常需要将数据集分为训练集（train）、验证集（validation）和测试集（test），而 Tenso…

人工智能 2023年5月25日
0084
【yolov4目标检测】(2) 多目标跟踪，案例：车辆行人的跟踪和计数，附python完整代码和数据集

各位同学好，今天和大家分享一下如何使用 YOLOv4 目标检测完成对道路上的车辆、行人的检测、跟踪和计数。先放张图看效果。绿框代表检测出的目标，粉色点代表每个检测框的中心点，红色…

人工智能 2023年6月17日
0073
图像分割与实战（一）——基于主动轮廓（snake）的图像分割

1.主动轮廓图像分割算法的概述 1.1主要思想将图像分割问题转化为轮廓进化问题 1.2工作原理将一条曲线在内外力的共同作用下，使得曲线逐步收敛到目标轮廓 1.3 算法流程初始…

人工智能 2023年6月20日
0067
MATLAB图像分割——标记分水岭分割算法

文章目录 1.基本步骤 2.具体实现 * 1.读取图像并求其边界 2.直接使用梯度模值进行分水岭算法 3.分别对前景和背景进行标记 4.进行分水岭变换并显示。 1.基本步骤 ➊读取…

人工智能 2023年6月22日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DBSCAN聚类学习-matlab代码撰写-2022-08-10

大家都在看