mean-shift算法详解（转）

2023年6月1日上午3:57 • 技术杂谈 • 阅读 88

MeanShift最初由Fukunaga和Hostetler在1975年提出，但是一直到2000左右这篇PAMI的论文Mean Shift: A Robust Approach Toward Feature Space Analysis，将它的原理和收敛性等重新整理阐述，并应用于计算机视觉和图像处理领域之后，才逐渐为人熟知。在了解mean-shift算法之前，先了解一下概率密度估计的概念。

密度估计是指有给定样本集和求解随机变量的分布密度函数，解决这一问题的方法包括：参数估计和非参数估计。

非参数估计：无需任何先验知识完全依靠特征空间中样本点计算其密度估计值.可以处理任意概率分布，不必假设服从已知分布；常用的无参数密度估计方法有：直方图法、最近邻域法和核密度估计法。 MeanShift算法正属于核密度估计法。无需任何先验知识完全依靠特征空间中样本点计算其密度估计值。

mean shift算法使用核函数估计样本密度，假设对于大小为$n$,维度为$d$ 的数据集，$D=\left{x_{1}, x_{2}, x_{3}, \ldots x_{n}\right}, D \in R^{d}$ ，核函数K的带宽为h，则该函数的核密度估计为：

定义满足核函数条件为：

其中，$c_{k,d}$ 系数是归一化常数，使得$K(x)$ 的积分为1.

常见的核函数有高斯核函数，其形式如下：

其中，h称为带宽(bandwidth)，不同带宽的核函数如下图所示：

从高斯函数的图像可以看出，当带宽h一定时，样本点之间的距离越近，其核函数的值越大，当样本点之间的距离相等时，随着高斯函数的带宽h的增加，核函数的值在减小。高斯核的python实现如下：

123456789101112131415161718

import numpy as npimport math  def gaussian_kernel(distance, bandwidth):    ''' 高斯核函数    :param distance: 欧氏距离计算函数    :param bandwidth: 核函数的带宽    :return: 高斯函数值    '''    m = np.shape(distance)[0]

以高斯核估计一维数据集的密度为例，每个样本点都设置以该样本为中心的高斯分布，累加所有高斯分布，就得到该数据集的密度。

其中虚线表示每个样本点的高斯核，实现表示累加后所有样本高斯核后的数据集密度。

对于给定的d维度空间中的n个样本点$\left{x_{1}, x_{2}, x_{3}, \ldots x_{n}\right}$ ，则对于x点，其mean-shift向量的基本形式为：

其中$S_h$指的是一个半径为h的高维球区域，如上图中的圆形区域。$S_h$的定义为：

里面所有点与圆心为起点形成的向量相加的结果就是Mean shift向量。下图黄色箭头就是 $M_h$ (mean-shift 向量)。

对于Mean Shift算法，是一个迭代的步骤，即先算出当前点的偏移均值，将该点移动到此偏移均值，然后以此为新的起始点，继续移动，直到满足最终的条件。

Mean Shift算法的基本目标是将样本点向局部密度增加的方向移动，我们常常所说的均值漂移向量就是指局部密度增加最快的方向。上节通过引入高斯核可以知道数据集的密度，梯度是函数增加最快的方向，因此，数据集密度的梯度方向就是密度增加最快的方向。

高斯核：$K(x)=c_{k, d} k\left(|x|^{2}\right)$

其中$g(s)=-k^{\prime}(s)$ ，上式的第一项为实数值。

因此第二项的向量方向与梯度方向一致，第二项的表达式为：

上式的含义就是本篇文章的主题： 均值漂移。由上式推导可知： 均值漂移向量所指的方向是密度增加最大的方向。

要使$\nabla f(x)=0$ ，当且仅当$m_{h}(\mathrm{x})=0$ ，可以得出新坐标：

因此，Mean Shift算法流程为：

（1）计算每个样本的均值漂移向量 $m_{h}(\mathrm{x})$ ;
（2）对每个样本点以 $m_{h}(\mathrm{x})$ 进行平移，即：$x=x+m_{h}(x)$ ；
（3）重复（1）（2），直到样本点收敛，即：$m_{h}(\mathrm{x})

Mean-Shift聚类就是对于集合中的每一个元素，对它执行下面的操作：把该元素移动到它邻域中所有元素的特征值的均值的位置，不断重复直到收敛。准确的说，不是真正移动元素，而是把该元素与它的收敛位置的元素标记为同一类。在实际中，为了加速，初始化的时候往往会初始化多个窗口，然后再进行聚类。

对于图像分割，最简单直接的方法就是对图像上每个点的像素值进行聚类。我们对下图的像素点映射为RGB三维空间：

每个样本点最终会移动到核概率密度的峰值，移动到相同峰值的样本点属于同一种颜色，下图给出图像分割结果：

基于meanshift的目标跟踪算法通过分别计算目标区域和候选区域内像素的特征值概率得到关于目标模型和候选模型的描述，然后利用相似函数度量初始帧目标模型和当前帧的候选模版的相似性，选择使相似函数最大的候选模型并得到关于目标模型的Meanshift向量，这个向量正是目标由初始位置向正确位置移动的向量。由于均值漂移算法的快速收敛性，通过不断迭代计算Meanshift向量，算法最终将收敛到目标的真实位置，达到跟踪的目的。

Original: https://www.cnblogs.com/zl1991/p/16539539.html
Author: 鸭子船长
Title: mean-shift算法详解（转）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/554636/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

腾讯社会招聘内推(长期有效)

一、内推方式扫描以下图二维码，选择自己想要投递的岗位直接投递，即可以博主名义进行内推。如以上二维码过期可添加博主微信，寻求新的内推链接：二、投递建议一是工作年限/学历/证书…

技术杂谈 2023年5月31日
00100
Mac拖拽文件

欢迎加微信交流学习。明人不说暗话欢迎打赏微信:jiqing9006 共8888人支持！！！我们用电脑，通常需要拖拽文件。 Windows，鼠标单击就可以拖拽了。 Mac如何实…

技术杂谈 2023年5月30日
0094
【转】KubeSphere 多集群管理大招：使用 QKE 管理多个 ACK 集群

原文：https://cloud.tencent.com/developer/news/810391 Original: https://www.cnblogs.com/oxspi…

技术杂谈 2023年5月30日
00108
oracle in 条件超长问题解决

今天做了个es查询地址条件的需求，在回传给使用应用的过程当中，使用的应用出现了错误：in的条件中多于1000个表达式数会报ORA-01795的提示错误。接下来将in中的条件拆分，超…

技术杂谈 2023年6月1日
0093
解决计划任务bat脚本中涉及网络位置时遇到的问题

解决掉困扰几天的bug神清气爽，赶紧来写篇随笔~ 前几天由于安全原因把一个Windows Server 2012 R2上的本地硬盘SFTP换成了一个NAS SFTP 然后理所当然的…

技术杂谈 2023年7月11日
0064
HTTP长连接和短链接代理与网关

长连接和短链接代理与网关 HTTP/）服务器端网关：网关与客户端使用HTTP协议通信，使用其他协议与服务端通信（/HTTP）客户端网关：网关与客户端使用其他协议通信，使用HTT…

技术杂谈 2023年7月24日
0068
2019hexo博客部署到coding该绕的坑-奥怪的小栈

这篇文章适用于初次部署和部署到github后想双线部署到coding的朋友们，我将带你们绕过一些我踏过的坑。前言我一开始没打算将博客部署到coding上的，想着部署到githu…

技术杂谈 2023年6月21日
0090
SQL45 将titles_test表名修改为titles_2017

本题链接本题省略表结构。需要用到RENAME TABLE子句，该子句可实现一或多个表名称的修改。子句语法为： RENAME TABLE tbl_name TO new_tbl_na…

技术杂谈 2023年7月11日
0069
阿里云ACE深圳同城会开始报名

大家好，阿里云 ACE深圳同城会本周末第一活动，主要大家一起聚聚，互相认识和熟悉，未来一起玩儿一起进步~ 通知大家一个好消息，当前凡是加入深圳ACE同城会组织（群）的朋友，通过跟群…

技术杂谈 2023年5月31日
0073
JDK8下载安装及环境配置

Java基础知识 Java的三种版本 JavaSE ：标准版，主要用于开发桌面程序，控制台开发等等 JavaME：嵌入式开发，主要用于开发手机，小家电等等，目前使用的比较少 Jav…

技术杂谈 2023年6月21日
00110
初识C++01：初探C++

c++介绍 c++支持面向过程编程（如c），面向对象编程（OOP）和泛型编程； c/c++编译器比较多，window下是微软编译器cl.exe，Linux机下是GCC编译器，mac…

技术杂谈 2023年7月25日
0071
After Effects 教程，如何在 After Effects 中对图层应用蒙版？

Original: https://www.cnblogs.com/123ccy/p/16540816.htmlAuthor: -Mac123-Title: After Effec…

技术杂谈 2023年5月31日
0083
Worktile协同特色之一：无处不在的关注

Worktile选择了更为方便的方式，即引入关注机制，当某个成员与某个任务、文件、讨论、文档有关联时，直接把她添加到关注列表中，或者成员自己也可以主动把自己加入关注列表，这样当任务…

技术杂谈 2023年5月31日
0092
音频视频合并

我这边测试直接合成音质有问题分两步正常先把音频分离出来 ffmpeg -i “audio.m4a” -acodec copy “tmp_audio.aac” 然后把原始视频和上一…

技术杂谈 2023年5月31日
0073
[YARN] 2.2 GB of 2.1 GB virtual memory used. Killing container.

Spark程序在yarn的集群运行，出现 Current usage: 105.9 MB of 1 GB physical memory used; 2.2 GB of 2.1 G…

技术杂谈 2023年5月30日
0093
java学习之JSON

JSON可以说是javascript的一种数据类型，我们学习JSON是为了在客户端的数据给读取出来，官方的解释是：概述：JSON(JavaScript Object Notatio…

技术杂谈 2023年6月21日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

mean-shift算法详解（转）

大家都在看