HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记

HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation

总结

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:ba979c16-de16-4a40-9fe7-e7fa00333886

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:ee50917f-e9bc-4744-a2f6-2cb661e8d74a

优点

  1. 鲁棒性好,对大部分不同分布的数据集都有效;
  2. 运行更快
  3. 对超参数不敏感。

方法

思路

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:903b55ec-b765-403d-a7e4-54ff86914d57

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:e4661076-ed42-4391-8306-81ab108c611b

做法

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:033a34ad-6f76-40c1-bc28-b2908cbc8e71

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:63cfa985-246f-4b14-b57d-3fba05fe34b7

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:16767f33-6e1a-4955-9695-238211ed8aab

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:b58a952f-c6f5-4360-acbe-3bff09a4b3d3

物体移动

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0f11c488-c45c-4352-98e6-a1855737d831

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0dfe005d-8131-4be8-a9e3-b3fb97cf942e

HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记
这个公式是物理学中位移的公式,而在这篇文章中,将v 0 v_0 v 0 ​设为0,m m m设为1,则得到了位移为:
S ⃗ = 1 2 F ⃗ t 2 \vec S = \frac{1}{2}\vec F t^2 S =2 1 ​F t 2
这里的F F F就是题目中提到的重力,而t t t则为超参。
HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记
对一个点i i i来讲,它的新坐标就可以通过原坐标o ⃗ i \vec o_i o i ​加上位移S ⃗ i \vec S_i S i ​来计算。其中,第三行T = t 2 2 T=\frac{t^2}{2}T =2 t 2 ​。第四行的转换是计算”重力部分”的内容。

; 计算重力

HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记
对一个点i i i,取它的k k k个最近邻,假设这个最近邻集合为K K K,根据最近邻与i i i的距离从小到大排序。此时,i j ij i j代表着离i第j j j近的节点,其中i 1 i1 i 1为最近的节点。所以,公式中的j j j是小于等于k k k的。
上面公式的F i j F_{ij}F i j ​,可以理解为是第j j j近邻对点i i i施加的力(分力),首先,G G G的表达如下:
HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记
其中,o ⃗ \vec o o代表着该点的特征向量,而∣ ∣ ∣ ∣ 2 ||\ ||2 ∣∣∣∣2 ​则代表二范数,这个式子就是求出数据集中各点到其第一近邻的距离的均值,对于固定数据集而言,是一个定值。
而∣ ∣ o i 1 ⃗ − o i ⃗ ∣ ∣ 2 ||\vec{o
{i1}} – \vec{o_i}||2 ∣∣o i 1 ​​−o i ​​∣∣2 ​对于点i i i而言也是定值,所以无需讨论。
之后的一项o i 1 ⃗ − o i ⃗ \vec{o
{i1}} – \vec{o_i}o i 1 ​​−o i ​​的结果是向量形式,这一项表示点i i i移动的方向(向第j j j近邻移动)
接下来是分母部分,可以看出这是求i i i点与其第j j j近邻的距离,当j j j越大时(距离较远),意味着F F F就更小,这可以看作是一个加权的方式。
那么合力F i F_i F i ​就可以得出是:
HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记
可以看出,距离越近的点F i j ⃗ \vec{F_{ij}}F i j ​​越大,即物体有向距离更近点移动的趋向。

优化

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:8648040f-8d81-4082-a874-7d9c011e3835

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:716f63cc-b575-4fba-ac97-3c9ba691f5f4

HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记
其中d d d为移动次数。

; 注意点

每次移动后,常数G G G还有每个点的近邻会改变,所以移动过后需要重新计算。
对于超参d d d和T T T,虽然设置得越大,数据会越适合于聚类,但是如果太大的话会导致失去原本数据的信息。文中建议是d ≤ 10 、 T ≤ 0.5 d\leq10、T\leq0.5 d ≤1 0 、T ≤0 .5。

BS3_1 12th

Original: https://blog.csdn.net/eternal_city/article/details/121323592
Author: 吾道长存
Title: HIBOG: Improving the clustering accuracy by amelioratingdataset with gravitation论文笔记

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/560698/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 【Python】利用Python拟合函数曲线

    使用Python拟合函数曲线需要用到一些第三方库: numpy:科学计算的基础库(例如:矩阵) matplotlib:绘图库 scipy:科学计算库 如果没有安装过这些库,需要在命…

    人工智能 2023年6月15日
    079
  • DNN(全连接神经网络)

    一. DNN网络一般分为三层 1.输入层 2.隐藏层 3.输出层 简单网络如下: 二.前向传播 从第二层开始,每一个神经元都会获得它上一层所有神经元的结果。即每一个 y = wx …

    人工智能 2023年7月12日
    071
  • Error: Can‘t find Python executable “python“, you can set the PYTHON env variable.解决办法

    😦电脑磕坏了 最近把公司给的mac屏幕给磕坏了,换成自己的macbookpro,本来想用时间机器做个无缝衔接,结果发现不能用了,跟客服沟通被告知macos版本在11以上不支持时间机…

    人工智能 2023年7月4日
    049
  • 一文读懂数据仓库、数据湖、湖仓一体

    目录 1、数据仓库 * – 数据仓库的特征 2、数据湖 * – 数据湖的特征 数据仓库和数据湖的对比 3、湖仓一体 * – 湖仓一体的特征 湖仓…

    人工智能 2023年6月19日
    0112
  • 常用自然语言处理NLP模型原理

    一、文本处理流程 文本清洗:html标签与转义字符、多余空格、根据需要清除邮箱、账号、网址、手机号、作者信息等信息 预处理:去除停用词、加载自定义词库(实体词库、垂直领域词库)、分…

    人工智能 2023年6月1日
    082
  • 5.基于深度学习的轴承故障诊断–连续小波变换cwt

    该专栏将较为详细的介绍如何利用深度学习进行故障诊断方面的学术研究,主要以轴承为例,包括深度学习常用框架Tensorflow的搭建以及使用,并会记录完整搭建过程,并以卷积神经网络与循…

    人工智能 2023年6月17日
    081
  • 【OpenCV】中的鱼眼相机及其标定

    1. 鱼眼镜头特性与镜头分类 普通镜头和针孔相机在数学模型上可以等价对待,都是射影变换(Perspective transform);鱼眼镜头受到水下斯涅耳窗口现象的启发,采用不同…

    人工智能 2023年7月19日
    063
  • 生成对抗网络(GAN)详解与实例

    GAN介绍 理解GAN的直观方法是从博弈论的角度来理解它。GAN由两个参与者组成,即一个生成器和一个判别器,它们都试图击败对方。生成备从分巾中狄取一些随机噪声,并试图从中生成一些类…

    人工智能 2023年7月23日
    063
  • 回归模型的评估及超参数调优

    一、回归模型 在机器学习中,其中算法最为重要一面就是回归算法,回归算法占我们理解机器学习一大块,这一块的学习可以帮助我们掌握超参数的调节。基本上只要一切基于特征预测连续型变量的需求…

    人工智能 2023年6月17日
    062
  • 深度学习入门实践1

    如果想简单test一下可以用 一般来说比较热门的模型会有很多详细介绍的博客 2.读Readme 创建配置虚拟环境 有requirements.txt最好 (直接创环境,然后pip …

    人工智能 2023年7月16日
    053
  • 经验分享丨我是如何零经验转行数据分析的?

    感觉这两年势头不好的行业越来越多的,起初是教育行业大崩盘,在之后房地产和汽车等行业也在逐渐走向低谷,市场上”灵活就业”的朋友越来越多了,很多人都不禁开始思考…

    人工智能 2023年6月11日
    065
  • GhostNet网络详解

    GhostNet网络 一张图片经过神经网络进行特征提取后,能够得到很多特征图。在特征图中会有一些 相似性很高,这就是神经网络中存在的 特征图冗杂的情况(如图中扳手相连的两幅特征图)…

    人工智能 2023年6月17日
    094
  • [山东科技大学OJ]1653 Problem C: 藏头诗

    Description 有个小伙暗恋同班的姑娘,但是苦于害羞腼腆不敢直抒胸臆。于是小伙打算写一首英文情诗给她。为了使这首情诗高端霸气上档次,小伙经过三天三夜的精心创作写了一首藏头的…

    人工智能 2023年6月27日
    064
  • Nexus存储库管理器搭建-Maven私服

    写在前面 🍁个人主页:微枫Micromaple✨本期专栏:《0到1项目搭建》欢迎订阅学习~📌源码获取:GitCode、GitHub、码云Gitee 持续更新中,别忘了 star 喔…

    人工智能 2023年7月29日
    057
  • 手把手调参最新 YOLOv7 模型 训练部分 – 最新版本(二)

    手把手调参最新 YOLOv7 模型 训练部分 – 最新版本(二)🚀 YOLO系列模型在目标检测领域有着十分重要的地位,随着版本不停的迭代,模型的性能在不断地提升,源码提…

    人工智能 2023年7月29日
    0188
  • matlab处理数据

    纯分享我为了处理大数据看的一系列文章,重点在小波去噪,建立模型。 参考文献 (127条消息) 小波分析、小波降噪matlab代码实现_leaf_991的博客-CSDN博客_小波降噪…

    人工智能 2023年6月18日
    064
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球