【图分析】逼近（Approximation）

2023年6月1日下午2:08 • 人工智能 • 阅读 95

*
– Connectivity
– K-Components
– Clique,apx-maximum independent set
– Clique,max clique
– Clustering,clustering_coefficient
– Diameter
– Dominating Set
– Matching
– Ramsey
– Steiner Tree
– Traveling Salesman
–
+ Travelling Salesman Problem(TSP)
– Treewidth
– Vertex Cover
– Max Cut

Connectivity

计算图G G G的连通性，或者是G G G中点与点之间的连通性。

K-Components

K – 连通分量，计算图G G G中存在的1-连通分量，2-连通分量，…，k-连通分量。

{"1": [["p6", "p7", "p5", "p2", "p4", "p3", "p1"]], "2": [["p6", "p7", "p5"], ["p3", "p2", "p1", "p4"]]}

Clique,apx-maximum independent set

独立集，图G G G中任意两个顶点都不相连的顶点集合，例如二分图：

{1，2，3}、{4，5，6}等等，而{1，2}也是独立集，但不是最大的独立集。

; Clique,max clique

最大分团指的是图G = ( V , E ) G=(V,E)G =(V ,E )，的最大子集C C C，这个子集中的每个节点都是两两相连的（完全图）。

Clustering,clustering_coefficient

群聚系数用来描述图中的顶点之间集结成团的程度的系数。也就是一个点的相邻点之间相互连接的程度。

global clustering coefficient（全局集聚系数）
假设有图G = ( V , E ) G=(V,E)G =(V ,E )，L ( i ) L(i)L (i )表示与节点v i v_i v i 相连的边的集合：L ( i ) = { v j : e i j ∈ E ∩ e j i ∈ E } L(i)={v_j:e_{ij}\in E\cap e_{ji}\in E }L (i )={v j :e ij ∈E ∩e ji ∈E }，L ( i ) L(i)L (i )里边的数量就是节点v i v_i v i 的度，记作k i : k i = ∣ L ( i ) ∣ k_i:k_i=|L(i)|k i :k i =∣L (i )∣
如果用C t o t a l ( G ) C_{total}(G)C t o t a l (G )表示全局集聚系数，G Δ G_\Delta G Δ表示闭三元组的个数，G ∧ G_\wedge G ∧表示开三元组的个数（一个三元组是其中有两条（开三元组）或三条（闭三元组）无向边连接的三个结点）。全局集聚系数是所有三元组（包括开和闭的）中封闭三元组数目的比例：
C t o t a l ( G ) = 3 ∗ G Δ 3 ∗ G Δ + 2 ∗ G ∧ C_{total}(G)=\frac{3G_\Delta}{3G_\Delta+2*G_\wedge}C t o t a l (G )=3 ∗G Δ+2 ∗G ∧3 ∗G Δ

local clustering coefficient（局部集聚系数）
图中一个节点的局部集聚系数表示它的相邻节点形成一个团（完全图）的紧密程度。结点v i v_i v i 的局部集聚系数C i C_i C i 是它的相邻结点之间的连接数与它们所有可能存在连接的数量的比值。有向图的局部集聚系数为
C i = ∣ { e j k } ∣ k i ( k i − 1 ) , v j , v k ∈ N i , e j k ∈ E C_i=\frac{|{e_{jk}}|}{k_i(k_i-1)},v_j,v_k\in N_i,e_{jk}\in E C i =k i (k i −1 )∣{e jk }∣,v j ,v k ∈N i ,e jk ∈E
其中，N i N_i N i 是节点v i v_i v i 的相邻节点。无向图的局部集聚系数为
C i = 2 ∣ { e j k } ∣ k i ( k i − 1 ) , v j , v k ∈ N i , e j k ∈ E C_i=\frac{2|{e_{jk}}|}{k_i(k_i-1)},v_j,v_k\in N_i,e_{jk}\in E C i =k i (k i −1 )2∣{e jk }∣,v j ,v k ∈N i ,e jk ∈E
average clustering coefficient（平均集聚系数）
定义为所有节点的局部集聚系数的均值
C ‾ = 1 n ∑ i = 1 n C i \overline{C}=\frac{1}{n}\displaystyle\sum_{i=1}^{n}C_i C =n 1 i =1 ∑n C i
有更高平均集聚系数的G G G有着模块结构，在不同节点间有更小的平均距离。

Diameter

可以使用2-sweep算法计算无向图的直径，而使用2-dSweep算法计算有向图的直径。

Dominating Set

点支配集（dominating set）
假设G = ( V , E ) G=(V,E)G =(V ,E )是一个简单无向图，S ⊆ V , S ≠ ∅ S\subseteq V,S\neq\varnothing S ⊆V ,S =∅，如果∀ v ∈ V − S \forall v\in V-S ∀v ∈V −S，S S S都有至少一个节点与v v v相邻，则称S S S是G G G的支配集（dominating set）

边支配集（edge dominating set）
假设G = ( V , E ) G=(V,E)G =(V ,E )是一个简单无向图，F ⊆ E , F ≠ ∅ F\subseteq E,F\neq\varnothing F ⊆E ,F =∅，如果∀ e ∈ E − F \forall e\in E-F ∀e ∈E −F，F F F都有至少一条边的节点与e e e的节点重合。则称F F F是G G G的边支配集（edge dominating set）

Matching

minimum maximal matching
在一个无向图G G G中，找到一个边集S S S，这个边集拥有最少的边，这些边能够覆盖G G G中尽可能多的节点。这些边不会共有某个节点。

; Ramsey

待补充

Steiner Tree

metric closure
metric closure（度量闭包）是关于G G G的一个完全图（每个节点都与其他节点相连），这个图的每一条边的权重都由原图G G G的权重计算得到（networkx里是weight属性）。
如下原数据

{
  "node_title": ["id","name","age"],
  "node_title_type": ["string","string","string"],
  "nodes": [
    ["p1","Tayler","32"],
    ["p2","Marco","31"],
    ["p3","Mike","30"],
    ["p4","Lily","26"],
    ["p5","Andy","24"],
    ["p6","Anne","24"],
    ["p7","Ardy","24"],
    ["p8","Andis","24"]
  ],
  "link_title": ["src","dst","name","weight","sdate","edate"],
  "link_title_type": ["string","string","int","string","date","date"],
  "links": [
    ["p1","p2","friend",30,"2010-08-09","2021-08-09"],
    ["p1","p3","friend",25,"2010-08-09","2021-08-09"],
    ["p2","p4","friend",20,"2010-08-09","2021-08-09"],
    ["p4","p5","friend",36,"2010-08-09","2021-08-09"],
    ["p3","p4","friend",40,"2010-08-09","2021-08-09"],
    ["p5","p6","friend",40,"2010-08-09","2021-08-09"],
    ["p6","p7","friend",40,"2010-08-09","2021-08-09"],
    ["p5","p7","friend",40,"2010-08-09","2021-08-09"],
    ["p6","p8","friend",40,"2010-08-09","2021-08-09"]
  ]
}

计算得到的完成图的边的值为：

{
    "p1":{
        "p4":{
            "distance":50,
            "path":["p1","p2","p4"]
        },
        "p2":{
            "distance":30,
            "path":["p1","p2"]
        },

        ...............

    }
}

从结果来看，p1和p4之间的边的权重（distance）由原图G G G中( p 1 , p 2 ) (p1,p2)(p 1 ,p 2 )的权重w p 1 p 2 w_{p1p2}w p 1 p 2 和( p 2 , p 4 ) (p2,p4)(p 2 ,p 4 )的权重w p 2 p 4 w_{p2p4}w p 2 p 4 相加得到。

steiner tree

最小斯坦纳树（the minimum Steiner tree）是图G G G中的一棵树，这棵树覆盖了指定的一些点（一般作为参数传入，称为terminal nodes），并且这棵树覆盖的边的权重和最小。

Traveling Salesman

Travelling Salesman Problem(TSP)

TSP问题是希望从图G G G中寻找一条路径，salesman通过这条路径行走可以经过G G G中的所有节点。路径需要满足以下条件：
（1）路径的距离最短。
（2）这条路径起始点和终点是同一个节点。
（3）salesman在行走时只会经过一次节点。
求解TSP问题有四种方法，christofides，greedy_tsp，simulated_annealing_tsp，threshold_accepting_tsp。

christofides 算法

greedy_tsp算法
greedy指的是贪心算法（greedy algorithm），该算法是指：在对问题求解时，总是做出当前情况下的最好选择。这种最好的选择一般都是局部最优解，不具备后效性，针对TSP问题，贪心算法的求解过程为：
（1）从某一个城市开始，每次选择一个城市，直到走完所有的城市。
（2）每次在选择下一个城市的时候，只考虑当前情况，保证当前经过的路径总距离最小。
假设城市使用数字编号来表示：1 , 2… , N 1,2…,N 1 ,2…,N，任何两个城市的距离记录在数组d [ i , j ] d[i,j]d [i ,j ]中。依次访问过的城市编号被记录在s [ 1 ] , s [ 2 ] , . . . , s [ N ] s[1],s[2],…,s[N]s [1 ],s [2 ],…,s [N ]中，即第i i i次访问的城市记录在s [ i ] s[i]s [i ]中。
算法的伪代码如下：

(1)s[1]=1
(2)sum=0
(3)initialize the distance array d[i,j]
(4)i=2
(5)search the nearest city j(unvisited) to s[i-1]，get d[i,j]
(6)sum = sum + d[i,j]
(7)s[i]=j
(8)i=i+1
(9) if iN,goto(5),else,goto(10)
(10)print s[N]
(11)print sum

simulated_annealing_tsp算法
待补充

threshold_accepting_tsp算法
待补充

Treewidth

图的树分解及树宽
设G ( V , E ) G(V,E)G (V ,E )是一个无向图，则图G G G的树分解由树T T T和T T T的每一个节点t t t关联的子集X t ⊆ V X_t\subseteq V X t ⊆V构成（此时可称这些子集X t X_t X t 是树分解的片段）。树T T T和片段集{ X t , t ∈ T } {X_t,t\in T}{X t ,t ∈T }满足以下3个条件：

（1）⋃ ( X t , t ∈ T ) = V \bigcup (X_t,t\in T)=V ⋃(X t ,t ∈T )=V，即全部片段集X t X_t X t 中包含的节点涵盖了图G G G的所有节点，或者说图G G G的每个节点至少属于某一个片段X t X_t X t 。
（2）对图G G G的每一条边e ∈ E e\in E e ∈E，至少存在一个片段X t X_t X t ，包含e e e的两个端点。
（3）若t 1 , t 2 , t 3 t_1,t_2,t_3 t 1 ,t 2 ,t 3 是树T T T的3个节点，其中t 2 t_2 t 2 在t 1 t_1 t 1 到t 3 t_3 t 3 的路径上，那么，若G G G的节点v v v属于X t 1 X_{t1}X t 1 和X t 3 X_{t3}X t 3 ，则v v v一定属于X t 2 X_{t2}X t 2

树分解的宽度等于m a x ( ∣ X t ∣ − 1 , t ∈ T ) max(|X_t|-1,t\in T)ma x (∣X t ∣−1 ,t ∈T )。图G G G的树宽就是G G G的最小树分解的宽度，即在图G G G的所有树分解中，具有最小宽度的树分解的宽度称为图G G G的树宽。

Vertex Cover

待补充

Max Cut

待补充

Original: https://blog.csdn.net/sword_csdn/article/details/120087232
Author: sword_csdn
Title: 【图分析】逼近（Approximation）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557220/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

晓宇哥新年力作！AI离线语音开关控制器

作者：晓宇，整理：晓宇微信公众号：芯片之家（ID：chiphome-dy）很长一段时间，在这座年轻而动荡的城市里，小雨哥在这个宁静的夜晚都舍不得睡觉。睡觉前，他总是习惯于看公众…

人工智能 2023年5月27日
0097
2021年中国道路交通事故情况分析（附机动车保有量、交通事故发生数量、死亡人数、受伤人数、直接经济损失）[图]

一、交通事故因素凡在行车工作中，因违反规章制度，违反劳动纪律，技术设备不良及其他原因，在行车中造成人员伤亡、设备损害、经济损失、影响正常行车或危及行车安全的，均构成行车事故。行…

人工智能 2023年6月25日
00220
详解麦克风阵列的原理、分类及作用

从字面上讲，麦克风阵列指的是麦克风的排列。也就是说，一定数量的麦克风按照一定的规则形状排列成阵列，用于采集声音信号的空间特征的传播。根据布局形状，麦克风阵列可分为线性阵列、立体声阵…

人工智能 2023年5月25日
0068
pytorch之常用函数整理

pytorch之常用函数整理一、图像预处理函数 * 1.1 torchvision.datasets.ImageFolder()函数二、参数优化函数 * 2.1 torch.o…

人工智能 2023年7月6日
0090
R中因子(factor)

R中因子(factor) R提供了因子这一数据结构（容器），专门用来存放名义型和有序型的分类变量。因子本质上是一个带有水平 (level) 属性的整数向量，其中”水平&…

人工智能 2023年6月16日
0088
mac版 SimHei添加教程

mac版本matplotlib SimHei配置一、环境描述python 3.7mac 10.15.4二、问题描述使用matplotlib绘制图片的时候，所有的中文字符无法正常显…

人工智能 2023年5月31日
0072
聚类和分类算法的区别

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0072
【UWB】Savitzky Golay filter SG滤波器快速入门并上手使用

文章目录函数介绍示例程序 Ref：关于 S-G 滤波器原理的讲解请参考：【UWB】Savitzky Golay filter SG滤波器原理讲解函数介绍 Savitzky …

人工智能 2023年6月21日
0089
【PhotoShop】ps 基础知识

【PhotoShop】ps 基础知识概述 ps 文件打开图片常用格式 * JPEG GIF PNG BMP RAW ps 常用参数 * 像素分辨率 (DPI) 颜色模式概述…

人工智能 2023年6月22日
0086
运营总监直言：再招聘到不懂数据分析的运营，直接开除

年末这段时间是运营最忙的一段时间了，因为全年活动颇多，在年终总结复盘的时候就需要有海量的工作量来处理工作数据。我朋友就是一家公司的线上运营总监，由于是公司规模正在扩张，前几个月老…

人工智能 2023年7月17日
0085
CloudCompare点云配准基本操作

CloudCompare基本介绍官方网站https://cloudcompare.org/官方文档https://cloudcompare.org/doc/qCC/CloudCo…

人工智能 2023年6月17日
0088
股票python量化交易014-计算收益率

*单只股票单次持仓收益率计算方式：收益率 = （市价-成本)/成本*100% 收益率也叫做盈亏比，是最直接的策略收益评估指标，后面做回测也要用到。 *Matplotlib可视化库…

人工智能 2023年7月18日
0072
基于python中cv2库的图像分割

一.概念 1.简述Radon变换检测直线的原理。 Radon变换就是将数字图像矩阵在某一角度射线方向上做投影变换，按照投影方向累加像素。 2.简述基于区域生长的图像分割的原理。根…

人工智能 2023年6月18日
0075
get_lr()调整学习率踩坑

在复原USRNet的过程中，总是训练不出理想模型，10w+次效果还很差，并且学习率调整很奇怪。最后发现是学习率调整策略中get_lr()有很大问题！！！！！网上很少有这方面的内容，…

人工智能 2023年7月22日
0056
YOLOv5、YOLOX、YOLOv6的分析与比较

美团的技术团队在最近提出了YOLOv6网络模型，美团在技术文档中重点对比了前两代的YOLOv5和YOLOX，以及百度的PP-YOLOE，在对coco数据集的验证中，YOLOv6不仅…

人工智能 2023年7月25日
00109
一文速学-时间序列分析算法之指数平滑法详解+Python代码实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月28日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31