日报2022-05-02

2023年5月31日上午8:30 • 人工智能 • 阅读 51

几种包映射算法实现

聚类中心 C = { c 1 , . . . , c k } C = {c_1,…,c_k}C ={c 1 ,…,c k }, 包 B i = { b i 1 , . . . , b i m } \mathbf{B}i={b{i1},…,b_{im}}B i ={b i 1 ,…,b i m }
一、最短距离映射
映射方式如下
h i = m a x e x p j ( − ∥ b i j − c i ∥ σ 2 ) h_i=\underset{j}{\rm{max}\,\rm{exp}}(- \frac{\|b_{ij}-c_i \|}{\sigma^2})h i =j m a x e x p (−σ2 ∥b i j −c i ∥)
B i \mathbf{B}_i B i 最终的映射向量是H ( B i ) = [ h 1 , . . . , h k ] H(\mathbf{B}_i) = [h_1,…,h_k]H (B i )=[h 1 ,…,h k ]


        ret_vec = np.ones(self.k_m)
        index = 0
        for item in centers:
            ret_vec[index] = np.linalg.norm(item - self.bags[idx, 0][:, :self.dimensions-1], axis=1).min()
            index += 1
        ret_vec = [math.exp(-x) for x in ret_vec]
        return ret_vec / dis_euclidean(ret_vec, np.zeros_like(ret_vec))

二、去中心化映射
B i \mathbf{B}i B i 里面的实例根据 C C C 被分为了K K K类，K ≤ k K\le k K ≤k, 每一类为一个集合S i = { s 1 , . . . , s l } S_i={s_1,…,s_l}S i ={s 1 ,…,s l }, 映射方式如下
h i = ∑ a = 1 l s a − c i h_i = \sum^l{a=1}s_a-c_i h i =a =1 ∑l s a −c i
h i h_i h i 是与实例同维的向量，最终B i \mathbf{B}_i B i 映射为H ( B i ) = [ h 1 , . . . , h k ] H(\mathbf{B}_i) = [h_1,…,h_k]H (B i )=[h 1 ,…,h k ]，如果没有c i c_i c i 这一类的实例，则对应的 h i h_i h i 缺失值补零

ret_vec = np.zeros((len(centers), self.dimensions-1))
        idx_ins = 0
        for ins in self.bags[idx, 0][:, :self.dimensions-1]:
            ret_vec[labels[idx_ins]] += ins - centers[labels[idx_ins]]
            idx_ins += 1
        ret_vec = np.resize(ret_vec, self.k_m * self.dimensions-1)
        ret_vec = np.sign(ret_vec) * np.sqrt(np.abs(ret_vec))
        return ret_vec / dis_euclidean(ret_vec, np.zeros_like(ret_vec))

三、均值映射
B i \mathbf{B}i B i 里面的实例根据 C C C 被分为了K K K类，K ≤ k K\le k K ≤k, 每一类为一个集合S i = { s 1 , . . . , s l } S_i={s_1,…,s_l}S i ={s 1 ,…,s l }, 映射方式如下
h i = 1 ∣ S i ∣ ∑ a = 1 l s a h_i = \frac{1}{|S_i|}\sum^l{a=1}s_a h i =∣S i ∣1 a =1 ∑l s a
h i h_i h i 是与实例同维的向量，最终B i \mathbf{B}_i B i 映射为H ( B i ) = [ h 1 , . . . , h k ] H(\mathbf{B}_i) = [h_1,…,h_k]H (B i )=[h 1 ,…,h k ]，如果没有c i c_i c i 这一类的实例，则对应的 h i h_i h i 缺失值补零

ret_vec = np.zeros((self.k_m, self.dimensions-1))
        idx_ins = 0
        for ins in self.bags[idx, 0][:, :self.dimensions-1]:
            ret_vec[labels[idx_ins]] += ins
            idx_ins += 1
        unique, count = np.unique(labels, return_counts=True)
        data_count = dict(zip(unique, count))
        for key in data_count.keys():
            ret_vec[key] /= data_count[key]
        ret_vec = np.resize(ret_vec, self.k_m * self.dimensions-1)
        ret_vec = np.sign(ret_vec) * np.sqrt(np.abs(ret_vec))
        return ret_vec / dis_euclidean(ret_vec, np.zeros_like(ret_vec))

四、按比例映射
B i \mathbf{B}_i B i 里面的实例根据 C C C 被分为了K K K类，K ≤ k K\le k K ≤k, 每一类为一个集合S i = { s 1 , . . . , s l } S_i={s_1,…,s_l}S i ={s 1 ,…,s l }, 映射方式如下
h i = ∣ S i ∣ ∣ B i ∣ h_i = \frac{|S_i|}{|\mathbf{B}_i|}h i =∣B i ∣∣S i ∣
最终B i \mathbf{B}_i B i 映射为H ( B i ) = [ h 1 , . . . , h k ] H(\mathbf{B}_i) = [h_1,…,h_k]H (B i )=[h 1 ,…,h k ]，如果没有c i c_i c i 这一类的实例，则对应的 h i h_i h i 缺失值补零

ret_vec = np.zeros(self.k_m)
        bag_size = len(self.bags_size[idx])
        unique, count = np.unique(labels, return_counts=True)
        data_count = dict(zip(unique, count))
        for key in data_count.keys():
            ret_vec[key] =  data_count[key]/bag_size
        return ret_vec

测试效果

一、最短距离映射

bag-level classify result:
confusion:
 [[282   2]
 [  2 650]]
precision: 0.9969325153374233
recall: 0.9969325153374233
f1-score: 0.9969325153374233
accuracy: 0.9957264957264957
start training single-instance model----------------
model trainig complete!

Finally instance result:
confusion:
 [[ 337    3]
 [   1 9019]]
precision: 0.9996674794945688
recall: 0.9998891352549889
f1-score: 0.9997782950892363
accuracy: 0.9995726495726496
class-time 27.534499883651733

二、去中心化映射

bag-level classify result:
confusion:
 [[290   2]
 [ 17 627]]
precision: 0.9968203497615262
recall: 0.9736024844720497
f1-score: 0.9850746268656716
accuracy: 0.9797008547008547
start training single-instance model----------------
model trainig complete!

Finally instance result:
confusion:
 [[ 342    4]
 [   7 9007]]
precision: 0.9995560981023194
recall: 0.9992234302196583
f1-score: 0.9993897364771152
accuracy: 0.9988247863247863
class-time 31.642945766448975

三、均值映射

bag-level classify result:
confusion:
 [[307   4]
 [ 10 615]]
precision: 0.9935379644588045
recall: 0.984
f1-score: 0.9887459807073955
accuracy: 0.9850427350427351
start training single-instance model----------------
model trainig complete!

Finally instance result:
confusion:
 [[ 368    5]
 [   1 8986]]
precision: 0.9994438883327772
recall: 0.999888728162902
f1-score: 0.9996662587607075
accuracy: 0.9993589743589744
class-time 32.479421615600586

四、按比例映射

bag-level classify result:
confusion:
 [[272  25]
 [  9 630]]
precision: 0.9618320610687023
recall: 0.9859154929577465
f1-score: 0.973724884080371
accuracy: 0.9636752136752137
start training single-instance model----------------
model trainig complete!

Finally instance result:
confusion:
 [[ 333   28]
 [   1 8998]]
precision: 0.9968978506536672
recall: 0.999888876541838
f1-score: 0.9983911234396671
accuracy: 0.9969017094017094
class-time 27.800466299057007

Original: https://blog.csdn.net/weixin_40872714/article/details/124544986
Author: swpu_jx_1998
Title: 日报2022-05-02

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/550060/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

《大数据+AI在大健康领域中最佳实践前瞻》—- 医疗知识库的未来形态：医疗知识图谱前瞻

文章大纲简介知识库构建思路医学知识图谱的构建医学知识抽取 * 医学知识描述体系自动构建与提取技术医学知识图谱质量评估 CMeKG(Chinese MedicalKnow…

人工智能 2023年6月1日
0073
【Python 数据处理】Pandas

Pandas 是 Python 语言的一个扩展程序库，用于数据分析。 Pandas 名字衍生自术语 “panel data”（面板数据）和 “P…

人工智能 2023年7月6日
0075
基于知识图谱的问答系统（protege，jena，jieba分词的结合）

一个简单的问答系统，只不过这其中的构建过程是基于知识图谱。主要的使用的工具（AKA，重点）有protégé（用于知识图谱的建模）、jena数据库（其为一个基于三元组的图数据库，用于…

人工智能 2023年6月26日
0069
虚拟环境中cuda和cudnn及pytorch和tensorflow的安装

将cuda和dudnn及pytorch和tensorflow装在虚拟环境中的好处是可以在不同的环境中装自己需要的不同版本，坏处是很占存储空间。本人电脑显卡为3050ti，装的版本…

人工智能 2023年7月22日
0043
多智能体强化学习—QMIX

多智能体强化学习—QMIX 论文地址：https://arxiv.org/pdf/1803.11485.pdf 1 介绍首先介绍一下VDN（value decomposition…

人工智能 2023年6月15日
0048
从0开始的深度学习——【tensorflow】创建一个神经网络

我们用 tf.keras来创建神经网络：什么是 tf.keras?,简单地说就是tensorflow中已经帮你封装好的一些包，它的作用是可以帮你快速搭建网络模型。我们以创建一个能…

人工智能 2023年7月14日
0066
【学生网页设计作业源码】基于HTML+CSS+JavaScript简单的大学生书店(13个页面) 二手书店电子商务网站模板源码

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月27日
0082
电信用户流失预测案例（1）

【Kaggle】Telco Customer Churn 电信用户流失预测案例前言：案例学习说明与案例建模流程在学习了经典机器学习算法和Scikit-Learn的调参策略之后，…

人工智能 2023年7月28日
0073
pycharm python3.7成功安装face_recognition以及dlib库教程

相应问题： Unable to open ..\shape_predictor_68_face_landmarks.dat 对应解决：(28条消息) Unable to open …

人工智能 2023年7月12日
0067
【论文综述】基于深度学习语音分离技术的研究现状与进展

基于深度学习语音分离技术的研究现状与进展本文主要是针对单通道的监督性语音分离技术的综述，描述该技术涉及到的特征、模型和目标三个主要方面；并对语音分离的一般流程和整体框架进行了…

人工智能 2023年5月25日
00102
CondaHTTPError: HTTP 000 CONNECTION FAILED for url和conflicts

在anaconda prompt安装tensorflow时，出现以下错误 (base) C:\Users\Eiffel>conda create -name tensorfl…

人工智能 2023年5月25日
00145
【论文阅读】Attention-based Deep Multiple Instance Learning

题目：CCF A-Loss-Based Attention for Deep Multiple Instance Learning International conference…

人工智能 2023年7月13日
0066
CVPR2022：使用完全交叉Transformer的小样本目标检测

关注并星标从此不迷路计算机视觉研究院公众号ID｜ ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址： https://openaccess.th…

人工智能 2023年7月27日
0046
36、Java——一个案例学会三层架构对数据表的增删改查

✅作者简介：热爱国学的Java后端开发者，修心和技术同步精进。🍎个人主页：Java Fans的博客🍊个人信条：不迁怒，不贰过。小知识，大智慧。💞当前专栏：Java案例分享专栏✨特色…

人工智能 2023年7月29日
0047
Meta AI新发布的超大规模语言模型-OPT-175B

Meta AI在2022年5月3日新发布的OPT-175B模型，该模型是现阶段第一个模型参数超过千亿级别的开放模型，其次该模型与GPT-3相比，更加开放及便于访问。具体开放性…

人工智能 2023年5月28日
0084
深度学习入门笔记（一）二分分类、logistic回归

Its like a finger pointing away to the moon. Dont concentrate on the finger or you will mi…

人工智能 2023年7月2日
0056

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

日报2022-05-02

几种包映射算法实现

测试效果

大家都在看