利用CNN实现图像和数值数据融合

2023年7月13日上午1:12 • 人工智能 • 阅读 56

利用CNN实现图像（MRI）和数值数据融合

一、背景

在很多实际任务当中，模型构建数据类型多样，有数值型、图像、音频等各式各样的数据，如果单纯利用某种类型的数据构建分类或回归模型，好处是构建简单，数据不存在类型不同融合困难的问题，但如果单纯的利用某一种数据且模型性能一般，如accuracy在0.6-0.7之间徘徊，那有必要纳入更多的特征，特别是在医疗领域，部分数值型数据本来的可分性就不好，因此要纳入一部分的图像数据，如早期预测一个人是否会患某种疾病，训练集样本均为正常人，此时无论是数值型数据或影像数据，区别并不大，因此要考虑融合二者来提升预测的准确性。

二、目前常用的图像和数值型数据融合的方式

目前来说，把图像和数值型数据融合方式有三种：

1、直接把图像转为向量

这种方法是最暴力的解法，如一张32X32像素的彩色图片，其转化为向量为32X32X3=3072，相当于纳入了3072个特征，优点是纳入了所有图像中的细节（像素级），缺点是由于纳入了所有的细节（像素），会不必要的有一部分混杂因素，因此需要复杂的特征工程，另一方面，其计算量会大大增加，导致模型拟合或后期应用出现问题。

2、利用软件提取图像中的某些特征

; 3、利用CNN（卷积神经网络）

CNN也可以用来提取特征，前提是该模型预测准确性较好，自然相当于提取的特征较为准确，一般是在卷积基后的flatten层和数值型数据拼接在一起，实现图像和数值型数据的融合，具体如上图所示。

三、CNN实现图像和数值型数据融合的步骤

1、训练CNN网络

这一步是整个融合过程中较为重要的步骤，只有较为准确的CNN网络才能提取准确有用的特征，一般采用预训练+微调的模式来训练CNN，为了演示方便，我们采用Fashion MNIST数据集来为我们的图像，iris数据集作为我们的数值型数据，来做演示。另外由于Fashion MNIST类别有10中，而iris只有3种，我们之纳入irsi的数据来”假定为我们图像配套的数值型数据”，新建一个py文件，具体代码如下：

import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

train_images_norm = train_images / 255.0
test_images_norm = test_images / 255.0
train_images_reshape = train_images.reshape([-1, 28, 28, 1])
test_images_reshape = test_images.reshape([-1, 28, 28, 1])

L = keras.layers
model = keras.Sequential([

    L.Conv2D(input_shape=(28, 28, 1), filters=32, kernel_size=3, strides=1),

    L.MaxPool2D(pool_size=2, strides=2),

    L.Conv2D(filters=64, kernel_size=3, strides=1),

    L.MaxPool2D(pool_size=2, strides=2),

    L.Flatten(),
    L.Dense(256, activation='relu'),
    L.Dense(10, activation='softmax')

])
model.summary()

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(train_images_norm, train_labels, epochs=5, validation_split=0.2)
test_loss, test_acc = model.evaluate(test_images_norm, test_labels)
print('test_loss:{}, test_acc{}'.format(test_loss, test_acc))

上面代码主要训练了一个CNN模型，之后保存为 ConV_DT.h5，方便下一步使用。

2、载入已经训练好的模型，提取图像特征并和数值型数据拼接

新建另外一个py文件，这部分代码主要实现利用已经构建好的模型，重新输入训练图片，来输出Flatten层的输出，之后和数值型数据拼接，也就是iris数据集，这部分的代码如下：

import pandas as pd
import tensorflow as tf
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
import warnings
warnings.filterwarnings("ignore", category=DeprecationWarning)

fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

train_images_norm = train_images / 255.0
test_images_norm = test_images / 255.0
train_images_reshape = train_images.reshape([-1, 28, 28, 1])
test_images_reshape = test_images.reshape([-1, 28, 28, 1])

iris = load_iris()
data = iris.data
labels = iris.target

model = tf.keras.models.load_model('ConV_DT.h5')

representation_model = tf.keras.models.Model(inputs=model.input, outputs=model.get_layer('flatten').output)
flatten_output = representation_model.predict(train_images_reshape)
print(type(flatten_output))
print(flatten_output.shape)
print(flatten_output[0].shape)

df_1 = pd.DataFrame(flatten_output[:150, :])
df_2 = pd.DataFrame(data)

all_data = pd.concat([df_1, df_2], axis=1, join='outer')

print(all_data.values)
print('--------------')
print(all_data.shape)

这部分代码的输出为：

`python
1875/1875 [==============================] – 4s 1ms/step

(60000, 1600)
(1600,)
[[ 1.83051303e-02 -1.34976834e-01 -2.31863484e-02 … 3.50000000e+00
1.40000000e+00 2.00000000e-01]
[-6.31221123e+01 2.14652161e+02 -2.21633682e+01 … 3.00000000e+00
1.40000000e+00 2.00000000e-01]
[ 3.02642097e+01 2.99987674e-01 1.92712307e+00 … 3.20000000e+00
1.30000000e+00 2.00000000e-01]
…

[ 1.02550278e+02 2.27436676e+02 3.78363113e+01 … 3.00000000e+00
5.20000000e+00 2.00000000e+00]
[-5.90932703e+00 8.05619736e+01 -4.51921177e+00 … 3.40000000e+00
5.40000000e+00 2.30000000e+00]
[-1.93223495e+01 1.43665100e+02 -4.19176483e+01 … 3.00000000e+00
5.10000000e+00 1.80000000e+00]]

Original: https://blog.csdn.net/JaysonWong/article/details/126628707
Author: JaysonWong
Title: 利用CNN实现图像和数值数据融合

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688773/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

点云目标检测之CenterPoint配置过程

比较实用的c#小程序，小时钟 using System; using System.Collections.Generic; using System.ComponentModel…

人工智能 2023年6月2日
0098
历史最全GAN模型PyTorch代码实现整理分享

如果你是第一次接触AE自编码器和GAN生成对抗网络，那这将会是一个非常有用且效率的学习资源。所有的内容使用PyTorch编写，编写格式清晰，非常适合PyTorch新手作为学习资源。…

人工智能 2023年7月23日
0057
python3.9+pycharm2022+opencv库安装到解决无代码提示

文章目录前言一、openCV是什么二、使用步骤 * 1.安装python3.9（不要用最新的3.10版本，可能会有问题） 2.安装opencv开源库（这里最好用国内的镜像源）…

人工智能 2023年5月26日
0086
2022最新PyCharm安装教程（简单详细）

2022最新PyCharm安装教程（简单详细）一、PyCharm简介 PyCharm是一种Python IDE（Integrated Development Environmen…

人工智能 2023年7月4日
0069
HMM的个人理解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0086
Python基础：pip的安装与卸载

一、pip的安装： win+R出现一下界面然后输入cmd点击确定，出现以下界面，就可进行下载以下是两种下载方法 1、普通安装：pip install 模板名 2、指定版本安装：…

人工智能 2023年7月5日
0088
Black-Box Attacks on Sequential Recommenders via Data-Free ModelExtraction

摘要我们研究了模型提取是否可以用来”窃取”顺序推荐系统的权值，以及对此类攻击的受害者构成的潜在威胁。这种风险在图像和文本分类中引起了关注，但据我们所知，…

人工智能 2023年6月19日
0088
ViT理解

最近在阅读transformer的第一篇文章ViT，也作个笔记，供学习使用。希望阅读者有CNN的基础，如YOLO,MobileNets，ResNet等,不然读起来可能比较吃力。当然…

人工智能 2023年6月20日
0079
智能车中的PID控制

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月10日
0073
图像质量评估指标：SNR、PSNR、MSE和SSIM

一般进行图像噪声的评估手段有四种，分别是：信噪比(Signal to Noise Ratio,SNR) 峰值信噪比(Peak Signal to Noise Ratio, PSN…

人工智能 2023年5月26日
00101
Tensorflow 2.9.1安装笔记

CPU：i7-4790k 显卡：GTX2060 Cuda 版本：11.3 Cunn版本: 11.6 Python版本:3.7.7 不想用anacoda，直接装 tensorflow…

人工智能 2023年5月23日
0073
机器学习算法之贝叶斯算法 2、案例一：鸢尾花数据分类

贝叶斯原理是怎么来的呢？贝叶斯为了解决一个叫”逆向概率”问题写了一篇文章，尝试解答在没有太多可靠证据的情况下，怎样做出更符合数学逻辑的推测。什么是&#82…

人工智能 2023年7月3日
0069
优秀的 Verilog/FPGA开源项目介绍（二十五）- FPGA图像处理库

今天介绍几个和图像处理的项目，废话不多说，我们开始吧~ FPGA-Imaging-Library https://github.com/dtysky/FPGA-Imaging-Li…

人工智能 2023年6月18日
0083
yolov5训练失败总结

yolov5训练失败总结版本原因：在进行训练时，出现如下报错： UserWarning: Detected call of lr_scheduler.step() before…

人工智能 2023年7月23日
00111
PixelShuffle原理笔记（paper，pytorch实现）

pixel shuffer是一种图像上采样的方法，参考paper 它在Pytorch中的实现为 pixel_shuffle = torch.nn.PixelShuffle(r) o…

人工智能 2023年5月26日
00124
清晰明了的DataFrame行列处理

python里的东西都太过灵活，这篇文章是为了梳理一下DataFrame的提取行列操作。先定义以下DataFrame， df. import pandas as pd import…

人工智能 2023年7月7日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31