Tensorflow(2.0+) 对五类医学图像进行分类

2023年5月24日下午6:03 • 人工智能 • 阅读 75

文章目录

前言
一，导入 TensorFlow 和其他库
二，加载并探索数据集
*
–
三，创建数据集
*
–
四，创建模型
*
–
总结

前言

本文主要用于学习记录，可能会存在些许错误，望读者谅解：

随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了使用Tensorflow对五类医学图像进行分类模型的训练。

一，导入 TensorFlow 和其他库

import matplotlib.pyplot as plt
import numpy as np
import PIL
import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential

二，加载并探索数据集

1，浏览数据集

2，加载图像的路径

import pathlib
data_dir = r'D:\virtual_desk\others\5类医学图像'
data_dir = pathlib.Path(data_dir)

3，可视化一些图像

image_count = len(list(data_dir.glob('*/*.jpeg')))
print(image_count)

腹部图像可视化

PIL.Image.open(str(腹部CT[0]))

脑部图像可视化

脑部CT = list(data_dir.glob('脑部CT/*'))
PIL.Image.open(str(脑部CT[0]))

三，创建数据集

1，为加载器定义一些参数：

batch_size = 32
img_height = 90
img_width = 90

2，在开发模型时，我们使用 80% 的图像进行训练，使用 20% 的图像进行验证。

train_ds = tf.keras.utils.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="training",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)

val_ds = tf.keras.utils.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="validation",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)

class_names您可以在这些数据集的属性中找到类名。这些对应于按字母顺序排列的目录名称。

class_names = train_ds.class_names
print(class_names)

3，可视化数据

以下是训练数据集中的前九幅图像：

[En]

Here are the first nine images in the training dataset:

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']

plt.figure(figsize=(10, 10))
for images, labels in train_ds.take(1):
  for i in range(9):
    ax = plt.subplot(3, 3, i + 1)
    plt.imshow(images[i].numpy().astype("uint8"))
    plt.title(class_names[labels[i]])
    plt.axis("off")

结果：

4，我将使用这些数据集训练模型，稍后将它们传递给它们Model.fit

for image_batch, labels_batch in train_ds:
  print(image_batch.shape)
  print(labels_batch.shape)
  break

结果:

image_batch是形状的张量(32, 90, 90, 3)。这是一批 32 张形状的图像90x90x3（最后一个维度是指颜色通道 RGB）。label_batch是 shape 的张量，(32,)这些是 32 幅图像的对应标签。

5，配置数据集以提高性能

AUTOTUNE = tf.data.AUTOTUNE
train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

6，标准化数据

normalization_layer = layers.Rescaling(1./255)
normalized_ds = train_ds.map(lambda x, y: (normalization_layer(x), y))
image_batch, labels_batch = next(iter(normalized_ds))
first_image = image_batch[0]

print(np.min(first_image), np.max(first_image))

结果：

四，创建模型

1，Sequential模型

num_classes = len(class_names)

model = Sequential([
  layers.Rescaling(1./255, input_shape=(img_height, img_width, 3)),
  layers.Conv2D(16, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Conv2D(32, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Conv2D(64, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Flatten(),
  layers.Dense(128, activation='relu'),
  layers.Dense(num_classes)
])

Sequential模型由三个卷积块组成，每个块中tf.keras.layers.Conv2D都有一个最大池化层 ( tf.keras.layers.MaxPooling2D)。有一个全连接层 ( tf.keras.layers.Dense)，其顶部有 128 个单元，由 ReLU 激活函数 ( ‘relu’) 激活.

2，编译模型

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

3，型号汇总

model.summary()

结果：

4，训练模型

epochs=10
history = model.fit(
  train_ds,
  validation_data=val_ds,
  epochs=epochs
)

结果：

从训练集和验证集可以看出，该模型在验证集和测试的准确率高达99.9%，不存在过拟合的情况，也不需要再使用数据增强或dropout等方法了。

5，可视化训练结果

acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

loss = history.history['loss']
val_loss = history.history['val_loss']

epochs_range = range(epochs)

plt.figure(figsize=(8, 8))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

结果：

在训练集和验证集上创建损失图和准确度图：

[En]

Create loss and accuracy diagrams on training sets and verification sets:

6，预测新数据

腹部CT_path = r"D:\virtual_desk\others\5类医学图像\腹部CT\000000.jpeg"

img = tf.keras.utils.load_img(
    腹部CT_path, target_size=(img_height, img_width)
)
img_array = tf.keras.utils.img_to_array(img)
img_array = tf.expand_dims(img_array, 0)

predictions = model.predict(img_array)
score = tf.nn.softmax(predictions[0])

print(
    "This image most likely belongs to {} with a {:.2f} percent confidence."
    .format(class_names[np.argmax(score)], 100 * np.max(score))
)

结果：

总结

通过对图片分类可以学到
1，有效地从磁盘加载数据集。
2，检查和理解数据
3，构建输入管道
4，建立模型
5，训练模型
6，测试模型

Original: https://blog.csdn.net/hjc000712/article/details/123941403
Author: 冰橙雪梨
Title: Tensorflow(2.0+) 对五类医学图像进行分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/508641/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV-迷宫解密

一、你能自己走出迷宫吗？如下图所示，可以看到是一张较为复杂的迷宫图，相信也有人尝试过自己一点一点的找出口，但我们肉眼来解谜恐怕眼睛有点小难受，特别是走了半天发现这迷宫无解，代入一…

人工智能 2023年7月19日
0046
BERTopic：NLP主题模型的未来！

文| ZenMoore编| 小轶以前我一直以为，主题建模(提取文档的主题词)这种机器学习时代就开始研究的基础工具，现在肯定已经到头了，虽然…有时效果可能不是那么让人满…

人工智能 2023年7月27日
0087
Pytorch中的学习率调整方法

在梯度下降更新参数的时，我们往往需要定义一个学习率来控制参数更新的步幅大小，常用的学习率有0.01、0.001以及0.0001等，学习率越大则参数更新越大。一般来说，我们希望在训…

人工智能 2023年7月20日
0097
python DataFrame的stack()方法，unstack()方法，pivot()方法

文章目录 1.stack() 2. unstack() 3. pivot() ; 1.stack() stack()用于将列索引转换为最内层的行索引，这样叙述比较抽象，看示例就容易…

人工智能 2023年7月7日
0070
Ubuntu安装TensorFlow详细过程

一、准备工作虚拟机：Vmware Workstation 16 Pro（至少需要Windows10才能支持）操作系统：Ubuntu-20.04.2.0 二、安装Anaconda …

人工智能 2023年5月23日
0063
从0到1项目搭建-框架搭建(附源码)

前言大家好，本文是基于 SpringBoot 从0搭建一个企业级开发项目，基于SpringBoot 的项目，并集成MyBatis-Plus、Druid、Logback 等主流技术…

人工智能 2023年7月31日
0059
【阅读笔记】Deep Brownian Distance Covariance for Few-Shot Classification

Abstract 少样本分类是一个具有挑战性的问题，因为每个新任务只提供很少的训练示例。解决这一挑战的有效研究路线之一集中在学习由查询图像和某些类别的少数支持图像之间的相似性度量驱…

人工智能 2023年5月28日
0086
python中plt.imshow与cv2.imshow显示图像颜色错误的问题（避坑）

最近调试程序的时候，发现显示不正常，纳闷了很久，来回测试，终于发现问题，希望大家别再入坑了。在用plt.imshow和cv2.imshow显示同一幅图时可能会出现颜色差别很大的现…

人工智能 2023年6月20日
0066
Tesseract-OCR 下载安装和使用

7.完成安装 ; 四、设置环境变量 1.设置环境变量进入环境变量中，在path中新建tesseract的安装路径使用win+r弹出”运行”命令框，输入sy…

人工智能 2023年7月21日
0084
ViT论文逐段精读【论文精读】-跟李沐学AI

视频链接：ViT论文逐段精读【论文精读】_哔哩哔哩_bilibili ViT：过去一年，CV 最有影响力的工作推翻了 2012 Alexnet 提出的 CNN 在 CV 的统治地…

人工智能 2023年5月27日
0074
超详细的Python matplotlib 绘制直方图赶紧收藏

经过前面对 matplotlib 模块从底层架构、基本绘制步骤等学习，我们已经学习了折线图、柱状图的绘制方法。在分析数据的时候，我们会根据数据的特点来选择对应图表来展示，需要表示…

人工智能 2023年7月5日
0057
论文阅读_DeepWalk

介绍英文题目：DeepWalk: Online Learning of Social Representations中文题目：DeepWalk：关系表征的在线学习论文地址：htt…

人工智能 2023年7月14日
0061
AUC 评价指标详解，准确率（ACC），敏感性（sensitivity），特异性（specificity）计算 Python3【TensorFlow2入门手册】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月23日
0082
机翻《C-CAM: Causal CAM for Weakly Supervised Semantic Segmentation onMedical Image 》

前言《C-CAM: Causal CAM for Weakly Supervised Semantic Segmentation onMedical Image》CVPR2022…

人工智能 2023年6月17日
0090
OpenCV图像处理学习十四，图像阈值处理操作threshold（）以及全局阈值和自适应阈值处理应用

一.阈值的概念简单点说，阈值是把图像分割的标尺，为了从一副图像中提取出我们需要的部分，应该用图像中的每一个像素点的灰度值与选取的阈值进行比较，并作出相应的判断。阈值的选取依赖于具…

人工智能 2023年6月19日
0099
【Python】2020年美国新冠肺炎疫情数据分析

2020年美国新冠肺炎疫情数据分析 * – 一、需求描述 – 二、环境介绍 – 三、数据来源描述 – 四、数据上传及上传结果…

人工智能 2023年6月11日
00186

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31