图片分类的入门：二分类

2023年7月2日上午4:18 • 人工智能 • 阅读 75

作为深度学习的入门，先来讲一下简单的猫狗分类。

深度学习：训练数据集，让计算机精准识别这个是猫还是狗。

猫狗识别：

1、数据预处理：准备训练集和测试集

2、卷积神经网络模型：构建网络架构

3、数据增强：图像数据增强方法与效果

4、迁移学习

在当前py文件所在位置创建一个data文件夹，里面放入train、test俩个子文件夹，train和test中放入收集到的猫和狗图片，注意图片大小要归一化，这里将其改为64*64。

#数据所在文件夹
base_dir = './data'
train_dir = os.path.join(base_dir,'train')
test_dir = os.path.join(base_dir,'test')
#训练集
train_cats_dir = os.path.join(train_dir,'cats')
train_dogs_dir = os.path.join(train_dir,'dogs')
#测试集
test_cats_dir = os.path.join(test_dir,'cats')
test_dogs_dir = os.path.join(test_dir,'dogs')

model = Sequential()
model.add(Conv2D(filters=6, kernel_size=(5, 5), padding='same', input_shape=（64，64，3）, activation='tanh'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(filters=16, kernel_size=(5, 5), padding='same', activation='tanh'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten()) #为全连接层准备，把特征图拉成一个向量
model.add(Dense(120, activation='tanh'))
model.add(Dense(84, activation='tanh'))
model.add(Dense(1, activation='sigmoid'))
sgd = SGD(lr=0.001, decay=1e-6, momentum=0.9, nesterov=True)

filiters:特征图的个数,filiters个不同的卷积核

kernel_size:卷积核尺寸

padding:填充,same保证输出特征图大小和输入相等

strides:步长，不写默认为1

输入model.summary()可以查看模型参数

卷积核的第三个维度和输入图像的第三个维度一致。

灰度图为1，RGB图像为3。

model.compile(optimizer=sgd, loss='binary_crossentropy', metrics=['accuracy'])

读入的数据自动转化为tensor(float32)格式，分别准备训练和测试。

图像数据归一化（0-1），这边类似为手写数据集的预处理。

train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)
train_generator = train_datagen.flow_from_directory(
        train_dir, #&#x6587;&#x4EF6;&#x5939;&#x8DEF;&#x5F84;
        target_size = (64,64), #&#x6307;&#x5B9A;resize&#x6210;&#x7684;&#x5927;&#x5C0F;
        batch_size = 32,
        class_mode='binary')
test_generator = test_datagen.flow_from_directory(
        test_dir, #&#x6587;&#x4EF6;&#x5939;&#x8DEF;&#x5F84;
        target_size = (64,64), #&#x6307;&#x5B9A;resize&#x6210;&#x7684;&#x5927;&#x5C0F;
        batch_size = 32,
        class_mode='binary')

图像生成器：告诉机器到哪里去一个batch一个batch的读取数据。

fit_generator相当于一个生成器，动态产生所需要的batch数据

steps_per_epoch相当于给定一个停止条件。

history = model.fit_generator(
      train_generator,
      step_per_epoch = 100,
      epoch = 20,
      test_data = test_generator,
      test_steps = 50,
      verbose=2)

当然也可以用softmax进行二分类，具体代码如下：

第一步：打标签，关于如何打标签，先看上一篇博文。

data = []
labels = []

拿到图像数据路径，方便后续读取
imagePaths = sorted(list(utils_paths.list_images('./dataset')))
random.seed(42)
random.shuffle(imagePaths)

遍历读取数据
for imagePath in imagePaths:
    # 读取图像数据
    image = cv2.imread(imagePath,1)  #读取灰度图像
    image = cv2.resize(image, (96, 96))
    data.append(image)
    # 读取标签
    label = imagePath.split(os.path.sep)[-2]  #文件路径的倒数第二个就是文件夹的名字被定义为标签
    labels.append(label)

对图像数据做scale操作
data = np.array(data, dtype="float") / 255.0
labels = np.array(labels)
print(labels)
数据集切分
(trainX, testX, trainY, testY) = train_test_split(data,labels, test_size=0.2, random_state=42)

from keras.utils import to_categorical
lb = LabelBinarizer()

trainY = lb.fit_transform(trainY)
trainY1 = to_categorical(trainY, 2)#修改
testY = lb.transform(testY)
testY1 = to_categorical(testY,2)

第二步，构建模型，和上文一致，这里不过多阐述了。

第三部，训练模型并输出相关评价指标。

from sklearn.metrics import precision_score,recall_score,f1_score,roc_auc_score,roc_curve,auc,plot_roc_curve
import numpy as np
from sklearn.metrics import accuracy_score

y_true = np.argmax(testY1, axis=1)
print(y_true)  #one-hot编码: 0表示为:10(两个状态位)
#y_true = list(np.concatenate(testY.reshape((-1, 1), order="F")))
y_pred1 = model.predict(testX)
print(y_pred1)
#y_pred = model.predict_classes(testX)
#y_pred = list(np.concatenate(y_pred.reshape((-1, 1), order="F")))
y_pred = np.argmax(y_pred1, axis=1)

print(y_true)
print(y_pred)

accuracy = accuracy_score(y_true, y_pred)
print('Accuracy: {}%'.format(accuracy * 100))
print('Error rate: {:.2f}%'.format((1 - accuracy) * 100))
#plot_roc_curve(y_true, y_probas)
#print('accuracy_score: {:.2f}'.format(accuracy_score(y_true, y_pred)))
print('precision_score: {:.2f}'.format(precision_score(y_true, y_pred)))
print('recall_score: {:.2f}'.format(recall_score(y_true, y_pred)))
print('f1_score: {:.2f}'.format(f1_score(y_true, y_pred)))

from sklearn.metrics import confusion_matrix
confusion_matrix(y_true, y_pred)
#print(np.confusion_matrix)
import seaborn as sn
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6),dpi=100)
sn.heatmap(confusion_matrix(y_true, y_pred), annot=True)
plt.show()

 绘制Roc
y_pred_keras = model.predict(testX)[:, 1]
#y_pred_keras = model.predict_proba(testX)[:, 1]
print(y_pred_keras.shape)
#y_pred_keras= [0.54, 0.567]
fpr, tpr, thresholds = roc_curve(y_true,y_pred_keras)
roc_auc = auc(fpr, tpr)
plt.title('Receiver Operating Characteristic')
plt.plot(fpr, tpr, '#9400D3',label=u'AUC = %0.3f'% roc_auc)

plt.legend(loc='lower right')
plt.plot([0,1],[0,1],'r--')
plt.xlim([-0.1,1.1])
plt.ylim([-0.1,1.1])
plt.ylabel('True Positive Rate')
plt.xlabel('False Positive Rate')
plt.grid(linestyle='-.')
plt.grid(True)
plt.show()
print(roc_auc)

PR曲线

y_pred_keras = y_pred1[:, 1]
print(y_pred1)
print(y_pred_keras)
import matplotlib.pyplot as plt
from sklearn.metrics import precision_recall_curve,auc
precision, recall, thresholds=precision_recall_curve(y_true, y_pred_keras)
pr_auc=auc(recall, precision)
plt.plot(precision, recall,'#9400D3', label=u'AUC = %0.4f' % pr_auc)
plt.legend(loc='lower left')
#plt.plot([1,0],[0,1],'r--')
plt.ylim([-0.1, 1.1])
plt.xlim([-0.1, 1.1])
plt.ylabel('Precision')
plt.xlabel('Recall')
plt.grid(linestyle='-.')
plt.grid(True)
plt.show()

print(auc(recall, precision))

DET

import matplotlib.pyplot as plt
fpr_det, fnr_det, thresholds_det = metrics.det_curve(y_true, y_pred_keras, pos_label=1)
#FAR(FPR)
plt.title('Detection Error Tradeoff')

#display = metrics.DetCurveDisplay(fpr=fpr_det, fnr=fnr_det)
#a= compute_eer(y_true, y_pred)
#print(a)

#display = metrics.DetCurveDisplay(fpr=fpr_det, fnr=fnr_det)
#display.plot()
plt.plot(fpr_det, fnr_det)

plt.legend(loc='lower right')   # 图例出现在左下角
#plt.plot([0, 1], [0, 1], 'r--')
#plt.xlim([0, 1])
#plt.ylim([0, 1])
plt.ylabel('False Rejection Rate')
plt.xlabel('False Acceptance Rate')
plt.grid(linestyle='-.')
plt.grid(True)
plt.show()

Original: https://blog.csdn.net/weixin_47357629/article/details/122124754
Author: 大家都要开心
Title: 图片分类的入门：二分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664690/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

End-to-End Object Detection with Transformers，DETR论文学习

End-to-End Object Detection with Transformers，DETR论文学习 1. 引言 2. 本论文发表前的目标检测策略(非端到端的目标检测策略)…

人工智能 2023年7月11日
0062
matlab函数变速不变调_音频调速变调工具：轻松调整语音节奏和声调高低

【问】常常看到有的视频解说是那么的流畅，自己也尝试着加速，但是发现欲速则不达，老是出错。那么有没有一种工具，在正常录音后，可以将语音节奏调快呢？这种工具是有的，向您推荐一款非常小…

人工智能 2023年5月27日
0086
深度学习参数初始化（一）Xavier初始化含代码

目录一、简介二、基础知识三、标准初始化方法四、Xavier初始化的假设条件五、Xavier初始化的简单的公式推导：六、Pytorch实现：七、对比实验 1.各层激活值…

人工智能 2023年7月20日
0086
已经安装了python如何与anaconda共存？

嗨害大家好鸭，我是小熊猫🖤 有小伙伴问我：只听过python，anaconda 是什么？？？今天就来给大家说一说，已经安装了python如何与anaconda共存？有什么p…

人工智能 2023年7月5日
0074
卷积神经网络模型之——VGG-16网络结构与代码实现

文章目录 VGGNet简介 VGG16网络结构使用pytorch搭建VGG16 * features classifier 完整代码 VGGNet简介 VGG原文：Very de…

人工智能 2023年6月16日
00101
计算机视觉项目实战-图像特征检测harris、sift、特征匹配

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉pyt…

人工智能 2023年7月6日
0059
毕业设计记录-yolov5训练自己的数据集全过程（从数据集标注到最后的图片测试）

文章目录 * – 1、标注数据集 – 2、训练前数据集的准备工作 – 3、修改训练相关的代码 – 4、用训练好的权重来测试 2022…

人工智能 2023年7月23日
00105
数据建模初入门笔记

前言：鄙人搞开发和安全的，对这个数据建模有点兴趣。也是第一次参加，然后的话这里面涉及模型的训练。但是预测模型都是组合调参，不会太涉及改网络啥的。着重点是在分析参数以及找到合适…

人工智能 2023年7月18日
0050
ROS2知识：编译系统ament_cmake

在ros1的编译系统为catkin_make;为了在ros2与ros1进行区分，这里用名称为ament_cmake其意义都是编译操作。本文阐述其应用的规则和注意点。 1）是ROS …

人工智能 2023年6月1日
0047
python -m详解

温馨提示：本篇演示环境是 Python 3.8 先 python –help看下 python -m参数的解释： -m mod : run library module as …

人工智能 2023年7月6日
00211
上海亚商投顾：沪指放量涨1.69% 房地产板块掀涨停潮

上海亚商投顾前言：无惧大盘大跌，解密龙虎榜资金，跟踪一线游资和机构资金动向，识别短期热点和强势个股。 *市场情绪三大股指早间高开后震荡回落，午后又再度拉升，沪指一度站上3100…

人工智能 2023年6月28日
0081
《自然语言处理入门》笔记

目录第一章新手上路 1.1自然语言与编程语言 1.1.1词汇量 1.1.2结构化 1.1.3歧义性 1.1.4容错性 1.1.5易变性 1.1.6简略性 1.2自然语言处理的层…

• 2023年5月30日
00132
高斯过程回归python_GPR(高斯过程回归)详细推导

GPR(高斯过程回归)详细推导一、综述 GPR来源于线性模型，有两种方式可以推导出GPR，一种是weight space view,另外一种是function space vie…

人工智能 2023年6月17日
00142
K-Means(K均值聚类)原理及代码实现

机器学习没有免费午餐定理和三大机器学习任务如何对模型进行评估K-Means(K均值聚类)原理及代码实现KNN(K最近邻算法)原理及代码实现KMeans和KNN的联合演习文章目录…

人工智能 2023年5月31日
00115
Introducing TensorFlow Similarity

tensorflow_similarity Metric LearningContrastive LearningFast Approximate Nearest Neighbor…

人工智能 2023年5月26日
0070
pywinauto

pywinauto （仅作为个人笔记，如有雷同，请联系删除。。） == Pywinauto==是基于Python开发的，用于自动化测试的脚本模块，主要操作于Windows标准图形界…

人工智能 2023年7月4日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

图片分类的入门：二分类

大家都在看