CIFAR-10 数据集简介

2023年7月1日下午12:06 • 人工智能 • 阅读 95

复现代码的过程中，简单了解了作者使用的数据集CIFAR-10 dataset ，简单记录一下。
CIFAR-10数据集是8000万微小图片的标签子集，它的收集者是：Alex Krizhevsky, Vinod Nair, Geoffrey Hinton。

数据集由6万张3232的彩色图片组成，一共有10个类别。每个类别6000张图片。其中有5万张训练图片及1万张测试图片。
数据集被划分为5个训练块和1个测试块，每个块1万张图片。
测试块包含了1000张从每个类别中随机选择的图片。训练块包含随机的剩余图像，但某些训练块可能对于一个类别的包含多于其他类别，训练块包含来自各个类别的5000张图片。
这些类是完全互斥的，及在一个类别中出现的图片不会出现在其它类中。
数据集版本
作者提供了3个版本的数据集：python version; Matlab version; binary version。
可根据自己的需求选择。
数据集下载地址：下载链接
数据集布置*
以python version进行介绍，Matlab version与之相同。
下载后获得文件 data_batch_1, data_batch_2,…, data_batch_5。测试块相同。这些文件中的每一个都是用cPickle生成的python pickled对象。
具体使用方法：

def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='bytes')
    return dict

返回字典类，每个块的文件包含一个字典类，包含以下元素：
data: 一个10000 _3072的numpy数组（unit8）每个行存储32_32的彩色图片，3072=1024*3，分别是red, green, blue。存储方式以行为主。
labels:使用0-9进行索引。
数据集包含的另一个文件batches.meta同样包含python字典，用于加载label_names。如：label_names[0] == “airplane”, label_names[1] == “automobile”

Original: https://blog.csdn.net/weix1235/article/details/121593603
Author: weix1235
Title: CIFAR-10 数据集简介

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663323/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

「认识AI：人工智能如何赋能商业」【18】感知机

作者 | Harper 审核 | gongyouliu 编辑 | auroral-L 了解感知机上期带大家了解了人工神经网络的内容，本期给大家介绍一下感知机的概念。人工神经神经网…

人工智能 2023年7月14日
0064
对接抖音开发之售后消息实时通知订单部分退款

目录前言一、抖音开发中的售后消息二、抖音运营反馈的业务需求分析三、整体的业务开发思路四、售后消息的代码开发 1.售后消息的使用 2.实时保存抖音平台过来的售后消息 3.具…

人工智能 2023年6月29日
00135
Pandas案例1

import pandas as pd In [2]: #创建DataFrame pd.Series(data=[12,2,3]) pd.Series(data=[12,2,3],…

人工智能 2023年7月6日
0070
Informer讲解PPT介绍【超详细】–AAAI 2021最佳论文：比Transformer更有效的长时间序列预测

文章目录 Abstract 一. informer重温讲解PPT简洁【超详细】 * 1.1 title 1.2 Background 1.3 LSTF 问题的提出 1.4 Tran…

人工智能 2023年6月16日
0076
时序动作定位 | I3D(Inflated 3D ConvNet) 与 UNT(UntrimmedNets) 特征模型

UNT(UntrimmedNets) I3D(Inflated 3D ConvNet) 全名《UntrimmedNets for Weakly Supervised Action …

人工智能 2023年5月28日
0086
yolov3 MNN框架部署C++版

一、模型转换： 1.训练的模型格式：https://github.com/AlexeyAB/darknet/ darknet训练出来的weights 2.将训练时的.cfg文件和训…

人工智能 2023年7月10日
0088
CUDA(C)和PyCUDA(Python) GPU加速OpenCV视觉

CUDA 本节介绍一个简单的加法程序，该程序在设备上执行两个变量的加法。虽然它没有利用设备的任何数据并行性，但它对于演示 CUDA C 的重要编程概念非常有用。首先，我们将看到如…

人工智能 2023年7月19日
0049
机器学习（六）——正则化

我们之前在机器学习（二）——线性回归和机器学习（五）——逻辑回归中分别介绍了线性回归算法和逻辑回归算法，并尝试训练我们自己的预测模型。但是有时我们的模型会遇到过拟合的问题，从而…

人工智能 2023年6月17日
0094
【小刀试牛】构建TF-IDF矩阵，进行简单文本分类

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月16日
0066
PyTorch：梯度计算之反向传播函数backward()

一、计算图计算图，是一种用来描述计算的有向无环图。我们假设一个计算过程，其中X 1 \mathbf{X_1}X 1 、W 1 \mathbf{W_1}W 1 、W 2 \m…

人工智能 2023年7月21日
0066
轻松入门自然语言处理系列 05 机器学习基础

文章目录前言一、理解朴素贝叶斯 * 1.初试朴素贝叶斯 2.朴素贝叶斯核心思想 3.朴素贝叶斯的应用：垃圾邮件分类二、朴素贝叶斯的训练 * 1.计算单词的概率 2.利用计算好…

人工智能 2023年5月28日
00103
[Tool] Git 使用与 Git Flow

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月27日
00101
基于R语言的聚类分析

系统聚类法目录系统聚类法 1.最小距离法计算公式 2.最长距离法计算公式 3.最小距离法最小距离法聚类分析运行结果结果分析 4.最大距离法最大距离法聚类分析运行结果结果…

人工智能 2023年6月2日
0093
语音相似度_得助智能：语音识别的原理是怎样的呢？

1、语音识别实现原理：数据库一般来说，语音识别的原理并不难理解，原理与指纹识别相同：设备采集目标语音，然后对采集的语音进行一系列处理，得到目标语音的特征信息。然后让特征信息与数据…

人工智能 2023年5月27日
0082
【三维目标检测】VoxelNet（一）：crop.py详解

本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为”https://blog.csdn.net/suiying…

人工智能 2023年6月17日
0069
Spring ,Spring MVC,Spring Boot

Spring框架 Spring框架的作用 Spring 框架主要解决了创建对象,管理对象的问题 Spring 框架的依赖项当项目中需要使用Spring框架时,需要添加依赖项是: …

人工智能 2023年6月27日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

CIFAR-10 数据集简介

大家都在看