深度学习常用数据集介绍与下载(附网盘链接)

摘要:这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类、目标检测及人脸识别任务,对每个数据集给出了简要介绍、官网下载网站以及公众号获取的关键字。因为有的数据集较大,官网的下载速度可能比较慢,为了方便大家管理,这里我将其整理到了个人公众号平台中,可通过下方卡片”AI技术研究与分享”关注,并在后台回复各数据集关键字即可获取网盘链接。数据集文件均为官方网站下载,仅用于学习交流,博主会持续更新,欢迎关注。

  1. 分类数据集

数据集:MNIST

手写数字数据集,包含一组60,000个示例的训练集和一组10,000个示例的测试集。
官网地址:MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
关键字(建议复制):Face-Place

数据集:CIFAR-10

包含了10个类别的60,000个图像(每个类在上图中表示为一行)。总共有50,000个训练图像和10,000个测试图像。

官网地址:CIFAR-10 and CIFAR-100 datasets
关键字(建议复制):CIFAR-10

数据集:Fashion-MNIST

包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。
官网地址:GitHub – zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark
关键字(建议复制):fashion-mnist

数据集:Imagenet

Imagenet数据集有1400多万幅图片,涵盖2万多个类别,关于图像分类、定位、检测等研究工作大多基于此数据集展开。
官网地址:http://www.image-net.org/about-stats
关键字(建议复制):ImageNet

  1. 目标检测数据集

数据集:MS-COCO

COCO是一个规模大且丰富的物体检测,分割和字幕数据集。330K图像,80个物体类别,每幅图像5个字幕,250,000个有关键点的人。
官网地址:COCO – Common Objects in Context
关键字(建议复制):MS-COCO

数据集:PASCAL-VOC

PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统,包括20个目录。
官网地址:The PASCAL Visual Object Classes Homepage
关键字(建议复制):PASCAL-VOC

数据集:BDD100K

自动驾驶常用大型多样化数据集,标注超过100,000张图像,类别包含公共汽车,行人,自行车,卡车,小汽车,火车和骑手等,用于目标检测、全帧分割等。
官网地址:Berkeley DeepDrive
关键字(建议复制):BDD-100K

数据集:Open-Images

Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。
官网地址:Open Images V6
关键字(建议复制):Open-Images

  1. 人脸识别数据集

数据集:CASIA-WebFace

包含了10575 个人的494414 张图像。CASIA-webface数据库,里面包含了10000个人,一共50万张人脸图片,均来源于网络。
官网地址:NameBright – Coming Soon
关键字(建议复制):CASIA-WebFace

数据集:PubFig

哥伦比亚大学的公众人物脸部数据集,包含有200个人的58k+人脸图像,主要用于非限制场景下的人脸识别。
官网地址:Pubfig: Public Figures Face Database
关键字(建议复制):PubFig

数据集:CelebA

香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片,人脸属性有40多种,主要用于人脸属性的识别。
官网地址:CelebA Dataset
关键字(建议复制):CelebA

数据集:ColorFeret

包括了一个通用人脸库以及通用测试标准,它已经包含了1000多人的10000多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。
官网地址:color FERET Database | NIST
关键字(建议复制):ColorFeret

数据集:MTFL

该数据集包含了将近13000张人脸图片,均采自网络。
官网地址:Facial Landmark Detection by Deep Multi-task Learning
关键字(建议复制):MTFL

数据集:FaceDB

包含了1521幅分辨率为384×286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。
官网地址:BioID Face Database | Face Detection Dataset | facedb – BioID
关键字(建议复制):FaceDB

数据集:LFW

为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。
官网地址:http://vis-www.cs.umass.edu/lfw/
关键字(建议复制):LFW

数据集:Person identification in TV series

该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。
官网地址:Semi-supervised Learning with Constraints for Person Identification in Multimedia Data
关键字(建议复制):PITVS

数据集:CMUVASC-PIE

CMU PIE人脸库建立于2000年11月,它包括来自68个人的40000张照片,其中包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片。
官网地址:http://vasc.ri.cmu.edu/idb/html/face/index.html
关键字(建议复制):CMUVASC-PIE

数据集:CASIA-FaceV5

该数据集包含了来自500个人的2500张亚洲人脸图片。
官网地址:http://biometrics.idealtest.org/dbDetailForUser.do?id=9
关键字(建议复制):CASIA-FaceV5

数据集:The CNBC Face Database

该数据集采集了200个人在不同状态下(不同的神情,装扮,发型等)的人脸照片。
官网地址:http://wiki.cnbc.cmu.edu/Face_Place
关键字(建议复制):Face-Place

数据集:IMDB-WIKI

IMDB-WIKI人脸数据库总共523,051张人脸数据库,每张图片都被标注了人的年龄和性别,对于年龄识别和性别识别的研究有着重要的意义。
官网地址:IMDB-WIKI – 500k+ face images with age and gender labels
关键字(建议复制):IMDB-WIKI

数据集:FDDB

FDDB是UMass的数据集,被用来做人脸检测(Face Detection)。这个数据集比较大,比较有挑战性。
官网地址:http://vis-www.cs.umass.edu/fddb/index.html
关键字(建议复制):FDDB

数据集:Caltech-10K-WebFaces

10k+人脸,提供双眼和嘴巴的坐标位置。
官网地址:ttp://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description
关键字(建议复制):Caltech-10K

数据集:JAFFE

该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像,10个人,全部都是女性,每个人做出7种表情。
官网地址:The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo
关键字(建议复制):JAFFE

数据集:AFLW

前2000个AFLW样本的拟合3D面,可用于3D面对齐评估。
官网地址:http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm
关键字(建议复制):AFLW

数据集文件均为官方网站下载,仅用于学习交流,博主会持续更新,欢迎关注。

更多分享,敬请期待!

Original: https://www.cnblogs.com/sixuwuxian/p/16756252.html
Author: 思绪无限
Title: 深度学习常用数据集介绍与下载(附网盘链接)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/807458/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球