IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    [原]MNIST集的数据格式

    caimouse发表于 2017-03-09 20:14:52
    love 0
    MNIST数据集的文件格式
    本数据集采用非常简单的方式来保存,就像数组和多维矩阵一样储存。本数据集的文件里按整数保存的数字,都是按MSB优先的方式保存,也叫大端模式,也可以叫做非INTEL处理器的保存格式,
    因为INTEL的CPU是采用小端模式保存数据,因此在INTEL的CPU平台里读取,需要自行调换字节的顺序,才可以正确地读取它的整数。
    主要包括下面四个文件:


    train-images-idx3-ubyte: 训练集合  图片数据
    train-labels-idx1-ubyte: 训练集合  标签数据
    t10k-images-idx3-ubyte:  测试集合  图片数据
    t10k-labels-idx1-ubyte:  测试集合  标签数据
    训练集合包含了60000个例子,测试集合包含了10000个例了,测试集合的前5000个是取自NIST的训练集合,最后5000个是取自NIST的测试集合,
    前5000个比较清楚,后面5000个比较模糊。
    训练集合的标签文件格式(train-labels-idx1-ubyte):


    [偏移]   [数据类型]          [值]          [描述] 
    0000     32位整数        0x00000801(2049) 魔数ID (MSB优先,大端模式) 
    0004     32位整数        60000            后面共有多少项标签 
    0008     无符号字节      ??               标签 
    0009     无符号字节      ??               标签 
    ........ 
    xxxx     无符号字节      ??               标签
    标签的值是 0 到 9.


    训练集合的图像文件集合(train-images-idx3-ubyte):


    [偏移]  [数据类型]          [值]          [描述] 
    0000     32位整数        0x00000803(2051) 魔数ID (MSB优先,大端模式) 
    0004     32位整数        60000            后面共有多少个图片 
    0008     32位整数        28               图片有多少列像素 
    0012     32位整数        28               图片有多少行像素 
    0016     无符号字节      ??               像素 
    0017     无符号字节      ??               像素 
    ........ 
    xxxx     无符号字节      ??               像素

    像素是列优先,像素的值是从0到255范围,0表示背景白色,255表示前景黑色.


    http://yann.lecun.com/exdb/mnist/


    1. TensorFlow入门基本教程

    http://edu.csdn.net/course/detail/4369

    2. C++标准模板库从入门到精通 

    http://edu.csdn.net/course/detail/3324

    3.跟老菜鸟学C++

    http://edu.csdn.net/course/detail/2901

    4. 跟老菜鸟学python

    http://edu.csdn.net/course/detail/2592

    5. 在VC2015里学会使用tinyxml库

    http://edu.csdn.net/course/detail/2590

    6. 在Windows下SVN的版本管理与实战 

     http://edu.csdn.net/course/detail/2579

    7.Visual Studio 2015开发C++程序的基本使用 

    http://edu.csdn.net/course/detail/2570

    8.在VC2015里使用protobuf协议

    http://edu.csdn.net/course/detail/2582

    9.在VC2015里学会使用MySQL数据库

    http://edu.csdn.net/course/detail/2672



沪ICP备19023445号-2号
友情链接