TensorFlow学习系列(三):实例数据下载和读取

1.mnist 数据

提供了一个.py文件用于下载mnist数据:

import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

执行完成后,会在当前目录下新建一个文件夹,下载的数据会放在这个文件夹中。下载的四个文件是:

文件会调用一个函数来保证数据下载成功。此函数还将确定数据是否已下载。如果已经下载,则不会再次下载。

下载的数据集分为三个子集:5.5W行训练数据集(mnist.train)、5K行验证数据集(mnist.)和1W行数据集测试数据集(mnist.test)。因为每张图片都是 28×28 的黑白图片,所以每一行都是一个 784 维的向量。

每个子集由两部分组成:图片部分()和标签部分(),我们可以使用如下代码查看:

print mnist.train.images.shape
print mnist.train.labels.shape
print mnist.validation.images.shape
print mnist.validation.labels.shape
print mnist.test.images.shape
print mnist.test.labels.shape

如果要查看具体数值,可以将这些数据提取为变量进行查看,如:

train_data = mnist.train.images
train_label = mnist.train.labels
val_data = mnist.validation.images
val_label = mnist.validation.labels
test_data = mnist.test.images
test_label = mnist.test.labels
print train_data,train_label
print val_data,val_label
print test_data,test_label

2.CSV 数据

p>

除了mnist手写字体图片数据,tf还提供了几个csv数据供大家练习,存储路径为:

/root/anaconda2/lib/python2.7/site-packages/tensorflow/contrib/learn/python/learn/datasets/data/text_train.csv

如果你想读出这些数据,可用代码:

import tensorflow.contrib.learn.python.learn.datasets.base as base
iris_data,iris_label=base.load_iris()
house_data,house_label=base.load_boston()

前者是鸢尾花数据集,后者是波士顿房价数据。

3.数据

tf 提供了下载和读取数据的函数,我们可以直接调用它。执行以下代码:

import tensorflow.models.image.cifar10.cifar10 as cifar10
cifar10.maybe_download_and_extract()
images, labels = cifar10.distorted_inputs()
print images
print labels

您可以下载阅读。

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片