使用TensorFlow训练图像分类模型的指南

PHPz

发布时间：2023-04-13 17:13:03

1460人浏览过

来源于51CTO.COM

转载

译者 | 陈峻

审校 | 孙淑娟

众所周知，人类在很小的时候就学会了识别和标记自己所看到的事物。如今，随着机器学习和深度学习算法的不断迭代，计算机已经能够以非常高的精度，对捕获到的图像进行大规模的分类了。目前，此类先进算法的应用场景已经涵括到了包括：解读肺部扫描影像是否健康，通过移动设备进行面部识别，以及为零售商区分不同的消费对象类型等领域。

下面，我将和您共同探讨计算机视觉（Computer Vision）的一种应用——图像分类，并逐步展示如何使用TensorFlow，在小型图像数据集上进行模型的训练。

1、数据集和目标

在本示例中，我们将使用MNIST数据集的从0到9的数字图像。其形态如下图所示：

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

我们训练该模型的目的是为了将图像分类到其各自的标签下，即：它们在上图中各自对应的数字处。通常，深度神经网络架构会提供一个输入、一个输出、两个隐藏层（Hidden Layers）和一个用于训练模型的Dropout层。而CNN或卷积神经网络（Convolutional Neural Network）是识别较大图像的首选，它能够在减少输入量的同时，捕获到相关的信息。

2、准备工作

首先，让我们通过TensorFlow、to_categorical（用于将数字类的值转换为其他类别）、Sequential、Flatten、Dense、以及用于构建神经网络架构的 Dropout，来导入所有相关的代码库。您可能会对此处提及的部分代码库略感陌生。我会在下文中对它们进行详细的解释。

3、超参数

我将通过如下方面，来选择正确的超参数集：
首先，让我们定义一些超参数作为起点。后续，您可以针对不同的需求，对其进行调整。在此，我选择了128作为较小的批量尺寸（batch size）。其实，批量尺寸可以取任何值，但是2的幂次方大小往往能够提高内存的效率，因此应作为首选。值得注意的是，在决定合适的批量尺寸时，其背后的主要参考依据是：过小的批量尺寸会使收敛过于繁琐，而过大的批量尺寸则可能并不适合您的计算机内存。
让我们将epoch（训练集中每一个样本都参与一次训练）的数量保持为50 ，以实现对模型的快速训练。epoch数值越低，越适合小而简单的数据集。
接着，您需要添加隐藏层。在此，我为每个隐藏层都保留了128个神经元。当然，你也可以用64和32个神经元进行测试。就本例而言，像MINST这样的简单数据集，我并不建议使用较高的数值。
您可以尝试不同的学习率（learning rate），例如0.01、0.05和0.1。在本例中，我将其保持为0.01。
对于其他超参数，我将衰减步骤（decay steps）和衰减率（decay rate）分别选择为2000和0.9。而随着训练的进行，它们可以被用来降低学习率。
在此，我选择Adamax作为优化器。当然，您也可以选择诸如Adam、RMSProp、SGD等其他优化器。

import tensorflow as tf
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Flatten, Dense, Dropout
params = {
'dropout': 0.25,
'batch-size': 128,
'epochs': 50,
'layer-1-size': 128,
'layer-2-size': 128,
'initial-lr': 0.01,
'decay-steps': 2000,
'decay-rate': 0.9,
'optimizer': 'adamax'
}
mnist = tf.keras.datasets.mnist
num_class = 10
# split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# reshape and normalize the data
x_train = x_train.reshape(60000, 784).astype("float32")/255
x_test = x_test.reshape(10000, 784).astype("float32")/255
# convert class vectors to binary class matrices
y_train = to_categorical(y_train, num_class)
y_test = to_categorical(y_test, num_class)

4、创建训练和测试集

由于TensorFlow库也包括了MNIST数据集，因此您可以通过调用对象上的 datasets.mnist ，再调用load_data() 的方法，来分别获取训练（60,000个样本）和测试（10,000个样本）的数据集。

接着，您需要对训练和测试的图像进行整形和归一化。其中，归一化会将图像的像素强度限制在0和1之间。

最后，我们使用之前已导入的to_categorical 方法，将训练和测试标签转换为已分类标签。这对于向TensorFlow框架传达输出的标签（即：0到9）为类（class），而不是数字类型，是非常重要的。

5、设计神经网络架构

下面，让我们来了解如何在细节上设计神经网络架构。

我们通过添加Flatten ，将2D图像矩阵转换为向量，以定义DNN（深度神经网络）的结构。输入的神经元在此处对应向量中的数字。

接着，我使用Dense() 方法，添加两个隐藏的密集层，并从之前已定义的“params”字典中提取各项超参数。我们可以将“relu”（Rectified Linear Unit）作为这些层的激活函数。它是神经网络隐藏层中最常用的激活函数之一。

诚客在线考试平台管理系统

诚客在线考试是由南宁诚客网络科技有限公司开发的一款手机移动端的答题网站软件，它应用广泛适合各种学校、培训班、教育机构、公司企业、事业单位、各种社会团体、银行证券等用于学生学习刷题、员工内部培训，学员考核、员工对公司制度政策的学习……可使用的题型有：单选题、多选题、判断题支持文字，图片，音频，视频、数学公式。可以设置考试时间，答题时间，考试次数，是否需要补考，是否可以看到自己成绩。练习模式，支持学生

下载

然后，我们使用Dropout方法添加Dropout层。它将被用于在训练神经网络时，避免出现过拟合（overfitting）。毕竟，过度拟合模型倾向于准确地记住训练集，并且无法泛化那些不可见（unseen）的数据集。

输出层是我们网络中的最后一层，它是使用Dense() 方法来定义的。需要注意的是，输出层有10个神经元，这对应于类（数字）的数量。

# Model Definition
# Get parameters from logged hyperparameters
model = Sequential([
Flatten(input_shape=(784, )),
Dense(params('layer-1-size'), activatinotallow='relu'),
Dense(params('layer-2-size'), activatinotallow='relu'),
Dropout(params('dropout')),
Dense(10)
])
lr_schedule =
tf.keras.optimizers.schedules.ExponentialDecay(
initial_learning_rate=experiment.get_parameter('initial-lr'),
decay_steps=experiment.get_parameter('decay-steps'),
decay_rate=experiment.get_parameter('decay-rate')
)
loss_fn = tf.keras.losses.CategoricalCrossentropy(from_logits=True)
model.compile(optimizer='adamax',
loss=loss_fn,
metrics=['accuracy'])
model.fit(x_train, y_train,
batch_size=experiment.get_parameter('batch-size'),
epochs=experiment.get_parameter('epochs'),
validation_data=(x_test, y_test),)
score = model.evaluate(x_test, y_test)
# Log Model
model.save('tf-mnist-comet.h5')