模型架构
|
- import tensorflow as tf
-
- from tensorflow.keras import layers, models
- from tensorflow.keras.datasets import mnist
-
- # 载入 MNIST 数据集
- (train_images, train_labels), (test_images, test_labels) = mnist.load_data()
-
- # 数据预处理
- train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
- test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255
-
- train_labels = tf.keras.utils.to_categorical(train_labels)
- test_labels = tf.keras.utils.to_categorical(test_labels)
-
- # 构建神经网络模型
- model = models.Sequential([
- # 第一层:卷积层
- layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
-
- # 第二层:最大池化层
- layers.MaxPooling2D((2, 2)),
-
- # 第三层:卷积层
- layers.Conv2D(64, (3, 3), activation='relu'),
-
- # 第四层:最大池化层
- layers.MaxPooling2D((2, 2)),
-
- # 第五层:卷积层
- layers.Conv2D(64, (3, 3), activation='relu'),
-
- # 将二维数据展平成一维
- layers.Flatten(),
-
- # 第六层:全连接层(密集层),64个神经元,ReLU激活函数
- layers.Dense(64, activation='relu'),
-
- # 输出层:全连接层,10个神经元(对应10个类别,0-9的数字),使用softmax激活函数
- layers.Dense(10, activation='softmax')
- ])
-
- # 编译模型
- model.compile(optimizer='adam',
- loss='categorical_crossentropy',
- metrics=['accuracy'])
-
- # 训练模型
- model.fit(train_images, train_labels, epochs=5, batch_size=64, validation_split=0.2)
-
- # 在测试集上评估模型
- test_loss, test_acc = model.evaluate(test_images, test_labels)
- print(f'Test accuracy: {test_acc}')
编译模型:
- model.compile(
- optimizer, # 优化器,用于配置模型的学习过程。常见的有 'adam'、'sgd' 等。
- loss, # 损失函数,用于衡量模型在训练时的性能。常见的有 'categorical_crossentropy'、'mse' 等。
- metrics=None # 评估指标,用于监控训练和测试性能。可以是一个字符串或字符串列表。例如,'accuracy'。
- )
optimizer(优化器):
优化器决定了模型如何进行参数更新,以最小化损失函数。常见的优化器包括 'adam'、'sgd'、'rmsprop' 等。不同的优化器可能适用于不同类型的问题。
loss(损失函数):
损失函数用于衡量模型在训练时的性能,即模型预测与实际标签之间的差异。对于不同的问题,需要选择合适的损失函数。例如,对于分类问题,常见的是 'categorical_crossentropy',而对于回归问题,可能是 'mse'(均方误差)。
metrics(评估指标):
评估指标用于监控模型的性能。在训练和测试过程中,会输出这些指标的值。例如,'accuracy' 表示模型的准确性。你可以传递一个字符串或一个字符串列表,以同时监控多个指标。