nn.Sequential与tensorflow的Sequential对比

nn.Sequential() 是 PyTorch 深度学习框架中的一个类，用于按顺序容器化模块。nn.Sequential 是一个有序的容器，它包含多个网络层，数据会按照在构造函数中传入顺序依次通过每个层。在 nn.Sequential 中，不需要定义 forward 方法，因为当你调用它时，会按照顺序调用每个子模块。

import torch  
import torch.nn as nn  
  
# 创建一个简单的神经网络  
model = nn.Sequential(  
    nn.Linear(784, 128),  # 输入层到隐藏层，784个输入节点，128个输出节点  
    nn.ReLU(),           # 激活函数  
    nn.Linear(128, 10)   # 隐藏层到输出层，128个输入节点，10个输出节点  
)  
  
# 创建一个随机的输入张量  
input_tensor = torch.randn(1, 784)  
  
# 将输入张量传递给模型  
output_tensor = model(input_tensor)  
  
print(output_tensor.size())  # 输出应为 torch.Size([1, 10])
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

import tensorflow as tf  
from tensorflow.keras.datasets import mnist  
from tensorflow.keras.models import Sequential  
from tensorflow.keras.layers import Dense, Flatten  
from tensorflow.keras.losses import SparseCategoricalCrossentropy  
from tensorflow.keras.optimizers import Adam  
  
# 加载MNIST数据集  
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()  
  
# 归一化像素值到0-1之间  
train_images = train_images / 255.0  
test_images = test_images / 255.0  
  
# 将图像的形状展平，以便可以输入到神经网络中  
train_images = train_images[..., tf.newaxis]  
test_images = test_images[..., tf.newaxis]  
  
# 创建Sequential模型  
model = Sequential([  
    Flatten(input_shape=(28, 28, 1)),  # 将28x28像素的图像展平为一维张量  
    Dense(128, activation='relu'),      # 全连接层，128个神经元，使用ReLU激活函数  
    Dense(10)                           # 输出层，10个神经元（对应10个数字类别）  
])  
  
# 编译模型  
model.compile(optimizer=Adam(),  
              loss=SparseCategoricalCrossentropy(from_logits=True),  
              metrics=['accuracy'])  
  
# 训练模型  
model.fit(train_images, train_labels, epochs=5)  
  
# 评估模型  
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)  
  
print('\nTest accuracy:', test_acc)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37

self.conv 通常指的是类的一个属性，这个属性通常是一个卷积层（Convolutional Layer）

import torch  
import torch.nn as nn  
import torch.nn.functional as F  
  
class SimpleCNN(nn.Module):  
    def __init__(self):  
        super(SimpleCNN, self).__init__()  
        # 定义一个卷积层，输入通道数为3（例如RGB图像），输出通道数为16，卷积核大小为3x3  
        self.conv = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)  
        # 可以添加其他层...  
  
    def forward(self, x):  
        # 在前向传播中使用卷积层  
        x = self.conv(x)  
        # 可以添加其他操作，例如激活函数、池化等...  
        x = F.relu(x)  
        # 返回处理后的输出  
        return x  
  
# 创建模型实例  
model = SimpleCNN()  
  
# 假设我们有一个输入张量 input_tensor，其形状为 [batch_size, 3, height, width]  
# 我们可以将其传递给模型进行前向传播  
output_tensor = model(input_tensor)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

相关阅读:
【Linux】多线程_8
领英的辅助工具领英精灵
css过渡效果
IDEA 又双叒叕更新大版本了 , IntelliJ IDEA 2022.3 正式发布,详情请参考博文
解决 IDEA 使用 AWT 组件中文乱码
RocketMQ快速入门_2. rocketmq 的应用场景、与其他mq的差异
linux 内核哪种锁可以递归调用 ?
HarmonyOS开发：NEXT版本开发新体验
力扣(leetcode)刷题分享，简单题(第1期)
多线程同步，信号，生产者消费者模型

原文地址：https://blog.csdn.net/Zsusan7/article/details/138020514