• 动手学深度学习-深度学习基础


    • 深度学习基础:线性神经网络,多层感知机
    • 卷积神经网络:LeNet,AlexNet,VGG,Inception,ResNet
    • 循环神经网络:RNN,GRU,LSTM,seq2seq
    • 注意力机制:Attention,Transformer
    • 优化算法:SGD,Momentum,Adam
    • 高性能计算:并行,多GPU,分布式
    • 计算机视觉:目标检测,语义分割
    • 自然语言处理:词嵌入,BERT

    1 深度学习介绍

    机器学习(Machine Learning)是强大的可以从经验中学习的技术。通过采用观测数据或与环境交互的形式,机器学习算法会积累很多经验,其性能也会逐步提高。
    在这里插入图片描述
    参数(Parameter)可以看作旋钮,我们可以转动旋钮来调整程序的行为。任一调整参数的程序后,称为模型(Model)。通过操作参数而生成的所有不同程序(输入-输出映射)的集合称此为“模型族”。使用数据集来选择参数的元程序被称为学习算法(Learning algorithm)。
    在这里插入图片描述

    2 数据操作+数据预处理

    2.1 N维数组

    N维数组是机器学习和神经网络的主要数据结构
    在这里插入图片描述
    在这里插入图片描述

    2.2 创建数组

    创建数组需要:形状,每个元素的数据类型和值
    在这里插入图片描述

    2.3 访问元素

    在这里插入图片描述

    2.4 数据操作

    import torch
    
    # 张量表示一个数值组成的数组,可能有多个维度
    x = torch.arange(12)
    print(x)  # tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
    
    # 通过张量的shape属性来访问张量的形状和元素总数
    print(x.shape)  # torch.Size([12])
    print(x.numel())  # 12
    
    # reshape函数改变一个张量的形状而不改变元素数量和元素值
    x = x.reshape(3, 4)
    print(x)
    '''
    tensor([[ 0,  1,  2,  3],
            [ 4,  5,  6,  7],
            [ 8,  9, 10, 11]])
    '''
    
    # 创建全0或者全1的常量
    x = torch.zeros((2, 3, 4))
    print(x)
    '''
    tensor([[[0., 0., 0., 0.],
             [0., 0., 0., 0.],
             [0., 0., 0., 0.]],
    
            [[0., 0., 0., 0.],
             [0., 0., 0., 0.],
             [0., 0., 0., 0.]]])
    '''
    
    x = torch.ones((2, 3, 4))
    print(x)
    '''
    tensor([[[1., 1., 1., 1.],
             [1., 1., 1., 1.],
             [1., 1., 1., 1.]],
    
            [[1., 1., 1., 1.],
             [1., 1., 1., 1.],
             [1., 1., 1., 1.]]])
    '''
    
    # 通过提供包含数值的Python列表为张量中的每个元素赋值
    x = torch.tensor([[1, 2, 3], [4, 5, 6]])
    print(x)
    '''
    tensor([[1, 2, 3],
            [4, 5, 6]])
    '''
    
    # 将多个张量拼接起来
    x = torch.arange(12, dtype=torch.float32).reshape((3, 4))
    print(x)
    '''
    tensor([[ 0.,  1.,  2.,  3.],
            [ 4.,  5.,  6.,  7.],
            [ 8.,  9., 10., 11.]])
    '''
    
    y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
    print(y)
    '''
    tensor([[2., 1., 4., 3.],
            [1., 2., 3., 4.],
            [4., 3., 2., 1.]])
    '''
    
    # 按行拼接
    z0 = torch.cat((x, y), dim=0)
    print(z0)
    '''
    tensor([[ 0.,  1.,  2.,  3.],
            [ 4.,  5.,  6.,  7.],
            [ 8.,  9., 10., 11.],
            [ 2.,  1.,  4.,  3.],
            [ 1.,  2.,  3.,  4.],
            [ 4.,  3.,  2.,  1.]])
    '''
    
    # 按列拼接
    z1 = torch.cat((x, y), dim=1)
    print(z1)
    '''
    tensor([[ 0.,  1.,  2.,  3.,  2.,  1.,  4.,  3.],
            [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
            [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]])
    '''
    
    # 即使形状不同,仍然可以通过广播机制来执行按元素操作
    a = torch.arange(3).reshape((3, 1))
    print(a)
    '''
    tensor([[0],
            [1],
            [2]])
    '''
    
    b = torch.arange(2).reshape((1, 2))
    print(b)
    '''
    tensor([[0, 1]])
    '''
    print(a + b)
    '''
    tensor([[0, 1],
            [1, 2],
            [2, 3]])
    '''
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94
    • 95
    • 96
    • 97
    • 98
    • 99
    • 100
    • 101
    • 102
    • 103
    • 104
    • 105
    • 106
    • 107
    • 108
    • 109
    • 110

    2.5 数据预处理

    import os
    import pandas as pd
    import torch
    
    os.makedirs(os.path.join('.', 'data'), exist_ok=True)
    data_file = os.path.join('.', 'data', 'house_tiny.csv')
    with open(data_file, 'w') as f:
        f.write('NumRooms,Alley,Price\n')
        f.write('NaN,Pave,127500\n')
        f.write('2.0,NaN,106000\n')
        f.write('4.0,NaN,178100\n')
        f.write('NaN,NaN,140000\n')
    
    data = pd.read_csv(data_file)
    print(data)
    
    inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
    inputs = inputs.fillna(inputs.mean())
    
    print(inputs)
    '''
       NumRooms Alley
    0       3.0  Pave
    1       2.0   NaN
    2       4.0   NaN
    3       3.0   NaN
    '''
    
    print(outputs)
    '''
    0    127500
    1    106000
    2    178100
    3    140000
    '''
    
    # 对于inputs中的类别值或离散值,将NaN视为一个类别
    inputs = pd.get_dummies(inputs, dummy_na=True)
    print(inputs)
    '''
       NumRooms  Alley_Pave  Alley_nan
    0       3.0           1          0
    1       2.0           0          1
    2       4.0           0          1
    3       3.0           0          1
    '''
    
    x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
    print(x, y)
    '''
    tensor([[3., 1., 0.],
            [2., 0., 1.],
            [4., 0., 1.],
            [3., 0., 1.]], dtype=torch.float64) 
    
    tensor([127500, 106000, 178100, 140000])
    '''
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57

    2.6 reshape和view相同

    reshape示例

    import torch
    
    a = torch.arange(12)
    print(a)
    '''
    tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
    '''
    
    b = a.reshape((3, 4))
    print(b)
    '''
    tensor([[ 0,  1,  2,  3],
            [ 4,  5,  6,  7],
            [ 8,  9, 10, 11]])
    '''
    
    b[:] = 2
    print(a)
    '''
    tensor([2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])
    '''
    print(b)
    '''
    tensor([[2, 2, 2, 2],
            [2, 2, 2, 2],
            [2, 2, 2, 2]])
    '''
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    view示例

    import torch
    
    a = torch.arange(12)
    print(a)
    '''
    tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
    '''
    
    b = a.view((3, 4))
    print(b)
    '''
    tensor([[ 0,  1,  2,  3],
            [ 4,  5,  6,  7],
            [ 8,  9, 10, 11]])
    '''
    
    b[:] = 2
    print(a)
    '''
    tensor([2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])
    '''
    print(b)
    '''
    tensor([[2, 2, 2, 2],
            [2, 2, 2, 2],
            [2, 2, 2, 2]])
    '''
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    3 线性代数

    3.1 标量

    在这里插入图片描述
    在这里插入图片描述

    3.2 向量

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3.3 矩阵

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    u = torch.tensor([3.0, 4.0])
    # L2范数
    print(torch.norm(u))  # tensor(5.)
    # L1范数
    print(torch.abs(u).sum())  # tensor(7.)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    在这里插入图片描述

    3.4 按特定轴求和

    import torch
    
    a = torch.ones((2, 5, 4))
    print(a.shape)  # torch.Size([2, 5, 4])
    # 按照第0个维度求和
    print(a.sum(axis=0).shape)  # torch.Size([5, 4])
    # 按照第1个维度求和
    print(a.sum(axis=1).shape)  # torch.Size([2, 4])
    # 按照第2个维度求和
    print(a.sum(axis=2).shape)  # torch.Size([2, 5])
    # 按照第0个维度求和,并且将第0个维度变为1
    print(a.sum(axis=0, keepdims=True).shape)  # torch.Size([1, 5, 4])
    # 按照第1个维度求和,并且将第1个维度变为1
    print(a.sum(axis=1, keepdims=True).shape)  # torch.Size([2, 1, 4])
    # 按照第2个维度求和,并且将第2个维度变为1
    print(a.sum(axis=2, keepdims=True).shape)  # torch.Size([2, 5, 1])
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    4 矩阵计算

    4.1 标量导数

    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述

    4.2 亚导数

    在这里插入图片描述

    4.3 梯度

    在这里插入图片描述

    5 自动求导

    5.1 向量链式法则

    在这里插入图片描述
    在这里插入图片描述

    5.2 自动求导

    在这里插入图片描述
    在这里插入图片描述

    5.3 自动求导的两种模式

    在这里插入图片描述

  • 相关阅读:
    【翻译】Universal Style Transfer via Feature Transforms
    ChatGPT最强平替Claude也推出付费版;Midjourney 学习指南
    月薪近万,工地转行测试,这一次的选择,真正实现了薪资翻倍~
    springboot配置多个数据源
    流媒体中relay和forword的区别
    《C++ Primer》导学系列:第 3 章 - 字符串、向量和数组
    限流与代理网关集成调研及应用
    Struts2知识总结
    Java-多线程
    HTML+CSS+JS网页设计期末课程大作业 DW个人博客网站制作 web前端开发技术 web课程设计 网页规划与设计
  • 原文地址:https://blog.csdn.net/qq_40507857/article/details/126414993