9月17日计算机视觉基础学习笔记——认识机器学习

文章目录

前言
一、Week 2 homework
二、机器学习
- 1、线性回归模型
- 2、逻辑回归模型

前言

本文为9月17日计算机视觉基础学习笔记——认识机器学习，分为两个章节：

Week 2 homework；
机器学习。

一、Week 2 homework

生成10张图片，对应数字 0-9。对这10张图片提取特征x，用一个判别器f(x)来决策输出结果y。

import torch

def generate_data():
    '''
    本函数生成0-9，10个数字的图片矩阵
    '''
    
    image_data=[]
    num_0 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,1,0,0,1,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_0)
    num_1 = torch.tensor(
    [[0,0,0,1,0,0],
    [0,0,1,1,0,0],
    [0,0,0,1,0,0],
    [0,0,0,1,0,0],
    [0,0,1,1,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_1)
    num_2 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,0,1,0,0],
    [0,0,1,0,0,0],
    [0,1,1,1,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_2)
    num_3 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,0,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_3)
    num_4 = torch.tensor(
    [
    [0,0,0,0,1,0],
    [0,0,0,1,1,0],
    [0,0,1,0,1,0],
    [0,1,1,1,1,1],
    [0,0,0,0,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_4)
    num_5 = torch.tensor(
    [
    [0,1,1,1,0,0],
    [0,1,0,0,0,0],
    [0,1,1,1,0,0],
    [0,0,0,0,1,0],
    [0,1,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_5)
    num_6 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,0,0],
    [0,1,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_6)
    num_7 = torch.tensor(
    [
    [0,1,1,1,1,0],
    [0,0,0,0,1,0],
    [0,0,0,1,0,0],
    [0,0,0,1,0,0],
    [0,0,0,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_7)
    num_8 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_8)
    num_9 = torch.tensor(
    [[0,0,1,1,1,0],
    [0,1,0,0,1,0],
    [0,0,1,1,1,0],
    [0,0,0,0,1,0],
    [0,0,0,0,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_9)
    return image_data

import matplotlib.pyplot as plt
image_data = generate_data()
print(image_data[0])
>>> tensor([[0, 0, 1, 1, 0, 0],
            [0, 1, 0, 0, 1, 0],
            [0, 1, 0, 0, 1, 0],
            [0, 1, 0, 0, 1, 0],
            [0, 0, 1, 1, 0, 0],
            [0, 0, 0, 0, 0, 0]])

# 方法：提取特征
def get_feature(x):
    return torch.sum(x, 0)

print(get_feature(image_data[2]))
print(get_feature(image_data[8]))
>>> tensor([0, 2, 3, 3, 2, 0])
>>> tensor([0, 2, 3, 3, 2, 0])

i = 0
def model(x, image_data):
    y = -1
    
    for i in range(0, 10):
        diff_tmp = get_feature(x) - get_feature(image_data[i])
        
        if torch.sum(torch.abs(diff_tmp)) == 0:
            y = i
            break
    print("{} --识别为--> {}".format(x, y))
    return y

model(image_data[8], image_data)
>>> tensor([[0, 0, 1, 1, 0, 0],
            [0, 1, 0, 0, 1, 0],
            [0, 0, 1, 1, 0, 0],
            [0, 1, 0, 0, 1, 0],
            [0, 0, 1, 1, 0, 0],
            [0, 0, 0, 0, 0, 0]]) --识别为--> 2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132

二、机器学习

1、线性回归模型

特征： $\textbf{V}: [v_1, v_2, …, v_6]^T$ ；
判别式： $\textbf{W} * \textbf{V} = [\omega_1, \omega_2, …, \omega_6]\ [v_1, v_2, …, v_6]^T$ .
Loss： $\sum_{i}(\hat{y}_i - y_i )^2$ .
求 loss 的最小值对应的 $\omega$ ： $\partial \frac{\sum_{i}(\hat{y}_i - y_i )^2}{\partial w_j} =0$ .

代码如下：

import torch
from itertools import product

def generate_data():
    '''
    本函数生成0-9，10个数字的图片矩阵
    :return: image_data,image_label
    '''

    image_data=[]
    num_0 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,1,0,0,1,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_0)
    num_1 = torch.tensor(
    [[0,0,0,1,0,0],
    [0,0,1,1,0,0],
    [0,0,0,1,0,0],
    [0,0,0,1,0,0],
    [0,0,1,1,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_1)
    num_2 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,0,1,0,0],
    [0,0,1,0,0,0],
    [0,1,1,1,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_2)
    num_3 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,0,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_3)
    num_4 = torch.tensor(
    [
    [0,0,0,0,1,0],
    [0,0,0,1,1,0],
    [0,0,1,0,1,0],
    [0,1,1,1,1,1],
    [0,0,0,0,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_4)
    num_5 = torch.tensor(
    [
    [0,1,1,1,0,0],
    [0,1,0,0,0,0],
    [0,1,1,1,0,0],
    [0,0,0,0,1,0],
    [0,1,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_5)
    num_6 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,0,0],
    [0,1,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_6)
    num_7 = torch.tensor(
    [
    [0,1,1,1,1,0],
    [0,0,0,0,1,0],
    [0,0,0,1,0,0],
    [0,0,0,1,0,0],
    [0,0,0,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_7)
    num_8 = torch.tensor(
    [[0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,1,0,0,1,0],
    [0,0,1,1,0,0],
    [0,0,0,0,0,0]])
    image_data.append(num_8)
    num_9 = torch.tensor(
    [[0,0,1,1,1,0],
    [0,1,0,0,1,0],
    [0,0,1,1,1,0],
    [0,1,0,0,1,0],
    [0,0,0,0,1,0],
    [0,0,0,0,0,0]])
    image_data.append(num_9)
    image_label=[0,1,2,3,4,5,6,7,8,9]
    return image_data,image_label

# 方法：提取特征
def get_feature(x):
    feature = [0, 0, 0, 0]
    # 提取图像x的特征 feature 的代码
    def get_shadow(x, dim):
        print("提取特征，x 的尺寸：", x.size())
        feature = torch.sum(x, dim)
        feature = feature.float()
        print("提取特征，feature 的尺寸：", feature.size())

        # 归一化
        for i in range(feature.shape[0]):
            feature[i] = feature[i] / sum(feature)

        feature = feature.view(1, 6)
        return feature

    feature = get_shadow(x, 0)

    return feature

def model(feature, weights):
    y = -1
    '''
    # 下面添加对feature进行决策的代码，
    判定出feature 属于[0,1,2,3,...9]哪个类别
    '''
    feature = torch.cat((feature, torch.tensor(1.0).view(1, 1)), 1)
    y = feature.mm(weights)
    return y

def train_model(image_data, image_label, weights):
    for epoch in range(3000):
        loss = 0
        for i in range(len(image_data)):
            feature = get_feature(image_data[i])
            y = model(feature, weights)

            # 计算 yhat 和期望 iamge_label 的差距
            loss += 0.5 * (y.item() - image_label[i])**2  # .item()返回的是一个浮点型数据，精度更高

            # 更新权重 w
            # w = w - lr * (y - y1) * x
            feature = feature.view(6)
            lr = -0.05
            weights[0, 0] = weights[0, 0] + (y.item() - image_label[i]) * feature[0] * lr
            weights[1, 0] = weights[1, 0] + (y.item() - image_label[i]) * feature[1] * lr
            weights[2, 0] = weights[2, 0] + (y.item() - image_label[i]) * feature[2] * lr
            weights[3, 0] = weights[3, 0] + (y.item() - image_label[i]) * feature[3] * lr
            weights[4, 0] = weights[4, 0] + (y.item() - image_label[i]) * feature[4] * lr
            weights[5, 0] = weights[5, 0] + (y.item() - image_label[i]) * feature[5] * lr
            weights[6, 0] = weights[6, 0] + (y.item() - image_label[i]) * lr

        loss = 0

    return weights

if __name__ == '__main__':
    # 生成 w0
    weights = torch.rand(7, 1)
    image_data, image_label = generate_data()

    # 打印出 0 的图像
    print("数字 0 的图片是：", image_data[0])
    print("-" * 20)

    # 打印出8的图像
    print("数字 8 的图片是：", image_data[8])
    print("-" * 20)

    # 训练模型
    weights = train_model(image_data, image_label, weights)

    # 测试：识别每张图片
    print("对每张图片进行识别")

    for i in range(6):
        x = image_data[i]
        feature = get_feature(x)
        y = model(feature, weights)

        print("图像{}的分类结果是：{}，它的特征是：{}".format(i, y, feature))
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178

2、逻辑回归模型

非0即1；
线性模型取对数。
Sigmoid 函数：
$\sigma(a) = \frac{1}{1+e^{-a}}$

其导数为： $\frac{\partial \sigma (a)}{\partial a} = \sigma (a)(1-\sigma (a))$ .

特征： $\phi(x)$ ，那么逻辑回归将这个例子属于第1类的概率建模为:
$\textbf{x}; \textbf{w}) = \sigma(\textbf{w}^T \phi(\textbf{x}))$
并将属于0类的例子的概率定义为:

$\textbf{x}; \textbf{w}) = 1 - p(t=1 | \textbf{x}; \textbf{w}) = 1 - \sigma(\textbf{w}^T \phi(\textbf{x}))$

极大似然估计（Maximum Likelihood Estimate）： 当前事件发生概率最大时，对应的概率密度函数中的参数：
$L(\textbf{w} ) = \prod_{i=1}^{N} p(t^{(i)} | \textbf{x}^{(i)}; \textbf{w})\\ p(t^{(i)} | \textbf{x}^{(i)}; \textbf{w}) = p(t=1 | \textbf{x}^{(i)}; \textbf{w})^{t^{(i)}}\ p(t=0 | \textbf{x}^{(i)}; \textbf{w})^{1 - t^{(i)}}$

试图找到最大化似然 $L(\textbf{w})$ 的 $\textbf{w}$ ，即找到最大化对数似然 $l(\textbf{w}) = log L(\textbf{w})$ 的 $\textbf{w}$ ，为简化推导，设 $\phi(\textbf{x}) = \textbf{x}$ ：

$arg\ max\ l(\textbf{w}) = arg\ max\ log\prod_{i=1}^{N} p(t^{(i)} | \textbf{x}^{(i)}; \textbf{w})\\ = arg\ max\ \sum_{i=1}^{N} log\ p(t^{(i)} | \textbf{x}^{(i)}; \textbf{w})\\ = arg\ max\ \sum_{i=1}^{N} log\ [p(t=1 | \textbf{x}^{(i)}; \textbf{w})^{t^{(i)}}\ p(t=0 | \textbf{x}^{(i)}; \textbf{w})^{1 - t^{(i)}}]\\ = arg\ max\ \sum_{i=1}^{N} log\ [p(t=1 | \textbf{x}^{(i)}; \textbf{w})^{t^{(i)}}] + log\ [p(t=0 | \textbf{x}^{(i)}; \textbf{w})^{1 - t^{(i)}}]]\\ = arg\ max\ \sum_{i=1}^{N}\ t^{(i)}\ log\ [p(t=1 | \textbf{x}^{(i)}; \textbf{w})] + (1 - t^{(i)})\ log\ [p(t=0 | \textbf{x}^{(i)}; \textbf{w})]\\ = arg\ max\ \sum_{i=1}^{N}\ t^{(i)}\ log\ [\sigma ( \textbf{w}^T\textbf{x}^{(i)})] + (1 - t^{(i)})\ log\ [1 - \sigma (\textbf{w}^T \textbf{x}^{(i)})]$

为找到使该表达式最大的 $\textbf{w}$ ，求其对 $\textbf{w}$ 的导数：

$\bigtriangledown_{\textbf{w}} l(\textbf{w}) = \bigtriangledown_{\textbf{w}} \sum_{i=1}^{N}\ t^{(i)}\ log\ [\sigma ( \textbf{w}^T\textbf{x}^{i})] + (1 - t^{(i)})\ log\ [1 - \sigma (\textbf{w}^T \textbf{x}^{(i)})]\\ = \sum_{i=1}^{N}\ t^{(i)}\ (\frac{1}{\sigma ( \textbf{w}^T\textbf{x}^{i})} )\times (\sigma ( \textbf{w}^T\textbf{x}^{i})(1 - \sigma ( \textbf{w}^T\textbf{x}^{i})))\times \textbf{x}^{(i)} + (1 - t^{(i)}) (\frac{1}{1 - \sigma ( \textbf{w}^T\textbf{x}^{i})}) \times (-1) \times (\sigma ( \textbf{w}^T\textbf{x}^{i})(1 - \sigma ( \textbf{w}^T\textbf{x}^{i})))\times \textbf{x}^{i}\\ = \sum_{i=1}^{N}\ t^{(i)}\ (1 - \sigma(\textbf{w}^T \textbf{x}^{(i)})) - (1 - t^{(i)})(-1)(\sigma(\textbf{w}^T \textbf{x}^{(i)}) \textbf{x}^{(i)} \\ = \sum_{i=1}^{N} t^{(i)} \textbf{x}^{(i)} - \sigma (\textbf{w}^T \textbf{x}^{(i)}) \textbf{x}^{(i)}$

得到：

$\bigtriangledown_{\textbf{w}} l(\textbf{w}) = \sum_{i=1}^{N} (t^{(i)} - \sigma (\textbf{w}^T \textbf{x}^{(i)})) \textbf{x}^{(i)}$

可见，无法使 $\bigtriangledown_{\textbf{w}} l(\textbf{w}) = 0$ 并求得 $\textbf{w}$ ，因为 $t^{(i)}$ 为 0 或 1，而 sigmoid 函数不可能为 0 或 1。因此只能用对似然函数进行梯度上升计算 $\textbf{w}$ 。

相关阅读:
力扣第797题所有可能的路径 C++ 深度优先搜索 +java
PDF24 Creator PDF工具箱 v11.17.0
漫画 | 老板裁掉我两周后，又把我请回去，工资翻番！
异常数据检测 | Python基于Hampel的离群点检测
SpringBoot+@Validated实现参数验证(非空、类型、范围、格式等)-若依前后端导入Excel数据并校验为例
嵌入式分享合集100
利用ImportBeanDefinitionRegistrar和BeanPostProcessor实现Spring对自定义注解bean的管理
Go 将在下个版本支持新型排序算法：pdqsort
Vu3笔记_02setup与常用的Composition API(组合式API)
.net 项目静态文件自动压缩打包

原文地址：https://blog.csdn.net/Ashen_0nee/article/details/126901898