• 李宏毅-机器学习-笔记-P1


    P1 机器学习基本概念(一)

    一、机器学习是什么?

            Machine Learning≈Looking for function、函数太过复杂,让机器来找

    比如:Speech Recognition(语音识别):声音信号通过函数转化为文字,输入到输出

               Image Recognition(图像识别)、Playing Go

    二、着重关注于其中一项关键技术:深度学习

            深度学习(Deep Learning):要找的函数是一个类神经网络(Neural Network)

    (一)可以有不同的输入:vector(向量)、Martix(矩阵e.g. image图像识别)、Sequence(序列e.g. speech、text语音或文字识别)

    (二)也可以有不同输出:regression(回归任务)-scalar(数值)、classification(分类任务)-类别、structured learning:更复杂的,输出一段话、一个文章、甚至画图。

    以上输入和输出各个类型并不是对应的,而是可组合的。

    三、机器是如何实现自动找一个函数?

    (一)Supervised Learning(监督学习)

            大量训练资料training data——做好标注label——机器自动找出一个方向判断

            大量标记耗费人工,搜集到的资料不多,若为每一个任务都搜集有标注资料,非常麻烦。

    (二)self-supervised learing

            希望模型在训练前先练基本功——Pre-train,期待练好之后,它在新的任务上做的很好。基础硬核或者硬核的功能(Foundation model,其中有著名叫Bert的模型)已经处理完,在此基础上再开发新功能(Downstream Task)会变得很简单。就像作业系统与应用之间的关系。

    比如:影像识别

            机器看大量未标注的图片资料,将图片反转、变色后问机器它们(内容)是不是一样,机器通过将此基本任务(上游任务)学好,即能够辨别不同颜色或不同角度的图像,其实是一个物品,然后在真正要解决的问题(下游任务、Downstream Task)上能够做的更好,比如:猫狗识别,识别苹果和橘子。

    (三)Generative Adversarial Network

            Supervised learning需要成对关系,告诉系统:输入x1,通过函数,希望输出y1;输入x2,通过函数,希望输出y2。

            而如果有Generative Adversarial Network,只需要收集到大量的x和大量的y,不用知道他们之间的成对关系,机器就可以把它们之间的关联找出来。

    (四)Reinforcement Learning:RL

            使用场景:不知道如何标注资料的时候。不知道如何标注资料,但可以定义什么是成功时。

    比如下围棋,人类也不知道要将棋子下在哪里最好时。

    四、不只是关注正确率

    (一)Anomaly Detection(异常检测)

            让机器具备回答:“我不知道”的能力

    (二)Explainable AI(可解释性AI)

            分类器虽然能够判断出类别,比如判别出宝可梦和数码宝贝。但真的代表它知道宝可梦长什么样子吗?我们不仅要让它判断出类别,正确的答案,同时还要告诉我们为什么它知道答案应该是这样的,这就是可解释性AI。

    (三)Model Attack(模型攻击)

    (四)Domain Adaptation

            如何解决图像分布不同,正确率暴跌的问题

    (五)Network Compression(模型压缩)

    (六)Life-long Learning

    五、学会如何学习(Meta learning)

            机器不再使用人发明的演算法,而是从过去的经验里面发明出新的演算法

            Few-shot learning是也能够非常少量的标注资料就进行学习≈meta learning,因为若想使用非常少量的标注资料就进行学习要使用到meta learning的技术,只有机器也是用自己发明的演算法,才能做到非常少量的标注资料就进行学习。

  • 相关阅读:
    查询性能提升3倍!Apache Hudi 查询优化了解下?
    02.Vue2.x Vue模版语法
    Vue3的新特性总结
    【无标题】
    AWS认证SAA-C03每日一题
    零基础最简单方式学习Linux?
    图论第4天
    python二次开发Solidworks:齿轮生成器
    Linux保姆级安装及配置教程
    [HDLBits] Exams/2013 q2afsm
  • 原文地址:https://blog.csdn.net/qq_61833632/article/details/141086369