• 混淆矩阵——AI产品经理给我使劲看


    混淆矩阵就是有效评估模型精度的一种手段,它能够通过预测结果来评价模型的效果”

    引言

    作为汽车视觉算法功能产品经理,分类算法是一个常用的算法模型。

    通过预先训练好一个分类模型,可以预测我们想要的正确值。例如在一堆动物图片中,把“狗”筛选出来。

    而想要知道一个模型的预测精度或效果,就可以通过混淆矩阵(Confusion Matrix)来进行评价。

    01

    二分类模型

    例如,我手里有个训练好的分类器,它可以在一堆车的图片中,判断哪些图片是极氪001。

    现在如果我知道这个分类器的效果好不好,可以怎么办呢。

    最简单有效的办法,就是把你手上拍的所有关于车的图片都丢给分类器,让他自己判断是不是极氪001。

    图片

    经过分类器的一番分类后,我们就可以得到这样一个预测结果:

    图片

    这个表格里,红色的×,代表“不是极氪001”;绿色的√,代表“是极氪001”。

    这样一来我们就可以非常清晰的看到,模型的对于真实值的预测,是否正确。

    但实际上,我们给到模型的图片,远不止这9张图。

    为了保证测试结果的准确性,我们会给它成千上万张图来验证模型的效果。

    显而易见,当他维度特别大的时候,我们就没办法用上面这个表格来很快看出这个模型的效果怎么样。

    那有没有一种方式,能够很直观、很简单、而又不损失信息地表示这个模型的测试效果?

    这个时候就需要用到混淆矩阵。

    我们不难看出,以上预测结果的类型,其实是固定的。

    真实类别也就是:【是极氪001】和【不是极氪001】两种情况

    预测类别也同样是:【是极氪001】和【不是极氪001】两种情况

    两两组合,其实一共就只有这个四种情况,也就是这样一个表格:

    图片

    接下来,我们就需要对所有结果做一个统计,来看他有多少图片预测正确,有多少图片预测错误。

    首先,我们来看他在所有【是极氪001】的图片中,预测对了几个,数了一下,一共有2个,所以这里就填“2”:

    图片

    然后,在所有【不是极氪001】的图片中,一共预测对了4个,所以在这里就是“4”:

    图片

    接着,看一下预测错误的情况,在所有【不是极氪001】的图片中,被模型判断成了【是极氪001】的情况一共有2次,所以这里就应该是“2”:

    图片

    最后,在所有【是极氪001】的图片中,被模型判断成了【不是极氪001】的情况一共有1次。

    所以最终,我们得到了这4个数,这4个数组成了一个2×2的矩阵,就叫做“混淆矩阵”(Confusion Matrix)。

    图片

    也就是说,我们可以用这4个数来表示出这个模型的测试结果,也就能看出这个模型的测试效果。

    同时,这四个数,分别有对应的名词来表示:

    图片

    这两个绿色部分,代表预测对了,所以都是“True”开头;

    同理,这两个红色部分,代表预测错了,所以都是“False”开头。

    而第一行,模型都预测成了“Positive”(正向),所以第二个词就是“Positive”;

    第二行,模型都预测成了“Negative”(负向),所以第二个词就是“Negative”。

    于是就有了这个四个英文名词:True Positive、False Positive、False Negative、True Negative。

    02

    多分类模型

    以上是针对二分类模型来说的,能告诉我们这些图片哪些是“极氪001”。

    那比如我现在不想知道这些图片是不是极氪001,而是想知道这些图片中,哪些极氪、哪些是小鹏、哪些是蔚来。

    那这个时候就变成了一个三分类模型,但原理其实和二分类是一样的,只不过他不再是个2×2矩阵,而是变成了3×3矩阵。

    图片

    图片

    图片

    同样,绿色方块中是模型预测正确的部分,红色方块中是模型预测错误的部分。

    再进一步,如果是N分类,那我们就可以得到一个N×N的矩阵。

    图片

    同样,绿色部分是模型预测正确的部分,红色部分是模型预测错误的部分。

    也就是说,在模型训练过程中,我们希望的是,模型预测正确的次数尽可能的多,预测错误的次数尽可能的少。

    所以,在矩阵图里就是:绿色部分的数值越大,同时红色部分的数值越小,那么模型的效果越好;反之越差。

    03

    结语

    AI产品经理不需要手把手自己训练模型,但需要把控模型的精度,为最终的结果负责。

    而混淆矩阵就是有效评估模型精度的一种手段,它能够通过预测结果来评价模型的效果。

    以上就是混淆矩阵的基本概念,希望说明白了。

    如何转行/入门AI产品经理?

    现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

    作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

    我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

    一、AGI大模型系统学习路线

    很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

    在这里插入图片描述

    二、AI大模型视频教程

    在这里插入图片描述

    三、AI大模型各大学习书籍

    在这里插入图片描述

    四、AI大模型各大场景实战案例

    在这里插入图片描述

    五、结束语

    学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

    再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

    因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

  • 相关阅读:
    2022年10月 前端面试题总结——(二)
    力扣 -- 647. 回文子串
    为什么我们需要 HTTP/3?QUIC协议成功“上位”。
    【Python学习笔记】字符串
    手写一个民用Tomcat (04)
    Python 爬虫 NO.4 HTTP 响应状态码
    【MySQL】mysql | 数据处理 | 行转列 | 一种行转列的处理思路
    【python数据分析刷题】-N08.排序&函数
    基于SSM的车辆维修管理系统
    如何在JVM层写切面?JVM Sandbox入门教程与原理浅谈
  • 原文地址:https://blog.csdn.net/python122_/article/details/139407512