准确率(Precision)和召回率(Recall)是两个用来评价一个模型的好坏的指标,它们有不同的意义:
准确率(Precision):准确率是在所有被模型判断为正例的样本中,有多少是真正的正例。换句话说,它测量了模型的精度,即模型做出的正预测有多少是正确的。
大白话:准确率告诉我们,当模型说某个样本是正例时,有多大概率它真的是正例。高准确率表示模型很少会错误地把负例错分成正例,但它可能会漏掉一些真正的正例。
召回率(Recall):召回率是在所有真正的正例中,有多少被模型成功地找出来。它衡量了模型的查全率,即模型有多大概率找到了所有的正例。
大白话:召回率告诉我们,模型有多大概率找出了所有的正例,不漏掉任何一个。高召回率表示模型很少会漏掉真正的正例,但它可能会把一些负例误认为正例。
这两个指标通常存在权衡关系,提高准确率可能会降低召回率,反之亦然。具体应用取决于任务的性质和需求:
当需要确保不错过任何一个正例且可以容忍一些误报时,重点关注召回率。
当需要确保模型的正预测尽可能准确时,重点关注准确率。
在不同的应用中,可以根据具体情况来选择合适的指标,并根据需求调整模型,以取得最合适的平衡。
昇腾小知识:
(国产化需求)
AscendSpeed是一个开源的分布式训练加速库,用于在昇腾芯片上开发大模型。它提供了一些优化特性,可以帮助开发者在昇腾上迁移模型或进行开发,以获得更好的性能。目前,AscendSpeed已经支持了LLaMA2、Baichuan、Bloom等主流大模型,并且已经正式开源。
此外,AscendSpeed还通过Adapter方式支持Pytorch框架,开发者只需要下载社区版本的Pytorch和对应版本的Torch-NPU,即可在昇腾上进行模型开发。这样,开发者可以直接在PyTorch 2.1上基于昇腾进行模型开发。
需要注意的是,AscendSpeed主要用于在昇腾芯片上开发大模型,并提供了一些优化特性,以获得更好的性能。它与DeepSpeed和Megatron-LM等分布式加速库有一些相似之处,但也有一些区别。如果开发者不想改动训练脚本,仍然想使用DeepSpeed和Megatron-LM,也是可以支持的,但需要通过Adapter的方式进行支持。
AscendIE是华为公司开发的一种深度学习推理引擎,用于在华为昇腾芯片上进行高效的模型推理。与TensorRT和OpenVINO类似,AscendIE旨在优化深度学习模型的推理性能,提高模型在昇腾芯片上的运行效率。
TensorRT是由NVIDIA开发的推理引擎,专门用于优化和加速深度学习模型的推理过程。它通过网络层融合、精度校准和动态图优化等技术,提供了高性能和低延迟的推理能力,适用于在NVIDIA GPU上进行模型推理。
OpenVINO是英特尔开发的一套深度学习推理工具库,旨在优化和加速深度学习模型的推理过程。它支持多种硬件平台,包括英特尔的CPU、集成显卡、神经计算棒等,提供了高性能和低功耗的推理能力。
与TensorRT和OpenVINO类似,AscendIE也是一种专门用于优化和加速深度学习模型推理的引擎。它针对华为昇腾芯片进行了优化,提供了高性能和低功耗的推理能力。通过使用AscendIE,开发者可以在昇腾芯片上获得更好的模型推理性能和效率。
需要注意的是,TensorRT、OpenVINO和AscendIE都是针对特定硬件平台进行优化的推理引擎。它们在优化技术、支持的硬件平台和开发者工具等方面可能有所不同。开发者在选择推理引擎时,应根据自己的硬件平台和需求进行评估和选择。