• 数据分析:密度图


    在这里插入图片描述
    目前拥有的数据如图,三列分别对应瑕疵种类,对应的置信
    度,x方向坐标。
    现在想要做的事是观看瑕疵种类和置信度之间的关系。
    要显示数据分布的集中程度,可以使用以下几种常见的图形来观察:

    1、箱线图(Box Plot):箱线图展示了数据的中位数、上下四分位数、最小值和最大值等统计指标,并通过箱体的长度和须的长度来表示数据的分布情况。箱线图能够展示数据的异常值和偏态程度,从而提供数据集中程度的信息。
    2、直方图(Histogram):直方图用柱状图的形式表示数据在不同区间内的频数或频率。直方图能够给出数据的分布情况,高度表示数据出现的频次,整个图形可以展示数据的集中和离散程度。
    3、密度图(Density Plot):密度图是通过平滑直方图来估计数据的概率密度函数,并以连续曲线的形式展示数据分布的集中程度。密度图可以更直观地看出数据的峰值和分布的波动情况。
    4、散点图(Scatter Plot):散点图用点的位置来表示两个变量之间的关系。通过观察散点图中点的分布情况,可以大致判断数据的集中程度和相关性。

    下面我使用的是密度图,因为密度的连续曲线更加容易看出数据分布的集中程度。

    import pandas as pd
    import matplotlib.pyplot as plt
    
    # 读取没有列标签的CSV文件
    df = pd.read_csv('camera0.csv', header=None)
    # 使用整数索引访问列数据
    confidence_by_type = df.groupby(0)[1]
    # 绘制置信度密度分布图
    plt.figure(figsize=(10, 6))
    confidence_by_type.plot(kind='density', linewidth=2, alpha=0.5)
    plt.xlabel('Confidence')
    plt.ylabel('Density')
    plt.title('Confidence Density Distribution by Type')
    plt.legend(confidence_by_type.groups.keys())
    
    # 显示图形
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    请添加图片描述
    如上图所示,我的横坐标是第二列置信度,纵坐标是密度,四条线分别对应第一列的四种类型。
    这样就可以看懂我的数据的分布集中情况。

  • 相关阅读:
    GBase 8d的性能指标
    微服务--alpha使用
    彰显强大技术实力,微信视觉团队斩获CVPR 2023 Video Similarity Challenge双赛道冠军
    Android 9 自动恢复出厂设置问题(auto-recovery)
    MySQL-2-函数和约束
    低效程序根源追溯——记一次刷题对性能的不满
    github搜索技巧探索
    基于残差学习的卷积神经网络图像去噪研究-含Matlab代码
    无涯教程-JavaScript - CHISQ.INV.RT函数
    每日一题----昂贵的婚礼
  • 原文地址:https://blog.csdn.net/CSDN_Yangk/article/details/133920450