• 【R语言】概率密度图


    概率密度图是用来表示连续型数据的分布情况的一种图形化方法。它通过在数据的取值范围内绘制一条曲线来描述数据的分布情况,曲线下的面积代表了在该范围内观察到某一数值的概率。具体来说,对于给定的连续型数据,概率密度图会使用核密度估计(Kernel Density Estimation,KDE)等方法来估计数据的概率密度函数。然后,在数据的取值范围内绘制一条平滑的曲线,曲线在不同取值处的高度表示了该取值出现的概率密度,即在该取值附近观察到数据点的频率。

    概率密度图通常用于比较不同组或不同条件下连续型数据的分布情况。在这个图中,不同组或条件的密度曲线以不同的颜色或图案进行区分,使得用户可以直观地比较它们的分布形状、中心趋势以及离散程度。

     

     代码如下:

     

    1. library(ggplot2)
    2. library(cowplot)
    3. library(gridExtra)
    4. # 第一个图,绘制了 iris 数据集中 Sepal.Length 与 Sepal.Width 的散点图,根据 Species 分组着色
    5. plot1 <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) +
    6. geom_point() +
    7. theme_minimal_grid(12)
    8. # 第二个图,绘制了 iris 数据集中 Sepal.Length 的密度图,根据 Species 填充颜色
    9. plot2 <- ggplot(iris, aes(Sepal.Length, fill = Species)) +
    10. geom_density(alpha = 0.5) +
    11. scale_y_continuous(expand = expansion(mult = c(0, 0.05))) +
    12. theme_minimal_hgrid(12)
    13. # 使用 grid.arrange() 函数将 plot1 和 plot2 组合在一起。nrow 参数指定了行数为 2,即两个图形将竖直排列。heights 参数指定了每行的高度,这里使用了相等的高度
    14. combined_plot <- grid.arrange(plot1, plot2, nrow = 2, heights = c(1, 1))
    15. # 展示组合后的图
    16. combined_plot

  • 相关阅读:
    浅谈计算机领域顶会与顶刊的那些事
    Lecture 10 Semaphores Ⅱ(信号量)
    mysql快速生成100万条测试数据脚本(InsCode AI 创作助手)
    如何用IDEA创建SpringBoot项目
    终于有阿里p8进行了大汇总(Redis+JVM+MySQL+Spring)还有面试题解全在这里了!
    新兴网络安全威胁:数字防御新格局
    MYSQL的建表语句
    Vue中的$nextTick
    Linux用一键安装包部署禅道(18.5版本)
    STM32实战总结:HAL之I2C
  • 原文地址:https://blog.csdn.net/a11113112/article/details/137891594