机器学习通常说的分布:是指数据分布,和概率分布不是一个东西。数据分布可以理解为每一个特征是一个维度,所有样本在这些特征空间上的分布就是数据分布。
概率分布:指的是随机变量的分布,概率分布是指用于表述随机变量取值的概率规律。将随机变量作为横轴,概率作为纵轴,把随机变量与对应变量画上去,构成一个图形,这个图像就是概率分布的直观表示。也可以这样理解,分布指示了一个随机变量的两重信息。
1.可以得到哪些值;
2.得到这些值的概率分别是多少(对离散变量而言,对连续随机变量是得到给定区间值的概率)
其实我觉得如果要把机器学习中所说的分布看成概率分布,比如猫狗分类任务中的猫和狗就是两个随机变量,就可以把随机变量中的猫和狗抽象理解成他们各自特征向量的组合。
这个链接应该就是这么思考的:机器学习中的“分布”