生成模型(Generative Model)




高斯分布(Gaussian distribution):任何一只宝可梦都可以通过它们的一组属性向量来表示,下面我们取Defense,SP Def这两个属性组成的二维向量来表示一只宝可梦。由于测试集里的这只海龟我们无法知道它的先验概率P(x),因此我们假设已有的训练集是从一个高斯分布里采样得到的,那么现在我们就能估测这只海龟的先验概率是多少了。
对于高斯分布而言,它的输入是一个向量x,输出是一个抽样概率Font metrics not found for font: .,其函数的形状由均值𝝁和协方差矩阵𝜮确定




最大似然估计(Maximum Likelihood):由于每个点都是独立从高斯分布中采样出来的,而这79个点是又有可能从不同的高斯分布中采样出来。对不同的高斯分布而言,会有不同的相似度(Different Likelihood)。因此我们需要找到一个相似度Font metrics not found for font: .最高的高斯分布Font metrics not found for font: .
右图是我们实际计算出来的水系和一般系宝可梦的均值𝝁和协方差矩阵𝜮









