• 基于Python实现k-means算法和混合高斯模型


    1. 实验目的

    实现一个 k-means 算法和混合高斯模型,并且用 EM 算法估计模型中的参数。

    2. 实验要求

    • 用高斯分布产生 k 个高斯分布的数据(不同均值和方差)(其中参数自己设定)。
      • 用 k-means 聚类,测试效果;
      • 用混合高斯模型和你实现的 EM 算法估计参数,看看每次迭代后似然值变化情况,考察 EM 算法是否可以获得正确的结果(与你设定的结果比较)。
    • 应用:可以 UCI 上找一个简单问题数据,用你实现的 GMM 进行聚类。

    3. 设计思想

    3.1 K-means 算法

    k 均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为 K 组,则随机选取 K 个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

    算法为:先随机选取 K 个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下任何一个:

    • 没有(或最小数目)对象被重新分配给不同的聚类。
    • 没有(或最小数目)聚类中心再发生变化。
    • 误差平方和局部最小。

    3.2 GMM 算法

    GMM,高斯混合模型,也可以简写为 MOG。高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。

    GMM 相对 K-means 是比较复杂的 EM 算法的应用实现。与 K-means 不同的是,GMM 算法在 E 步时没有使用“最近距离法”来给每个样本赋类别(hard assignment),而是增加了隐变量 γ。γ 是(N,K)的矩阵, γ[N,K]表示第 n 个样本是第 k 类的概率,因此, 具有归一性。即 的每一行的元素的和值为 1。

    GMM 算法是用混合高斯模型来描述样本的分布,因为在多类情境中,单一高斯分布肯定是无法描绘数据分布。多个高斯分布的简单叠加也无法描绘数据分布的。只有混合高斯分布才能较好的描绘一组由多个高斯模型产生的样本。对于样本中的任一个数据点,任一高斯模型能够产生该点的概率,也就是任一高斯模型对该点的生成的贡献(contribution)是不同的,但可以肯定的是,这些贡献的和值是 1。

    4. 实验过程

    4.1 算法设计

    高斯分布参数:

    在这里插入图片描述

    E 步:

    在这里插入图片描述

    M 步:

    在这里插入图片描述

    极大似然估计:

    在这里插入图片描述

    4.2 实验结果

    自生成数据,K-means:

    在这里插入图片描述
    在这里插入图片描述

    自生成数据,GMM:

    图中给出了每一阶段的样本分类情况和置信椭圆。

    最后带有填充的透明置信椭圆为生成数据的真实椭圆。

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    AR贴纸特效SDK,无缝贴合的虚拟体验
    Docker实现挂载的N种方式
    Java IO流处理 面试题汇总
    JAVA商城和PHP商城的区别
    单调栈——包含min函数的栈
    java毕业设计道路桥梁工程知识文库系统Mybatis+系统+数据库+调试部署
    算法训练与程序竞赛题目集合(L1)
    基于51单片机的智能路灯控制系统proteus仿真原理图PCB
    9、Feign自定义配置
    DHP16P-10-05A/100T-BC、DHP16P-10-23A/35ET-BB电液比例式2级放大式方向控制阀放大器
  • 原文地址:https://blog.csdn.net/sheziqiong/article/details/126084684