码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 聚类算法概要及相关知识准备


    聚类的概念

    聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。
    将物理或抽象对象的集合分成由类似对象组成的多个类或簇(cluster)的过程被称为聚类(Clustering)。由聚类所生成的簇是一组数据对象的集合,这些对象与同一簇中的对象相似度较高,与其他簇的对象的相似度较低。相似度是根据描述对象的属性值来度量的,距离是采用度量的方式。
    在这里插入图片描述相同点集的不同聚类方法
    相同点集的不同聚类方法

    类的度量方法

    常用的类的度量方法有2种,即距离和相似系数。距离用来度量样品之间的相似性,相似系数用来度量变量之间的相似性。

    距离

    欧式距离

    定义在两个向量(两个点)上:点X和Y的欧式距离为:
    在这里插入图片描述

    闵可夫斯基距离

    两个向量(点)的p阶距离:
    在这里插入图片描述
    当p=1 时就是曼哈顿距离,p=2 时就是欧式距离。

    马氏距离

    定义在2个向量(两个点)上,这2个点在同一分布里,点 x和 y的马氏距离为

    其中, 是这个分布的协方差。
当 时,马氏距离退化为欧式距离。

    海明威距离

    定义:在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。即属性值相同,为0;属性值不同,为1。对应的分类属性 的海明威距离为:

    在这里插入图片描述

    混合距离

    对于数据 和 的混合距离为:
    在这里插入图片描述
    其中,前p个为数值变量,后m-p个为分类变量。

    相似度

    两个n维向量X和Y,余弦相似性由点积和向量长度给出,如下所示:
    在这里插入图片描述

    余弦相似度

    两个n维向量X和Y,余弦相似性由点积和向量长度给出,如下所示:
    在这里插入图片描述

    皮尔逊相关系数

    假设有两个变量X、Y,那么两变量间的皮尔逊相关系数可通过以下公式计算:
    在这里插入图片描述

    斯皮尔曼相关系数

    在这里插入图片描述

    离散属性的相关性

    假设有2个变量X,Y。则它们之间的相关系数为:
    在这里插入图片描述

  • 相关阅读:
    【pytorch笔记】第二篇 Pytorch加载数据
    发布项目到github上
    如何构建高性能可视化架构?一个交互式实时数据引擎的架构设计
    大家经常提到的RPA是什么!跟我来!带你全面了解RPA!
    python+vue精品课程在线学习系统
    使用 Dumpling 导出TiDB中的数据
    GBASE 8A v953报错集锦39--orato8a 指定 query 方式导出报错 ORA-02391 连接 数不足
    【LeetCode】232.用栈实现队列
    华清 Qt day4 9月20
    C ++ 类 | 类与函数(Function)_5
  • 原文地址:https://blog.csdn.net/chensq_yinhai/article/details/127656684
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号