码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • day2-机器学习-聚类


    ​1、聚类的任务是在无标记样本的条件下将数据分组,从而发现数据的天然结构。 ** 聚类是把一个数据对象的集合划分为簇(子集),使得簇内对象彼此相似,簇间对象不相似的过程。**

    2、聚类常用方面:

    • 发现数据的潜在结构
    • 对数据进行自然分组
    • 对数据进行压缩

    3、聚类方法大体可以分为3个阶段:

    • 经典算法:比如基于模型的算法,基于划分的算法,基于密度的算法,基于网格的算法,层次聚类算法;
    • 高级算法,在经典算法的基础上,针对更为复杂的数据和任务开发的算法。比如:谱聚类,高维数据聚类,基于非负数矩阵分解的聚类,不确定数据聚类;
    • 多源数据算法:它是针对多源相关数据开发的算法。比如:多角度聚类,多任务聚类,多任务多视角聚类,迁移聚类,多模聚类。

    4、k均值算法是最大分离和最大内聚的最简单实现。

    • 假设我们有一组数据集X,要分成K类,那相应的就会有K个质心;
    • a 首先选择K个质心,计算每个样本与分别与这K个质心的距离,将样本进行归类;
    • b 求出每个质心中所有样本的均值,得到K个均值;
    • c 计算属于第i个质心的样本与均值的距离平方,累加K个质心的距离和作为损失函数
    • d 新的质心是用属于该类的样本求和除以样本数得到新的质心,重复a,直到质心不再变化。
    • 总结:从k均值算法的步骤看,可以发现,该算法第一次选择的质心至关重要,另外每次都算所有样本与质心的距离,来进行归类计算量太大,基本不适合稍微大点的数据集。

    3、通俗来说,机器学习是一门讨论各式各样的适用于不同问题的函数形式,以及如何使用数据来有效的获取函数参数具体值的学科。

    4、人工神经网络,我们将模拟生物神经网络的数学模型统称为人工神经网络。

    5、模式识别,研究的是如何通过输入的特征对样本进行分类,而机器学习更加关注的是如何通过输入的样本来提取出合适的特征,进而实现分类的目标。
    ​

    活动地址:CSDN21天学习挑战赛

  • 相关阅读:
    MATLAB入门-程序控制结构
    产品能力|书山有路-趣味算法(第二版)读书笔记part1
    【软考 系统架构设计师】嵌入式系统④ 嵌入式操作系统
    Nginx企业级负载均衡:技术详解系列(17)—— 长连接优化策略与下载服务器高效搭建
    猿创征文|2022年前端之路——我的前端开发好帮手
    Django学习记录04——靓号管理整合
    语言模型编码中/英文句子格式详解
    使用正则表达式判断连对的介绍
    升级iOS16.0.3后Siri无法正常工作?可试下这2种解决办法
    C++ Qt数据库模块介绍
  • 原文地址:https://blog.csdn.net/mg1507/article/details/126162138
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号