码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 机器学习面试准备(一)KNN


    目录

    一、简述一下KNN算法的原理?

     二、KNN算法的三要素

    三、如何理解K值的选择

    四、kd树是什么及其作用?

    五、KNN的优缺点


    一、简述一下KNN算法的原理?

    KNN(K-Nearest Neighbor)是一种基本的分类与回归方法,给定一个训练数据集,对于新的输入实例,在数据集中找到与该实例的最邻近的K个实例,如果这K个实例的多数属于某个类,就把该输入实例归为这一类。

    KNN不具备显示的学习过程,实际上是利用训练数据集对特征空间进行划分,并作为其分类的模型。

     


     二、KNN算法的三要素

    距离度量:一般采用LP距离。(P=1,曼哈顿距离;P=2,欧氏距离;P=∞,切比雪夫距离)

    K值选择:一般选取一个比较小的数,通常选择交叉验证的方法来选取最佳的K值。

    分类决策规则:一般采用多数表决规则 


    三、如何理解K值的选择

    如果K值选择较小,就相当于用较小领域中的训练实例去预测,“学习”的近似误差会减小,但估计误差会增大,如果邻近的点是噪声,预测就会出错。另外,K值的减小意味着整体模型变得复杂,容易发生过拟合。

    如果K值选择较大,就相当于用较大领域中的训练实例去预测,学习的估计误差会减小,近似误差会增大,此时与输入实例较远(不相似的)实例也会对预测起作用,使预测发生错误,K值增大意味着整体的模型变得简单。

    在应用中,一般选取一个比较小的数,通常选择交叉验证的方法来选取最佳的K值。


    四、kd树是什么及其作用?

    KNN最简单的实现方法是线性扫描,因为要对每个实例计算距离,所以当训练集很大,训练实例维度很高,计算会非常耗时。为了提高KNN搜索的效率,可以采用kd树来存储数据

     


    五、KNN的优缺点

     


    参考:

    《统计学习方法》

    简博士的个人空间_哔哩哔哩_Bilibili 


  • 相关阅读:
    一周万星的文本转语音开源项目「GitHub 热点速览」
    云服务器ECS的简介
    【Android安全】Android SELinux机制 | Android 访问控制模型
    编写一个代码将一个带头节点的单链表A分解为两个带头结点的A和B,使得A表中含有原表中序号为奇数的元素,B表中含有序号为偶数的元素,保持相对位置不变
    Spring框架原理 | IOC/DI | Bean
    【猿创征文】Vue3 企业级优雅实战 - 组件库框架 - 3 搭建组件库开发环境
    【重识云原生】第六章容器基础6.4.9.6节——Service 与 Pod 的DNS
    openGauss学习笔记-107 openGauss 数据库管理-管理用户及权限-三权分立
    漏洞检测与EPSS评分
    【虚幻引擎UE】UE4/UE5 通用插件推荐及使用介绍
  • 原文地址:https://blog.csdn.net/qq_41964545/article/details/125439817
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号