码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • KNN算法及性能评估之鸢尾花特征分类【机器学习】


    文章目录

    • 一.前言
      • 1.1 本文原理
      • 1.2 本文目的
    • 二.实验过程
      • 2.1 使用scikit-learn的数据归一化函数,对鸢尾花数据进行归一化;
      • 2.2 使用scikit-learn的切分数据集函数,将鸢尾花数据切分为训练数据集和测试数据集;
      • 2.3使用scikit-learn的KNN算法,对鸢尾花进行分类训练和测试(即预测);
      • 2.4 使用scikit-learn的混淆矩阵函数,显示性能评估的混淆矩阵以及准确率,并分析混淆矩阵的内容;
      • 2.5 分析混淆矩阵的内容以及总结

    一.前言

    1.1 本文原理

    KNN算法:通过在整个训练集中搜索k个最相似的实例(邻居)并汇总这些k个实例的输出变量来预测新的数据点。它可以用于分类和回归,是一种监督学习算法。
    混淆矩阵:至少有m*m的表。前m行和m列的条目CMJ表示分类器标记为J的类I元组数。

    1.2 本文目的

    1. 使用scikit-learn的数据归一化函数,对鸢尾花数据进行归一化;
    2. 使用scikit-learn的切分数据集函数,将鸢尾花数据切分为训练数据集和测试数据集;
    3. 使用scikit-learn的KNN算法,对鸢尾花进行分类训练和测试(即预测);
    4. 使用scikit-learn的混淆矩阵函数,显示性能评估的混淆矩阵以及准确率,并分析混淆矩阵的内容;

    二.实验过程

    2.1 使用scikit-learn的数据归一化函数,对鸢尾花数据进行归一化;

    老规矩,先使用load_iris模块,里面有150组鸢尾花特征数据,我们可以拿来进行学习特征分类。
    如下代码:

    from sklearn.datasets import load_iris
    iris = load_iris()
    X = iris.data
    y = iris.target
    
    
    • 1
    • 2
    • 3
    • 4
    • 5

    引入混淆矩阵confusion_matrix函数,评估方法函数accuracy_score,数据预处理函数模块preprocessing如下:

    from sklearn.metrics import confusion_matrix,accuracy_score,recall_score,precision_score
    from sklearn.model_selection import train_test_split
    from sklearn import preprocessing
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    数据预处理:按列归一化

    iris_X=preprocessing.scale(X)
    
    • 1

    输出归一化结果如下:

    print(iris_X)
    
    • 1

    在这里插入图片描述

    2.2 使用scikit-learn的切分数据集函数,将鸢尾花数据切分为训练数据集和测试数据集;

    随机划分训练集和测试集切分数据集函数如下:

    X_train,X_test,y_train,y_test =train_test_split(iris_X,y,test_size=0.3,random_state=0)
    
    • 1

    功能是从样本中随机的按比例选取train_data和test_data
    我们输出来看一下:

    print(X_train)
    print(X_test)
    print(y_train)
    print(y_test)
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    2.3使用scikit-learn的KNN算法,对鸢尾花进行分类训练和测试(即预测);

    KNN分类模型如下:
    引入k近邻算法模块:

    from sklearn import neighbors
    
    • 1

    KNeighborsClassifier用于实现k近邻投票算法的分类器如下:

    model=neighbors.KNeighborsClassifier(n_neighbors=3)
    
    • 1

    查询使用的邻居数。就是k-NN的k的值,选取最近的k个点。这里选择最近的3个点。

    模型训练如下:

    model.fit(X_train,y_train)
    
    • 1

    模型预测如下:

    v_pred=model.predict(X_test)
    
    • 1

    输出鸢尾花特征分类结果如下:

    print(v_pred)
    
    • 1

    在这里插入图片描述

    2.4 使用scikit-learn的混淆矩阵函数,显示性能评估的混淆矩阵以及准确率,并分析混淆矩阵的内容;

    使用混淆矩阵confusion_matrix:

    confusion_matrix(y_test,v_pred)

    输出混淆矩阵:

    print(confusion_matrix(y_test,v_pred))
    
    • 1

    输出准确率:
    在这里插入图片描述

    print("准确率:%.3f"% accuracy_score(y_test,v_pred))
    
    • 1

    结果如下:
    在这里插入图片描述

    2.5 分析混淆矩阵的内容以及总结

    sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None, sample_weight=None)
    y_true: 是样本真实分类结果 y_pred: 是样本预测分类结果 labels:是所给出的类别,通过这个可对类别进行选择 sample_weight : 样本权重
    预测正确的结果占总样本的百分比的97.8,本次KNN算法对鸢尾花进行分类训练和测试效果非常的准确。
    总结:
    1.熟悉机器学习之KNN算法及性能评估方法
    2.使用KNN算法解决问题并做性能评估
    在这里插入图片描述

  • 相关阅读:
    ubuntu18.04安装qgis、pyqgis
    Java抽象类知识
    Hexagon_V65_Programmers_Reference_Manual(49)
    磺化-β-环糊精两亲性蒽醚聚集诱导发光微球/AIE环糊精超分子微球/氧化硅修饰AIE微球
    为什么建议游戏工作室使用海外住宅IP防封?
    DeFi 如何从破茧重生?
    .NET中委托性能的演变
    RAMAN 中 OPTIMIZATION 优化选项的作用
    【iOS开发- KVO(键值监听)】
    Android开发中Button背景颜色不能修改问题及解决方法
  • 原文地址:https://blog.csdn.net/weixin_52908342/article/details/125424030
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号