• python机器学习之门之sklearn的使用(使用鸢尾花数据集)


    sklearn全称为scikit learn 专门提供了python机器学习的模块 是一个高效的数据分析算法工具 建议在numpy scipy matplotlib

    对于大多数机器学习 通常有以下四个数据集

    1:train_data  训练数据集

    2:train_target  训练数据的真是结果集

    3:test_data 测试数据集

    4:test_target  测试数据对应的真是结果 用来检测预测的正确性

    sklearn模块提供了一个强大的数据库 包括鸢尾花 波士顿房价等等 下面用鸢尾花数据集做演示

    鸢尾花(iris)数据集 是常用的分类实验数据集 由fisher在1936年收集整理,包含150个数据集 分为三类 每类五十条数据 每条数据包含4个属性。

    效果图如下

     代码如下

    1. from sklearn.datasets import load_iris
    2. from sklearn.datasets import load_boston
    3. import matplotlib; matplotlib.use('TkAgg')
    4. import pandas as pd
    5. import matplotlib.pyplot as plt
    6. data=load_iris()
    7. print("以下是鸢尾花数据集")
    8. data =pd.DataFrame(data=load_iris().data,columns=load_iris().feature_names)#转换为dataframe对象
    9. print(data)
    10. x=data.iloc[:,[0,2]].values
    11. plt.scatter(x[:50,0],x[:50,1],color='red',marker='o',label='setosa')
    12. plt.scatter(x[50:100,0],x[50:100,1],color='blue',marker='x',label='versicolor')
    13. plt.scatter(x[100:,0],x[100:,1],color='green',marker='+',label='Virginica')
    14. plt.xlabel('sepal length')
    15. plt.ylabel('petal length')
    16. plt.legend(loc=2)
    17. plt.show()

    觉得有帮助请点赞收藏

  • 相关阅读:
    linux安装MySql
    Mac 中修改默认 的Python 版本
    C/C++多态/虚函数的原理(实现过程)
    Netty入门指南之NIO 粘包与半包
    LeetCode --- 2047. Number of Valid Words in a Sentence 解题报告
    CNN卷积神经网络
    临床预测之logictic回归 1-2
    Live800:服务不是销售的终点,而是营销的起点
    libevent学习——Reactor模式
    EFCore的新东西
  • 原文地址:https://blog.csdn.net/jiebaoshayebuhui/article/details/126817921