• Python学习笔记:Jupyter Notebook快速入门案例:学习时间与成绩的关系


    Python学习笔记:Jupyter Notebook快速入门案例:学习时间与成绩的关系

    源教程地址:https://www.bilibili.com/video/BV1Q4411H7fJ?p=2&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
    是对新手很友好的入门教程,操作简单,容易上手

    Jupyter Notebook常用快捷键:
    在这里插入图片描述
    导入库

    import pandas as pd
    import matplotlib.pyplot as plt
    %matplotlib inline 
    

    在这里插入图片描述
    导入数据并且查看

    dataset =pd.read_csv('D:\StudyFiles\Jupyter\zihaopython-master\dataForJupyter\studentScores/studentscores.csv')
    dataset.head(10)
    

    在这里插入图片描述
    查看数据类型,二维表格
    在这里插入图片描述

    dataset.shape
    
    dataset.columns
    

    查看数据信息
    在这里插入图片描述

    dataset.info()
    
    dataset.describe()
    

    提取数据特征
    在这里插入图片描述

    feature_columns=['Hours']
    label_column=['Scores']
    '
    运行
    features=dataset[feature_columns]
    label=dataset[label_column]
    

    这里我感觉是和R语言类似,head(),tail()表示正序/逆序的前几个,一般有个默认值,R语言好像是6,这里看起来是5(即调用这俩函数的时候找出这组数据的最前5个或者最后5个)
    在这里插入图片描述

    features.head()
    
    type(features)
    
    label.tail()
    

    在这里插入图片描述

    label.head(3)
    

    把提出的feature和label的值分别赋予X、Y

    X=features.values
    Y=label.values
    

    在这里插入图片描述
    输出X和Y的值看一下
    这里使用的是一个很常用的办法,把拿到的二维表格数据分开成了俩个一维数组

    X
    
    Y
    

    在这里插入图片描述
    拆分训练集和测试集:
    在这里插入图片描述

    from sklearn.model_selection import train_test_split
    X_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=1/4,random_state=0)
    
    from sklearn.linear_model import LinearRegression
    regressor = LinearRegression()
    regressor=regressor.fit(X_train,Y_train)
    
    Y_pred = regressor.predict(X_test)
    

    将得到的结果可视化:
    训练集:

    #散点图:红色表示训练集的点
    plt.scatter(X_train,Y_train,color='red')
    #线图:蓝色线表示由训练集训练出的线性回归模型
    plt.plot(X_train,regressor.predict(X_train),color='blue')
    plt.show()
    

    红点是训练集的数据,根据现有数据,得到一个蓝线作为模型
    在这里插入图片描述
    测试集:
    测试集得到的蓝线来看是否在训练集还适用,发现基本上能跟红点对上,而且红点大多均匀分布两侧,则说明这个模型比较成功
    在这里插入图片描述

    #散点图:红色点表示测试集的点
    plt.scatter(X_test,Y_test,color='red')
    #线图:蓝色线表示对测试集进行预测的结果
    plt.plot(X_test,regressor.predict(X_test),color='blue')
    plt.show()
    

    最后是一些笔记:
    在这里插入图片描述

    另外,导出转PDF的时候直接选择“浏览器——打印”比安装那俩软件更加方便快捷,我安装完搜出来需要的俩软件之后,还是老样子Interval Server Error……但是看浏览器打印很方便效果也不错就没管了。
    在这里插入图片描述
    效果如图,PDF我也会上传CSDN
    在这里插入图片描述

  • 相关阅读:
    .NET 程序读取当前目录避坑指南
    MySQL的多表关联查询
    2024年测试工程师必看系列之fiddler设置手机端抓包全套教程
    day02论文学习:能够使大语言模型产生带有引用的文章
    .NET8.0 AOT 经验分享 FreeSql/FreeRedis/FreeScheduler 均已通过测试
    9. Vue3中如何将虚拟节点渲染成真实节点
    【EI会议】第三届信息控制、电气工程及轨道交通国际学术会议(ICEERT 2023)
    数据库笔记
    【附源码】Python计算机毕业设计民宿客房管理系统
    U++ 游戏类 学习笔记
  • 原文地址:https://blog.csdn.net/bailichen800/article/details/126956459