码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【Educoder数据挖掘实训】了解数据


    【Educoder数据挖掘实训】了解数据

    开挖

    T1 数据集中有多少条数据?

    按题目直接输出行数即可

    import pandas as pd
    df = pd.read_csv("deaths.csv")
    #### Begin ####
    print(df.shape[0])
    #### End ####
    
    • 1
    • 2
    • 3
    • 4
    • 5

    T2 查看数据中的列名

    题目里给了 h e a d head head是看前几列, t a i l tail tail是看后几列。而且我们通过输出 h e a d ( ) head() head()发现会将列名输出。故此我们直接输出 h e a d ( 0 ) head(0) head(0)即可。

    import pandas as pd
    df = pd.read_csv('deaths.csv')
    #### begin ####
    print(df.head(0))
    #### end ####
    
    • 1
    • 2
    • 3
    • 4
    • 5

    T3 选择属性的类型

    关于数据类型只需要本地输出一下 t y p e type type即可。

    import pandas as pd
    df = pd.read_csv("deaths.csv")
    
    print(df.head())
    print(df.values[0][5])
    print(df.values[0][2])
    print(type(df.values[0][5]))
    print(type(df.values[0][2]))
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    答案: D D C C C B T T DDCCCBTT DDCCCBTT

    T4 查看每个属性的类型

    扫一遍一个一个输出,看一眼标准输出的格式即可。

    import pandas as pd
    df = pd.read_csv('deaths.csv')
    data = pd.DataFrame(df)
    data = data.iloc[1,:]
    #### begin ####
    
    ans = []
    for d in data :
        ans.append(type(d))
    print(ans)
    
    
    #### end ####
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    T5 查看属性的值域

    直接输出即可,根据格式可以放在列表里。

    import pandas as pd
    df = pd.read_csv('deaths.csv')
    data = pd.DataFrame(df)
    data = data.iloc[1:,1]
    #### begin ####
    ans = [min(data), max(data)]
    print(ans)
    #### end ####
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    T6 数据集的类型

    直接输出 d t y p e s dtypes dtypes即可。

    import pandas as pd
    pd.set_option('display.max_rows', 1000)
    # 读入外部数据
    data3 = pd.read_csv('deaths.csv')
    #####begin#####
    print(data3.dtypes)
    #####end######
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    T7 选择数据集的类型

    ( A B D ) B B C D ( B C ) B C (ABD)BBCD(BC)BC (ABD)BBCD(BC)BC

  • 相关阅读:
    在更一般意义上验算移位距离和假设
    AUTOSAR词典:CAN驱动Mailbox配置技术要点全解析
    批量删除Docker容器
    Python通过selenium调用IE11浏览器报错解决方法
    【考研数学】概率论与数理统计 —— 第三章 | 二维随机变量及其分布(2,常见的二维随机变量及二维变量的条件分布和独立性)
    英语语音篇 - 听音能写
    mysql高阶语句
    【Java面试】这应该是面试官最想听到的回答,Mysql如何解决幻读问题?
    数据要素与多元市场主体融合机制研究
    leetcode 42. 接雨水-java
  • 原文地址:https://blog.csdn.net/JZYshuraK/article/details/136380289
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号