• 【Educoder数据挖掘实训】了解数据


    【Educoder数据挖掘实训】了解数据

    开挖

    T1 数据集中有多少条数据?

    按题目直接输出行数即可

    import pandas as pd
    df = pd.read_csv("deaths.csv")
    #### Begin ####
    print(df.shape[0])
    #### End ####
    
    • 1
    • 2
    • 3
    • 4
    • 5

    T2 查看数据中的列名

    题目里给了 h e a d head head是看前几列, t a i l tail tail是看后几列。而且我们通过输出 h e a d ( ) head() head()发现会将列名输出。故此我们直接输出 h e a d ( 0 ) head(0) head(0)即可。

    import pandas as pd
    df = pd.read_csv('deaths.csv')
    #### begin ####
    print(df.head(0))
    #### end ####
    
    • 1
    • 2
    • 3
    • 4
    • 5

    T3 选择属性的类型

    关于数据类型只需要本地输出一下 t y p e type type即可。

    import pandas as pd
    df = pd.read_csv("deaths.csv")
    
    print(df.head())
    print(df.values[0][5])
    print(df.values[0][2])
    print(type(df.values[0][5]))
    print(type(df.values[0][2]))
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    答案: D D C C C B T T DDCCCBTT DDCCCBTT

    T4 查看每个属性的类型

    扫一遍一个一个输出,看一眼标准输出的格式即可。

    import pandas as pd
    df = pd.read_csv('deaths.csv')
    data = pd.DataFrame(df)
    data = data.iloc[1,:]
    #### begin ####
    
    ans = []
    for d in data :
        ans.append(type(d))
    print(ans)
    
    
    #### end ####
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    T5 查看属性的值域

    直接输出即可,根据格式可以放在列表里。

    import pandas as pd
    df = pd.read_csv('deaths.csv')
    data = pd.DataFrame(df)
    data = data.iloc[1:,1]
    #### begin ####
    ans = [min(data), max(data)]
    print(ans)
    #### end ####
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    T6 数据集的类型

    直接输出 d t y p e s dtypes dtypes即可。

    import pandas as pd
    pd.set_option('display.max_rows', 1000)
    # 读入外部数据
    data3 = pd.read_csv('deaths.csv')
    #####begin#####
    print(data3.dtypes)
    #####end######
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    T7 选择数据集的类型

    ( A B D ) B B C D ( B C ) B C (ABD)BBCD(BC)BC (ABD)BBCD(BC)BC

  • 相关阅读:
    无人机的工作原理
    Pintia(拼题A)刷题插件 on VS Code
    腾讯正式开源 Spring Cloud Tencent,微服务套件又多一个选择
    圆方树 useful things
    数据结构——树
    mEngine.hasImplicitBatchDimension
    【C语言】文件相关操作
    精通Linux系列第三章:文件系统管理与权限设置(含目录结构思维导图)
    Spring boot再来一遍
    c# string字符串连接原理
  • 原文地址:https://blog.csdn.net/JZYshuraK/article/details/136380289