码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Python大数据之pandas快速入门(一)


    文章目录

    • pandas快速入门
      • 学习目标
      • 1. DataFrame 和 Series 简介
      • 2. 加载数据集(csv和tsv)
        • 2.1 csv和tsv文件格式简介
        • 2.2 加载数据集(tsv和csv)

    pandas快速入门

    学习目标

    • 能够知道 DataFrame 和 Series 数据结构
    • 能够加载 csv 和 tsv 数据集
    • 能够区分 DataFrame 的行列标签和行列位置编号
    • 能够获取 DataFrame 指定行列的数据

    1. DataFrame 和 Series 简介

    pandas是用于数据分析的开源Python库,可以实现数据加载,清洗,转换,统计处理,可视化等功能。

    pandas最基本的两种数据结构:

    1)DataFrame

    • 用来处理结构化数据(SQL数据表,Excel表格)
    • 可以简单理解为一张数据表(带有行标签和列标签)

    2)Series

    • 用来处理单列数据,也可以以把DataFrame看作由Series对象组成的字典或集合
    • 可以简单理解为数据表的一行或一列

    img

    2. 加载数据集(csv和tsv)

    2.1 csv和tsv文件格式简介

    csv 和 tsv 文件都是存储一个二维表数据的文件类型。

    注意:其中csv文件每一列的列元素之间以逗号进行分割,tsv文件每一行的列元素之间以\t进行分割。

    img

    2.2 加载数据集(tsv和csv)

    1)首先打开jupyter notebook,进入自己准备编写代码目录下方,创建01-pandas快速入门.ipynb文件:

    img

    注意:提前将提供的 data 数据集目录放置到 01-pandas快速入门.ipynb 同级目录下,后续课程会加载 data 目录下的数据集。

    2)导入 pandas 包

    注意:pandas 并不是 Python 标准库,所以先导入pandas

    # 在 ipynb 文件中导入 pandas
    import pandas as pd
    
    • 1
    • 2

    3)加载 csv 文件数据集

    tips = pd.read_csv('./data/tips.csv')
    tips
    
    • 1
    • 2

    img

    4)加载 tsv 文件数据集

    # sep参数指定tsv文件的列元素分隔符为\t,默认sep参数是,
    china = pd.read_csv('./data/china.tsv', sep='\t')
    china
    
    • 1
    • 2
    • 3

    img

  • 相关阅读:
    [oeasy]python0022_框架标题的制作_banner_结尾字符串_end
    less 基础语法
    层叠、继承与盒模型
    ElasticSearch搭建集群
    贪心算法——背包问题
    【计算机网络笔记七】应用层(四)HTTP 通过Content-Type提交数据的方式
    Unity Shader—04 Unity中的基础光照
    简单聊聊ThreadLocal吧
    2024年消防设施操作员考试题库及答案
    05-接口和异常处理
  • 原文地址:https://blog.csdn.net/xianyu120/article/details/133300011
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号