• 01数据分析与Excel


    数据分析与Excel

    1. 数据分析

    随着互联网+的不断深入,网络中的数据量飞速膨胀。身处信息的海洋,在这个数据高速爆发的时代,企业想要快速发展,不能只简单地靠历史的经验,想要快速成功,就要认清数据、企业、社会三者之间的联系,因此就出现了数据分析这个职业。尤其是在以数据驱动为首的百度、美团、以及京东等企业中,数据分析都扮演了重要的角色。现在的传统企业也慢慢意识到了数据驱动的重要性,大部分企业也都在学着用数据分析解决问题,或者提升业绩,这类公司在进行数字化转型。比如:银行企业的中国银联,交通银行的东方航空,通信行业的移动、联通、电信等都在通过数据进行探索。

    1.1 什么是数据分析

    数据分析是通过技术手段,对业务进行流程梳理、指标监控、问题诊断以及效果评估,它的目的是对过去发生的现象进行评估和分析,并在这个基础上对未来事物的发生和发展做出预期分析处理,以此指导未来的一些关键性决策。

    随着数据量的不断增长,数据处理以及信息挖掘技术也在迅速发展,人们对于数据的处理也不仅仅是数据存储以及信息的简单探索,而是结合一些模型的应用进一步分析。虽然现在出现了大量数据分析技术,例如:Python、R等编程语言以及MySQL、Hadoop等数据存储技术,但是Excel凭借其操作简单、灵活以及宽广的覆盖面,在数据分析中占据着一席之地。

    1.2 数据分析流程

    数据分析流程可以概括为:数据理解、提取数据、数据清洗、数据分析、数据可视化、撰写报告。

    2. Excel用法

    2.1创建和保护

    保护工作簿
    保护单元表
    锁定单元格

    1. 创建工作簿、工作表

      表格文件其实就是工作簿。
      工作表就是我们下方切换的N个活动页,创建一个工作簿的时候会自动的创建一个工作表。
      单元格就是我们现在能够看到的每一个方格。

    2. 保护功能

      • 保护工作簿: 防止其他用户对工作簿的结构进行更改,如移动、删除或者添加工作表。
      • 保护工作表: 通过限制其他用户的编辑能力来防止他们进行不需要的更改。
      • 保护单元格: 防止数据被篡改。
    3. 操作方法

      • 保护单元格:选中单元格单元格 --> 开始 --> 格式 --> 锁定单元格、保护工作表
      • 保护工作表:在指定工作表右键 --> 保护工作表
      • 保护工作簿:审阅 --> 保护工作簿

    2.2快速输入

    填充柄

    1. 填充柄的使用

      复制单元格:同时将单元格的样式和内容复制给其他单元格

      填充序列:复制单元格样式,将单元格内容按照一定规则变化

      仅填充格式:只复制单元格样式

      不带格式填充:只将单元格内容按照一定规则变化

      以年填充:按照年份变化。(以月填充、以天数填充同理)

      填充工作日:与以天数填充同理,仅仅去除每周周末

      操作步骤:

      选中单元格,鼠标放置到单元格右下角后右键向下拖拽,选择对应选项。
      快速填充

    2. 快速填充

      方法:

      从数据列后方相邻单元格输入内容,选中单元格,鼠标放置到单元格右下角后右键向下拖拽,选择对应选项。

    3. 自定义列表填充

      自定义列表位置:文件 --> 选项 --> 高级 --> 编辑自定义列表
      自定义列表填充

    4. 多个不连续单元格同数据

      Ctrl+鼠标左键选中单元格,填入数据,Ctrl+Enter补全

    5. 多个不连续单元格不同数据

      选中下方数据,Ctrl + G,选中空值,对空值进行单元格引用,Ctrl + Enter

      单元格引用:在输入框内输入“=”然后点击要填入的数据,按Ctrl + Enter

    6. 文本记忆输入(注:必须连续单元格输入才会生效)

      1.Alt + 向下箭头

      2.直接输入内容,根据提示选择回车。

    2.3数据验证

    在这里插入图片描述

    1. 数据有效性

      选中单元格 --> 数据 --> 数据验证 --> 数据验证 --> 设置 --> 允许:序列 --> 来源

    2. 圈释无效数据

      选中单元格 --> 数据 --> 数据验证 -->圈释无效数据

    2.4定位条件

    操作:开始 --> 查找和选择 --> 定位条件(Ctrl + G或者F5)

    2.5单元格查找和替换

    在这里插入图片描述
    步骤:选中区域–> 开始–>查找与选择–>替换–> 勾选单元格匹配

    快捷键:Ctrl+F

    2.6快速选择数据

    操作:Ctrl + Shift + 方向键

    优点:可以快速选择规模较大的区域数据

    缺点:如果起始行或者起始列出现空值,会出现选择不全的问题,需要稍加注意。

    2.7选择性粘贴

    在这里插入图片描述

    要求:使用选择性粘贴方法在增加比例列实现“金额”数据列数据增加25%。

    操作步骤:
    1.输入需要增加的比例。
    2.将需要变化的数据提前复制一份。
    3.复制比例,选中数据,选择正确的选项即可。

    2.8冻结单元格

    操作:视图 --> 冻结窗格

    注意:如果要冻结前N行,要选到第N+1行再冻结。冻结列同理

    2.9导入外部数据

    导入外部数据
    Excel支持从外部导入数据,导入途径包含:本地各类存储数据的文件、数据库、网站等。

    操作方式:数据 --> 获取数据 --> 选择对应功能选项

    2.10Excel数据结构

    Excel中存在5中数据类型,分别是:
    文本、数值、日期和时间、逻辑值、错误值

    文本:姓名、性别、住址以及一些不需要计算的数值,比如:手机号、银行卡号等。

    数值:整数、小数、科学计数等需要计算的数字。

    逻辑值:TRUE、FALSE。

    错误值:错误值通常是在使用公式时,由于种种原因没能返回需要的结果,而是返回了一串不同字符组成的错误值代码。

    常见错误值:
    #VALUE! 键入公式的方式错误。或者引用的单元格错误。

    #DIV/0! 这个错误值是说数字被0除了,因为0不能当被除数嘛。

    #NAME? 在公式中是因为公式名称中出现拼写错误

    #N/A! 公式找不到引用的值

    #REF! 公式引用无效单元格时将显示 #REF! 错误。 当公式所引用的单元格被删除或被粘贴覆盖时最常发生这种情况。

    #NUM! 公式或函数中包含无效数值时

    如果单元格所含的数字、日期或时间比单元格宽,或者单元格的日期时间公式产生了一个负值,就会产生#####

    #NULL! 如果在公式中使用了不正确的区域运算符,或者在区域引用之间使用了交叉运算符(空格字符)来指定不相交的两个区域的交集,将显示此错误。

    如何查看Excel单元格数据类型:TYPE()

    数字=1

    文本=2

    逻辑值=4

    误差值=16

    数组=64

    复合数据=128

    2.11 单元格格式

    在这里插入图片描述

    对整个单元格以及单元格中的数据应用格式:一种方式是,更改单元格中文本格式,可以将单元格中文本格式改为数值、货币、时间等Excel定义格式,也可以改为按照一定规则设定的自定义格式。
    另一种方式是,将单元格想象成图片框,框中的图片就是数据。 设置单元格的格式可能包括添加边框、添加颜色或阴影,或更改单元格的大小和样式

    1. G/通用格式

    注释:以常规的数字显示,相当于"分类"列表中的"常规"选项。 代码:G/通用格式。 效果:52 显示为 52;52.5
    显示为 52.5
    自定义格式代码|原始数值|格式后
    G/通用格式|47.5|47.5

    1. 注释:数字占位符。只显有意义的零而不显示无意义的零。小数点后数字如大于"#“的数量,则按”#"的位数四舍
      五入。 代码:###.## 效果:181.2 显示为 181.2, 18.4328 显示为 18.43
      自定义格式代码 原始数值 格式后
      #,##0 1556.122 1,556
      ###.## 181.2 181.2
      ###.## 18.4328 18.43

    2. 0
      注释:数字占位符。如果单元格的内容大于占位符,则显示实际数字,如果小于点位符的数量,则用0补足。 代码:
      00000。 效果:5201314 显示为 5201314;521 显示为 00521(5201314的位数大于占位符的位数,因此显示
      实际数字;520的位数小于占位符位数,因此用0补足)。
      用0补足的情况,不能改变原有数字的大小,因此整数部分0补足在前面,小数部分,0补足在后面。
      自定义格式代码 原始数值 格式后
      00000 5201314 5201314
      00000 521 521
      00.000 520.13 520.130
      00.000 5.2 05.200
      00.000 12.2 12.200

    从上图可见,可以利用代码0来让数值显示前导零,并让数值固定按指定位数显示。下图是使用#与0组合为最
    常用的带小数的数字格式。
    自定义格式代码 原始数值 格式后
    #0.0 123456 123456.0
    #0.0 123.543 123.5
    #0.0 0 0

    1. ?
      注释:数字占位符。在小数点两边为无意义的零添加空格,以便当按固定宽度时,小数点可对齐;也可以用于具有
      不同位数的分数。
      自定义格式代码 原始数值 格式后
      ???.??? 123.456 123.456
      ???.??? -12.325 -12.325
      ???.??? 5.21 5.21
      ???.??? 0

    2. @
      注释:文本占位符。如果只使用单个@, 作用是引用原始文本;如果使用多个@, 则可以重复文本。
      自定义格式代码 原始数值 格式后
      “售后服务部”@“科” 营销 售后服务部营销科
      “售后服务部”@“科” 采购 售后服务部采购科
      注意:@符号的位置决定了Excel输入的数字数据相对于添加文本的位置

      注释:重复下一次字符,直到充满列宽
      自定义格式代码 原始数值 格式后
      @*- 123 123---------

    3. ,
      注释:千位分隔符
      自定义格式代码 原始数值 格式后
      #,### 12000 12,000
      #,### 123456789 123,456,789

    4. “”
      注释:用文本格式显示接下来的字符。“文本”:显示双引号里面的文本;“”:用文本格式显示接下来的字符。和
      “” 用途相同都是显示输入的文本, 且输入后会自动转变为双引号表达。
      自定义格式代码 原始数值 格式后
      “人民币”#,##0"百万" 1234567890 人民币1,234,567,890百万
      “人民币”#,##0,“百万” 1234567890 人民币1,235百万
      “¥”#,##0,“百万” 1234567890 ¥1,235百万

    5. []
      注释:条件格式代码。可以将条件或者颜色(颜色代码也是一种条件)写入[],从而实现自定义条件。 (默认
      情况下自定义格式的四个区段的条件是固定的,即分别为"正数格式;负数格式;零值格式;文本格式",使用[]可以自
      行设置每个区段的条件) 可以根据单元格内容判断后再设置格式。条件格式化只限于使用三个条件,其中两个
      条件是明确的,另个是“所有的其他”。
      区段1;区段2;区段3;区段4
      区段1:[条件1]要返回的值
      区段2:[条件2]要返回的值
      不满足条件1、2要返回的值
      文本格式
      自定义格式代码 原始数值 格式后
      [>0]“正数”;[=0]“零”;“负数” -1 -负数

    6. 颜色
      注释:用指定的颜色显示字符。可有八种颜色可选:红色、黑色、黄色、绿色、白色、蓝色、青色和洋红。 代
      码:[蓝色];[红色];[黄色];[绿色] 效果:显示结果为正数为蓝色, 负数显示红色, 零显示黄色, 文本则显示为绿色
      自定义格式代码 原始数值 格式后
      [红色][<=100];[黑色][>100] 101 101
      [颜色1] 101 101
      注:颜色代码的另一种方式,[颜色N]:是调用调色板中颜色, N 是 [1,56] 之间的整数。 代码:[颜色1];[颜色2];
      [颜色3];[颜色4] 效果:显示结果为正数为调色板上第1种颜色……

    7. 时间和日期代码
      “YYYY"或"YY”:按四位(19009999)或两位(0099)显示年
      “DD"或"D”:以两位(01~31)或一位(1-31)来表示天。
      “DD"或"D”:以两位(01~31)或一位(1-31)来表示天。
      自定义格式代码 原始数值 格式后
      YYYY-MM-DD 2017年10月24日 2017-10-24
      HH:MM:SS 21:5:28 21:05:28

    2.12条件格式设置

    1. 借助“数据条”直观分析数据。
    2. 使用“色阶”创建热图。
    3. 借助“图标集”为数据分类。
    4. 条件格式的新建、删除、编辑。
  • 相关阅读:
    【图像分割】基于樽海鞘算法的指数熵多阈值图像分割附Matlab代码
    掌握React中的useEffect:函数组件中的魔法钩子
    HTML期末作业 蛋糕bootstrap响应式网站html+css+javascript+jquery+bootstarp
    05. DataTemplate
    CORE EMU初接触
    二分查找法解题思路
    练习题57:接口的语法特征
    http协议与https协议+UDP协议和TCP协议+WebSocket协议下服务端主动去发送信息+对称加密与非对称加密+get和post请求方式区别详解
    叮咚外卖小程序6.4.3+超级跑腿2.0.3+前端完美运营版【未编译前端+教程】
    Servlet使用
  • 原文地址:https://blog.csdn.net/qq_45658696/article/details/126472142