随着互联网+的不断深入,网络中的数据量飞速膨胀。身处信息的海洋,在这个数据高速爆发的时代,企业想要快速发展,不能只简单地靠历史的经验,想要快速成功,就要认清数据、企业、社会三者之间的联系,因此就出现了数据分析这个职业。尤其是在以数据驱动为首的百度、美团、以及京东等企业中,数据分析都扮演了重要的角色。现在的传统企业也慢慢意识到了数据驱动的重要性,大部分企业也都在学着用数据分析解决问题,或者提升业绩,这类公司在进行数字化转型。比如:银行企业的中国银联,交通银行的东方航空,通信行业的移动、联通、电信等都在通过数据进行探索。
数据分析是通过技术手段,对业务进行流程梳理、指标监控、问题诊断以及效果评估,它的目的是对过去发生的现象进行评估和分析,并在这个基础上对未来事物的发生和发展做出预期分析处理,以此指导未来的一些关键性决策。
随着数据量的不断增长,数据处理以及信息挖掘技术也在迅速发展,人们对于数据的处理也不仅仅是数据存储以及信息的简单探索,而是结合一些模型的应用进一步分析。虽然现在出现了大量数据分析技术,例如:Python、R等编程语言以及MySQL、Hadoop等数据存储技术,但是Excel凭借其操作简单、灵活以及宽广的覆盖面,在数据分析中占据着一席之地。
数据分析流程可以概括为:数据理解、提取数据、数据清洗、数据分析、数据可视化、撰写报告。
创建工作簿、工作表
表格文件其实就是工作簿。
工作表就是我们下方切换的N个活动页,创建一个工作簿的时候会自动的创建一个工作表。
单元格就是我们现在能够看到的每一个方格。
保护功能
操作方法
填充柄的使用
复制单元格:同时将单元格的样式和内容复制给其他单元格
填充序列:复制单元格样式,将单元格内容按照一定规则变化
仅填充格式:只复制单元格样式
不带格式填充:只将单元格内容按照一定规则变化
以年填充:按照年份变化。(以月填充、以天数填充同理)
填充工作日:与以天数填充同理,仅仅去除每周周末
操作步骤:
选中单元格,鼠标放置到单元格右下角后右键向下拖拽,选择对应选项。
快速填充
方法:
从数据列后方相邻单元格输入内容,选中单元格,鼠标放置到单元格右下角后右键向下拖拽,选择对应选项。
自定义列表填充
自定义列表位置:文件 --> 选项 --> 高级 --> 编辑自定义列表
多个不连续单元格同数据
Ctrl+鼠标左键选中单元格,填入数据,Ctrl+Enter补全
多个不连续单元格不同数据
选中下方数据,Ctrl + G,选中空值,对空值进行单元格引用,Ctrl + Enter
单元格引用:在输入框内输入“=”然后点击要填入的数据,按Ctrl + Enter
文本记忆输入(注:必须连续单元格输入才会生效)
1.Alt + 向下箭头
2.直接输入内容,根据提示选择回车。
数据有效性
选中单元格 --> 数据 --> 数据验证 --> 数据验证 --> 设置 --> 允许:序列 --> 来源
圈释无效数据
选中单元格 --> 数据 --> 数据验证 -->圈释无效数据
操作:开始 --> 查找和选择 --> 定位条件(Ctrl + G或者F5)
步骤:选中区域–> 开始–>查找与选择–>替换–> 勾选单元格匹配
快捷键:Ctrl+F
操作:Ctrl + Shift + 方向键
优点:可以快速选择规模较大的区域数据
缺点:如果起始行或者起始列出现空值,会出现选择不全的问题,需要稍加注意。
要求:使用选择性粘贴方法在增加比例列实现“金额”数据列数据增加25%。
操作步骤:
1.输入需要增加的比例。
2.将需要变化的数据提前复制一份。
3.复制比例,选中数据,选择正确的选项即可。
操作:视图 --> 冻结窗格
注意:如果要冻结前N行,要选到第N+1行再冻结。冻结列同理
导入外部数据
Excel支持从外部导入数据,导入途径包含:本地各类存储数据的文件、数据库、网站等。
操作方式:数据 --> 获取数据 --> 选择对应功能选项
Excel中存在5中数据类型,分别是:
文本、数值、日期和时间、逻辑值、错误值
文本:姓名、性别、住址以及一些不需要计算的数值,比如:手机号、银行卡号等。
数值:整数、小数、科学计数等需要计算的数字。
逻辑值:TRUE、FALSE。
错误值:错误值通常是在使用公式时,由于种种原因没能返回需要的结果,而是返回了一串不同字符组成的错误值代码。
常见错误值:
#VALUE! 键入公式的方式错误。或者引用的单元格错误。
#DIV/0! 这个错误值是说数字被0除了,因为0不能当被除数嘛。
#NAME? 在公式中是因为公式名称中出现拼写错误
#N/A! 公式找不到引用的值
#REF! 公式引用无效单元格时将显示 #REF! 错误。 当公式所引用的单元格被删除或被粘贴覆盖时最常发生这种情况。
#NUM! 公式或函数中包含无效数值时
如果单元格所含的数字、日期或时间比单元格宽,或者单元格的日期时间公式产生了一个负值,就会产生#####
#NULL! 如果在公式中使用了不正确的区域运算符,或者在区域引用之间使用了交叉运算符(空格字符)来指定不相交的两个区域的交集,将显示此错误。
如何查看Excel单元格数据类型:TYPE()
数字=1
文本=2
逻辑值=4
误差值=16
数组=64
复合数据=128
对整个单元格以及单元格中的数据应用格式:一种方式是,更改单元格中文本格式,可以将单元格中文本格式改为数值、货币、时间等Excel定义格式,也可以改为按照一定规则设定的自定义格式。
另一种方式是,将单元格想象成图片框,框中的图片就是数据。 设置单元格的格式可能包括添加边框、添加颜色或阴影,或更改单元格的大小和样式
注释:以常规的数字显示,相当于"分类"列表中的"常规"选项。 代码:G/通用格式。 效果:52 显示为 52;52.5
显示为 52.5
自定义格式代码|原始数值|格式后
G/通用格式|47.5|47.5
注释:数字占位符。只显有意义的零而不显示无意义的零。小数点后数字如大于"#“的数量,则按”#"的位数四舍
五入。 代码:###.## 效果:181.2 显示为 181.2, 18.4328 显示为 18.43
自定义格式代码 原始数值 格式后
#,##0 1556.122 1,556
###.## 181.2 181.2
###.## 18.4328 18.43
0
注释:数字占位符。如果单元格的内容大于占位符,则显示实际数字,如果小于点位符的数量,则用0补足。 代码:
00000。 效果:5201314 显示为 5201314;521 显示为 00521(5201314的位数大于占位符的位数,因此显示
实际数字;520的位数小于占位符位数,因此用0补足)。
用0补足的情况,不能改变原有数字的大小,因此整数部分0补足在前面,小数部分,0补足在后面。
自定义格式代码 原始数值 格式后
00000 5201314 5201314
00000 521 521
00.000 520.13 520.130
00.000 5.2 05.200
00.000 12.2 12.200
从上图可见,可以利用代码0来让数值显示前导零,并让数值固定按指定位数显示。下图是使用#与0组合为最
常用的带小数的数字格式。
自定义格式代码 原始数值 格式后
#0.0 123456 123456.0
#0.0 123.543 123.5
#0.0 0 0
?
注释:数字占位符。在小数点两边为无意义的零添加空格,以便当按固定宽度时,小数点可对齐;也可以用于具有
不同位数的分数。
自定义格式代码 原始数值 格式后
???.??? 123.456 123.456
???.??? -12.325 -12.325
???.??? 5.21 5.21
???.??? 0
@
注释:文本占位符。如果只使用单个@, 作用是引用原始文本;如果使用多个@, 则可以重复文本。
自定义格式代码 原始数值 格式后
“售后服务部”@“科” 营销 售后服务部营销科
“售后服务部”@“科” 采购 售后服务部采购科
注意:@符号的位置决定了Excel输入的数字数据相对于添加文本的位置
注释:重复下一次字符,直到充满列宽
自定义格式代码 原始数值 格式后
@*- 123 123---------
,
注释:千位分隔符
自定义格式代码 原始数值 格式后
#,### 12000 12,000
#,### 123456789 123,456,789
“”
注释:用文本格式显示接下来的字符。“文本”:显示双引号里面的文本;“”:用文本格式显示接下来的字符。和
“” 用途相同都是显示输入的文本, 且输入后会自动转变为双引号表达。
自定义格式代码 原始数值 格式后
“人民币”#,##0"百万" 1234567890 人民币1,234,567,890百万
“人民币”#,##0,“百万” 1234567890 人民币1,235百万
“¥”#,##0,“百万” 1234567890 ¥1,235百万
[]
注释:条件格式代码。可以将条件或者颜色(颜色代码也是一种条件)写入[],从而实现自定义条件。 (默认
情况下自定义格式的四个区段的条件是固定的,即分别为"正数格式;负数格式;零值格式;文本格式",使用[]可以自
行设置每个区段的条件) 可以根据单元格内容判断后再设置格式。条件格式化只限于使用三个条件,其中两个
条件是明确的,另个是“所有的其他”。
区段1;区段2;区段3;区段4
区段1:[条件1]要返回的值
区段2:[条件2]要返回的值
不满足条件1、2要返回的值
文本格式
自定义格式代码 原始数值 格式后
[>0]“正数”;[=0]“零”;“负数” -1 -负数
颜色
注释:用指定的颜色显示字符。可有八种颜色可选:红色、黑色、黄色、绿色、白色、蓝色、青色和洋红。 代
码:[蓝色];[红色];[黄色];[绿色] 效果:显示结果为正数为蓝色, 负数显示红色, 零显示黄色, 文本则显示为绿色
自定义格式代码 原始数值 格式后
[红色][<=100];[黑色][>100] 101 101
[颜色1] 101 101
注:颜色代码的另一种方式,[颜色N]:是调用调色板中颜色, N 是 [1,56] 之间的整数。 代码:[颜色1];[颜色2];
[颜色3];[颜色4] 效果:显示结果为正数为调色板上第1种颜色……
时间和日期代码
“YYYY"或"YY”:按四位(19009999)或两位(0099)显示年
“DD"或"D”:以两位(01~31)或一位(1-31)来表示天。
“DD"或"D”:以两位(01~31)或一位(1-31)来表示天。
自定义格式代码 原始数值 格式后
YYYY-MM-DD 2017年10月24日 2017-10-24
HH:MM:SS 21:5:28 21:05:28