大数据的定义:在一定时间范围内用常规软件工具进行捕捉、管理和处理数据集合。
经典案例:(1)啤酒与尿布
谷歌与流感
大数据的范围:采集、存储、搜索、共享、传输、分析和可视化。
内存:运行速度。
存储:储存容量。
海量数据产生:(1)来自大人群互联网
(2)来自大量传感器机械
(3)科学研究及行业多结构专业数据
1994年:预见大数据
1997年:用大数据描述超级计算机产生的大量信息。
2003—2006年:谷歌提出大数据可重用方案。
2008年:提出大数据概念。
2009年:大数据逐渐走进互联网。
2012年:大数据成为一种新的资产类别。
2013年:大数据元年
各数据量单位:KB>MB>GB>TB>PB>EB>ZB>YB>NB>DB
单位以PB衡量的数据可称为大数据。
1字节(8位)→1个英文字母或二进制8位数
1文字=2字节=16位
实验(第一范式)→理论(第二范式)→计算(第三范式)→数据(第四范式)
存储量大
大量化
增量大
来源多 搜索引擎
格式多 结构化数据
非结构化数据
快速化
有价值
1.3大数据的关键技术
一.大数据预处理技术:数据采集数据存取基础架构支持计算结果展示
二.大数据存储技术:储存设备能持久可靠的的存储数据提供可伸缩接口提供高效查询,更新等操作
三.大数据分析技术:数据处理统计和分析数据挖掘模型预测
1.4大数据的典型计算架构
Haddop(处理本地数据)Spark(收集并更新)Storm(延迟毫秒级)
云计算概述:无处不在的云计算比如电子日历,电子导航,钉钉等
什么是云计算?像水,电,煤(资源性产品)一样利用你的it资源(计算机储存网络资源)
关键词:按需使用,超大规模,高弹性
定义:指按需使用it资源和应用程序,通过互联网按使用量付费。
四种云:
生活中的例子:
2.1云计算的基本特征
2.2云计算的发展背景
1.20世纪60年代,计算机革命
2.20世纪90年代,互联网革命
1994年weblo(单向传递)
2004年weblo(双向传递)
3.2010年,移动互联网革命
2.4云计算模下的it建设
特点:
优点:省时省力省电省钱省人省地
2.5云计算的特点
2.6云计算的主要服务模式
IaaS第一层
SaaS第二层
PaaS第三层
Iaas(基础设施即服务)(租用)关键技术:虚拟化技术
SaaS(平台即服务)(编程)数据库服务web应用
特点:1.简化开发人员
关键技术:1.分布式并计算2.分布式储存
SaaS(软件即服务)(用户)关键技术:多租户技术
三种服务的区别
IaaS(最低层) 提供基础设施服务
PaaS(提供软件) 部署平台
SaaS(拿来即用)例如:云计算服务=做饭做餐
云计算服务商=饭店
IaaS=提供厨房,锅具等
不提供食材和技术
PAAS提供厨房切好的食材
不提供技术
SaaS提供厨房,食材,技术
IaaS租车
PaaS租车+司机
SaaS坐公交
三虚拟化技术
作为一种计算机资源管理技术将各种的工厂实体资源抽象的转化为另一种形式的技术
云计算1.0 以虚拟化为核心
云计算2.0 以资源为核心
云计算3.0 以应用为核心
云计算:一种服务
虚拟化:一种技术基础
物理机:
虚拟机:
操作系统:Guest,OS
虚拟机:Guest,Machine
VMM(虚拟监控器)
硬件:Host,Machine
虚拟化的特点
区分可分为多个虚拟机
隔离虚拟机与虚拟机之间相互独立
封装独立的文件夹形式
相对于硬件独立屏蔽底层硬件不兼容问题
虚拟化类型
一.寄居虚拟化:在主操作系统上安装和运行的一个程序
特点:(1)简单易于实现
特点:
特点
相对于寄居虚拟化性能高
相对于裸金属虚拟化不需要内核开发
支持多种操作系统
需要底层硬件支持虚拟扩展功能
虚拟化层构架:
全虚拟化(KVM),半虚拟化(Xen),硬件辅助虚拟化
即所抽象的VM具有完全的物理特性虚拟化层负责捕获CPU指令,为指令访问硬件充当媒介
特点:OS无需修改速度和功能比较好使用非常简单移植性好
特点:架构更简单对OS进行修改用户体验比较麻烦速度上占一定优势
7.虚拟化技术的优势和劣势
优势:减少物理资源的投入节约成本
虚拟化数据资源迁移方便
提高物理资源的使用率
高价环保节省能源
易于自动化维护与操作减少维护成本
数据安全更有保障
劣势:目前此界没有统一的虚拟化技术标准平台没有开放的协议
如果没有对数据进行备份用虚拟化技术会存在一定的风险
虚拟化数据中心的迁移特别是对在线服务的迁移对用户影响巨大
KVM(性能) Xen(安全)
全虚拟化半虚拟化
内置在内核中需要修改内核
便于版本安装升级维护更新版本重新编辑整个内核
性能高隔离好