• 什么是大数据?要从这三个层面来理解


    本篇内容较长,心急的小伙伴可以先看目录,直接定位到感兴趣的部分:

    • 为啥都在说“大数据”,却很难解释清楚到底啥是“大数据”?
    • 理论层面上的大数据
    • 价值层面上的大数据
    • 技术层面上的大数据


    01 为啥都在说“大数据”,却很难解释清楚到底啥是“大数据”?

    “大数据”三个字已经被喊烂了,“大数据分析”也经常被人提起。但如果真正问起来“大数据是什么?”却往往不知道如何解释。

    这其实很正常,究其原因,

    • 一是因为大家对大数据这类新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“土鳖”;
    • 二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然。

    这就导致了虽然大家都在说“大数据”,可真正理解“大数据”是啥的却少之又少!

    这篇我想尽量尝试用简洁易懂的话语和案例,来为大家解释“到底什么是大数据?”


    02 理论层面上的大数据

    最早提出大数据时代到来的是麦肯锡——

    “数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

    业界(IBM 最早定义)将大数据的特征归纳为4个“V”——

    量Volume:数据体量大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)
    多样Variety:数据类型繁多。比如网络日志、视频、图片、地理位置信息等等。
    价值Value:价值密度低,商业价值高。
    速Velocity:处理速度快。和传统的数据挖掘技术有着本质的不同。

    阿里巴巴的王坚对于大数据也有一些独特的见解,比如——

    今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。
    非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。
    你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。

    最后一点我非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。


    03 价值层面上的大数据

    大数据的真正价值不在于拥有多少数据,而在于如何使用它,我举一个非常有趣的例子:

    1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。

    那几乎是重复着千篇一律枯燥无味的数据:

    • 每支部队歼敌多少、俘虏多少
    • 缴获的火炮、车辆多少,枪支、物资多少
    • ……

    有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”

    大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?

    林彪扫视一周,见无人回答,便接连问了三句:

    “为什么那里缴获的短枪与长枪的比例比其它战斗略高?”
    “为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”
    “为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”

    林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:

    “我猜想,不,我断定!敌人的指挥所就在这里!”

    果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。

    这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长,比如:

    • 近乎实时地确定故障、问题和痛点的根本原因。
    • 比人眼更快、更准确地发现异常。
    • 通过快速将图表数据转化为洞察力来制定解决方案。
    • 在几分钟内重新计算整个风险组合。
    • 提高深度学习模型准确分类和应对不断变化的变量的能力。
    • 提前预判风险、提前准备风险方案。
    • ......

    04 技术层面上的大数据

    大数据常和云计算联系到一起,云计算思想的起源是麦卡锡在上世纪60年代提出的:

    把计算能力作为一种像水和电一样的公用事业提供给用户。

    (1)业内是这么形容两者的关系:

    • 没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;
    • 没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。

    (2)云计算和大数据之间的联系:

    • 可以提供更多基于海量业务数据的创新型服务;
    • 通过云计算技术的不断发展降低大数据业务的创新成本。

    (3)云计算和大数据之间的区别

    • 概念不同:计算改变了IT,大数据改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。
    • 目标受众不同:云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,大数据的决策者是业务层。

    (4)SaaS、PaaS、IaaS之间的区别

    最后给大家补充阅读下,SaaS、PaaS、IaaS之间的区别是什么。

    通俗解释: IaaS,PaaS和SaaS的区别

    以上。

  • 相关阅读:
    Python数据分析案例—淘宝用户行为分析
    文献管理软件Zotero的安装和使用
    原创AJAX + PHP 编辑器内容自动备份草稿保存到本地 (适用ueditor百度编辑器或其它) 内容变化后自动触发备份txt文件
    【驱动开发】实现三盏灯的控制,编写应用程序测试
    【CSS基础】基础选择器+字体文本相关样式
    量子计算新突破!来源于150年前的思想实验
    【算法100天 | 20】有环/无环链表的相交问题(Java实现)
    11.前端笔记-CSS盒子模型-外边距margin
    (Research)高分辨率单细胞图谱揭示非小细胞肺癌组织驻留中性粒细胞的多样性和可塑性
    推荐一款redis可视化链接工具,不同于RedisDesktopManager,功能更强大
  • 原文地址:https://blog.csdn.net/BeWorkingMan/article/details/127765856