本篇内容较长,心急的小伙伴可以先看目录,直接定位到感兴趣的部分:
- 为啥都在说“大数据”,却很难解释清楚到底啥是“大数据”?
- 理论层面上的大数据
- 价值层面上的大数据
- 技术层面上的大数据
“大数据”三个字已经被喊烂了,“大数据分析”也经常被人提起。但如果真正问起来“大数据是什么?”却往往不知道如何解释。
这其实很正常,究其原因,
这就导致了虽然大家都在说“大数据”,可真正理解“大数据”是啥的却少之又少!
这篇我想尽量尝试用简洁易懂的话语和案例,来为大家解释“到底什么是大数据?”
最早提出大数据时代到来的是麦肯锡——
“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
业界(IBM 最早定义)将大数据的特征归纳为4个“V”——
量Volume:数据体量大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)
多样Variety:数据类型繁多。比如网络日志、视频、图片、地理位置信息等等。
价值Value:价值密度低,商业价值高。
速Velocity:处理速度快。和传统的数据挖掘技术有着本质的不同。
阿里巴巴的王坚对于大数据也有一些独特的见解,比如——
今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。
非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。
你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。
最后一点我非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。
大数据的真正价值不在于拥有多少数据,而在于如何使用它,我举一个非常有趣的例子:
1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。
那几乎是重复着千篇一律枯燥无味的数据:
有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”
大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?
林彪扫视一周,见无人回答,便接连问了三句:
“为什么那里缴获的短枪与长枪的比例比其它战斗略高?”
“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”
“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”
林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:
“我猜想,不,我断定!敌人的指挥所就在这里!”
果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。
这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长,比如:
大数据常和云计算联系到一起,云计算思想的起源是麦卡锡在上世纪60年代提出的:
把计算能力作为一种像水和电一样的公用事业提供给用户。
最后给大家补充阅读下,SaaS、PaaS、IaaS之间的区别是什么。
以上。