在互联网高速发展的当今,5G的兴起加速了数据传输的速度;与此同时,智能物联网如智慧家电、可穿戴设备等产品的火热,进一步扩充了数据获取的渠道。不仅仅在网页上、手机和电脑应用上以秒计产生海量数据,智能设备同时也在捕捉着大量的信息。
可以说,大数据在体量和传输效率上都进入了新的发展阶段。作为企业和品牌以及社会的宝贵财富,大数据的价值不言而喻。而数据可视化,又在极大程度上方便了大数据价值的视觉呈现。今天,径妹儿我就与大家一起探讨一下关于大数据可视化的相关概念以及一些案例。
这是一个复合概念,包含大数据+数据可视化两个方面。大数据指的是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有高度多样性(即数据种类、来源、形式的多样化)、大体量和高速性(数据增速快且具有时效性,需要高规格的处理和响应速度)这三个特点。
作为极具研究价值的大数据资源,要想让品牌决策者能够快、准、狠地汲取其精华,还需要数据可视化进行加工和精准化,从而为决策提供良好的数据背书,提高决策效率和准确性。数据可视化是以图形图表的形式将原始的信息和数据表示出来。
通过使用图表,图形和地图等可视元素,数据可视化可以提供一种便于观察和理解数据内在的异常值、趋势、规律甚至是模式的手法。因此总的来说,大数据可视化就是通过对大数据进行获取、清洗、分析,将所示分析结果通过图形、图标等形式展示出来的一个过程。
相比于千篇一律的数字表格,人类的目光和注意力更容易被颜色和图案吸引:比如从蓝色中快速识别红色,从圆形中快速识别出方形。
因此,大数据可视化可以帮助我们更加科学地从视觉角度对海量数据进行诠释,进而引发观看者的兴趣,并通过不同的表现形式和突出手段将观看者的注意力集中在某一点上,同时令其获取更加有价值的、容易内化和理解的信息。
大数据可视化主要需要两大步骤:数据分析和分析结果的可视化转化。初级的数据可视化效果可能是简单的一个树状图、辐射图、直方图、扇形图等等,做到用数据说话;
然而,我们更希望看到的是能够有张有弛,有轻有重的可视化结果,从而让观看者能够一眼抓到想要的数据维度以及关键值,这就需要通过选择恰当的表现手法实现真正的让数据说话。
接下来,将为大家举两个简单的例子帮助大家理解“用数据说话”和“让数据说话”两个维度的数据可视化效果。
例一:用数据说话 vs. 让数据说话
图1:大数据可视化——用数据说话例1
图2:大数据可视化——让数据说话例1
这是一个简单的例子,表示的是同一组学生在参与某项目前后对科学的看法。通过将收集的调查数据进行基本的清洗和分析,便可得出项目实行前后学生对科学的不同看法所占百分比。
如图1,简单的方法就是将这两个不同时间节点的数据做成两个饼状图:这一步其实只是将数据分析的结果进行了一个最基本的展示,而两个饼状图一定程度上割裂了参与项目前后的数据的联系,所以当向观众展示的时候,还需要观众对数据进行一个思考和加工才能够得出进一步的结论。
而图2则是将项目实行前后的数据整合在一起,可以清楚地让人观察出学生对科学的看法的在两个时间阶段的对比效果。与此同时,适当的文字说明不仅仅能够对图形效果有一个辅助作用,有时甚至能一阵见血地道出数据中的关键趋势、异常值、规律等,让观众一眼就能够get到可视化数据中的重点,实现真正的“让数据说话”。
例2:
图3:大数据可视化——用数据说话例2
图4:大数据可视化——让数据说话例2
这是一个电影院全年售票数量统计的例子。我们可以看出,收集的数据经过简单的清洗,就能够做出图3中的直方图,实际上,一数据可视化的过程,甚至都没有深入地进行数据分析,就将售票结果展示出来了;
尽管针对不同月份中两种票况有一个颜色分类和对比,但是仍旧需要观众对该图表进行一个主观的分析和判断,实际上还是用数据说话。而更加精妙的大数据可视化,是根据数据的价值所在以及分析的目的来有的放矢地对数据进行一个关联和展示:
如图4所示,同样的例子将直方图修改为折线图,换一个形式,则能够迅速将一年12个月的售票数量趋势显示出来,让观众很容易捕捉到数据的规律;
与此同时,在数据分析过程中将售票数量与员工人数进行一个关联,在趋势变化的异常值处加入员工离职数据,可以让整个可视化图表为观众解释,这一趋势出现的影响因素,也就做到了让数据说话,进一步挖掘和展示出了数据的价值。