尚学堂给同学们带来全新的Java300集课程啦!java零基础小白自学Java必备优质教程_手把手图解学习Java,让学习成为一种享受_哔哩哔哩_bilibili
为了解决传统早期IT系统在建设过程中“烟囱式”的发展模式,打通相互割裂的“数据孤岛”,让用户拥有站在企业全局鸟瞰一切数据的视角,BI(商业智能)系统的概念在20世纪90年代被提出,即一种统一面向数据仓库,专注于提供数据分析、决策类功能的系统与解决方案。人们通常用BI一词指代这类分析系统。相对于联机事务处理系统(OLTP),我们把这类BI系统称为联机分析(OLAP)系统。
image-20210727183612222
但是传统BI系统的实际的应用效果一直是差强人意。其原因至少有一下几点。
互联网和云原生SaaS化模式的兴起,为BI系统的商业模式带来了新的思路:
首先,部署“轻量级化”,即不再需要强制捆绑于企业数据仓库这样的庞然大物之上进行数据同步,可以对于多种数据源直连即用。
其次,使用“多元化”,即使用门槛降低,不需要IT人员的深度参与,用户直接通过自助的形式,通过简单拖拽、搜索就能得到自己想要的分析结果,而不用关心底层具体的实现方式和数据源类型。
最后,体验“互联网化”,即便现代BI系统必须具有快速应答、简单易用的使用体验。从某种角度来看,经过SaaS化这波技术普惠的洗礼,互联网帮助传统企业系统在易用性和用户体验上进行了革命性提升。
如果说互联网和SaaS化这波技术普惠为现代BI系统带来了新的思路与契机,那么背后的技术创新则保障了其思想的落地。
Google于2003~2006年相继发表了三篇论文“Google File System”“Google MapReduce”和“Google Bigtable”,将大数据的处理技术带进了大众视野。2006年开源项目Hadoop最初指代的是分布式文件系统HDFS和MapReduce计算框架,但是它一路高歌猛进,在此基础之上像搭积木一般快速发展成为一个庞大的生态(包括Yarn、Hive、 HBase、Spark等数十种之多)。在大量数据分析场景的解决方案中, 传统关系型数据库很快就被Hadoop生态所取代。数据查询分析的手段也层出不穷,Spark、 Impala、Kylin等百花齐放。
然而世间并没有万全之策, 虽然Hadoop生态化的属性带来了诸多便利性,但生态化的另一面是臃肿和复杂。Hadoop生态下的每种组件都自成一体、相互独立的格局显很多场景下都过于笨重了。与此同时,随着现代化终端系统对实效性的要求越来越高,Hadoop在海量数据和高时效性的双重压力下,也显得有些力不从心了。
探索式BI系统,在产品定位与设计上是带有互联网SaaS化属性的产品,期望其包括以下特性:
为了满足上述产品特性,开发人员在底层数据库技术选型的时候可谓是绞尽脑汁,尽最大可能来选择合适OLAP技术方案。