Apache Ambari 是一个基于 Web 的 Apache Hadoop 集群的供应、管理和监控。Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop 和 Hcatalog 等。








Presto是大数据场景中常用的查询引擎,其采用master- slave架构,支持跨数据源类型查询,支持动态横向扩展,采用了内存并行处理、跨集群节点管线执行、多线程执行模型、高效的扁平内存数据结构、Java字节码生成等技术,来完成分布式数据查询和处理。现已广泛应用于OLAP场景。


1、Apache Ambari 2.7.4支持的Ranger版本为1.2,不支持Presto插件。只有升级Ranger 2.X版本才支持Presto,升级会有成本。
2、使用Ranger脱敏后的数据,提供接口服务,会导致Hive连接压力过大的问题。使用连接池的话,会有开发成本。

采用MySQL协议和语法,可以通过各类客户端工具来访问,能过与BI工具无缝对接;
支持多表join,针对不同场景join提供了多种优化方案;
生态扩展完善,离线数据的高效批量导入,流式数据的低延迟实时导入都有很好的支持;
简洁的分布式架构,只有FE、BE两个进程,运行不依赖任何第三方系统;
支持弹性伸缩,对于部署、运维非常友好;
MPP架构、高效列式存储引擎;
支持数据的预聚合以及预聚合结果的自动更新;
支持数据的实时更新;
MPP架构、高效列式存储引擎;
支持数据的预聚合以及预聚合结果的自动更新;
支持数据的实时更新;
支持高并发查询;