本地部署 zeppelin 0.10.1

文章目录

碎碎念

Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的notebook
Zeppelin提供了数据可视化的框架
可实现你所需要的
- 数据采集
- 数据发现
- 数据分析
- 数据可视化和协作

当前最新版为 0.10.1 版本，官方提供两种安装包，一种是包含所有解析器的（1.6G），另一种是带有 spark 和网络下载解析器的包（568M）

支持的解析器

alluxio
angular
beam
bigquery
cassandra
elasticsearch
file
flink
flink-cmd
geode
groovy
hazelcastjet
hbase
ignite
influxdb
java
jdbc
jupyter
kotlin
ksql
kylin
lens
livy
md
mongodb
neo4j
pig
python
r
sap
scalding
scio
sh
spark
spark-submit
sparql
submarine

部署 zeppelin

下载全量解析器安装包

wget --no-check-certificate -c \
https://dlcdn.apache.org/zeppelin/zeppelin-0.10.1/zeppelin-0.10.1-bin-all.tgz
tar xf zeppelin-0.10.1-bin-all.tgz
1
2
3

安装 java 环境

zeppelin 部署依赖 java 环境

yum install -y java-1.8.0-openjdk
1

修改配置文件

cd zeppelin-0.10.1-bin-all
cp conf/zeppelin-env.sh.template conf/zeppelin-env.sh
vim conf/zeppelin-env.sh
1
2
3

官方给出的配置文件模板是全注释的，这里标注几个需要注意的参数

# 定义 java 命令所在路径，yum 安装的可以不写，下载的 Oracle java 需要配置一下
export JAVA_HOME=
# zeppelin 访问地址，如果不配置，默认值 127.0.0.1，也可以写 0.0.0.0
export ZEPPELIN_ADDR=
# zeppelin web 页面访问的端口，默认值 8080，如果和本机端口冲突，可以修改这里的参数
export ZEPPELIN_PORT=
# sh 解析器绑定的机器 ip，只能写一个，不写的话，会在本机随机获取一个 ip 地址 [多网卡或者有 docker 就比较尴尬了]
export ZEPPELIN_LOCAL_IP=
# zeppelin 日志目录，默认是当前路径
export ZEPPELIN_LOG_DIR=
# zeppelin pid 记录目录，默认记录在 ${ZEPPELIN_HOME}/run 目录下
export ZEPPELIN_PID_DIR=
# notebook 存储路径
export ZEPPELIN_NOTEBOOK_DIR=
1
2
3
4
5
6
7
8
9
10
11
12
13
14

修改 xml 配置文件

cp conf/zeppelin-site.xml.template conf/zeppelin-site.xml
vim conf/zeppelin-site.xml
1
2

没特殊需求，可以不配置

zeppelin 默认的索引路径在 /tmp 目录下，有需求可以修改成自己定义的路径，做统一管理

<property>
  <name>zeppelin.search.index.path</name>
  <value>/tmp/zeppelin-index</value>
  <description>path for storing search index on disk.</description>
</property>
1
2
3
4
5

关闭匿名访问模式 [默认为匿名登录，并且 zeppelin-site.xml 文件内没有这一段内容，需要自己增加] （注意 xml 格式）
- false - 表示关闭匿名模式
- true - 表示开启匿名模式

<property>
  <name>zeppelin.anonymous.allowed</name>
  <value>false</value>
  <description>Anonymous user allowed by default</description>
</property>
1
2
3
4
5

关闭匿名模式后，需要配置用户名和密码

cp conf/shiro.ini.template conf/shiro.ini
vim conf/shiro.ini
1
2

配置 <用户名> = <密码>,<角色>

更多细节可以查看官方文档：Apache Shiro Configuration

admin = admin,admin
1

启动 zeppelin

bash bin/zeppelin-daemon.sh start
1

通过浏览器访问配置的 ip 加端口来访问 zeppelin

相关阅读:
基于JAVA网络城市交通应急管理系统计算机毕业设计源码+数据库+lw文档+系统+部署
Linux收集内存快照来使用crash分析的方法
mac的终端显示分支名称？mac的终端和idea中的terminal同时修改
2-推荐系统之机器学习基础
Linux网络通信优化方法
【消息队列笔记】chp3-如何确保消息不丢失
分布式事务深度解析，刨根问底式面试
Java：你会建议用Java开发金融科技应用程序吗?
【附源码】Python计算机毕业设计社区新冠疫苗接种管理系统
GlobalWebsoket.js 封装配置分析

原文地址：https://blog.csdn.net/u010383467/article/details/125619627