• 本地部署 zeppelin 0.10.1


    碎碎念

    • Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的notebook

    • Zeppelin提供了数据可视化的框架

    • 可实现你所需要的

      • 数据采集
      • 数据发现
      • 数据分析
      • 数据可视化和协作

    当前最新版为 0.10.1 版本,官方提供两种安装包,一种是包含所有解析器的(1.6G),另一种是带有 spark 和网络下载解析器的包(568M)

    支持的解析器

    • alluxio
    • angular
    • beam
    • bigquery
    • cassandra
    • elasticsearch
    • file
    • flink
    • flink-cmd
    • geode
    • groovy
    • hazelcastjet
    • hbase
    • ignite
    • influxdb
    • java
    • jdbc
    • jupyter
    • kotlin
    • ksql
    • kylin
    • lens
    • livy
    • md
    • mongodb
    • neo4j
    • pig
    • python
    • r
    • sap
    • scalding
    • scio
    • sh
    • spark
    • spark-submit
    • sparql
    • submarine

    部署 zeppelin

    下载全量解析器安装包

    wget --no-check-certificate -c \
    https://dlcdn.apache.org/zeppelin/zeppelin-0.10.1/zeppelin-0.10.1-bin-all.tgz
    tar xf zeppelin-0.10.1-bin-all.tgz
    
    • 1
    • 2
    • 3

    安装 java 环境

    zeppelin 部署依赖 java 环境

    yum install -y java-1.8.0-openjdk
    
    • 1

    修改配置文件

    cd zeppelin-0.10.1-bin-all
    cp conf/zeppelin-env.sh.template conf/zeppelin-env.sh
    vim conf/zeppelin-env.sh
    
    • 1
    • 2
    • 3

    官方给出的配置文件模板是全注释的,这里标注几个需要注意的参数

    # 定义 java 命令所在路径,yum 安装的可以不写,下载的 Oracle java 需要配置一下
    export JAVA_HOME=
    # zeppelin 访问地址,如果不配置,默认值 127.0.0.1,也可以写 0.0.0.0
    export ZEPPELIN_ADDR=
    # zeppelin web 页面访问的端口,默认值 8080,如果和本机端口冲突,可以修改这里的参数
    export ZEPPELIN_PORT=
    # sh 解析器绑定的机器 ip,只能写一个,不写的话,会在本机随机获取一个 ip 地址 [多网卡或者有 docker 就比较尴尬了]
    export ZEPPELIN_LOCAL_IP=
    # zeppelin 日志目录,默认是当前路径
    export ZEPPELIN_LOG_DIR=
    # zeppelin pid 记录目录,默认记录在 ${ZEPPELIN_HOME}/run 目录下
    export ZEPPELIN_PID_DIR=
    # notebook 存储路径
    export ZEPPELIN_NOTEBOOK_DIR=
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    修改 xml 配置文件

    cp conf/zeppelin-site.xml.template conf/zeppelin-site.xml
    vim conf/zeppelin-site.xml
    
    • 1
    • 2

    没特殊需求,可以不配置

    • zeppelin 默认的索引路径在 /tmp 目录下,有需求可以修改成自己定义的路径,做统一管理
    <property>
      <name>zeppelin.search.index.path</name>
      <value>/tmp/zeppelin-index</value>
      <description>path for storing search index on disk.</description>
    </property>
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 关闭匿名访问模式 [默认为匿名登录,并且 zeppelin-site.xml 文件内没有这一段内容,需要自己增加] (注意 xml 格式)
      • false - 表示关闭匿名模式
      • true - 表示开启匿名模式
    <property>
      <name>zeppelin.anonymous.allowed</name>
      <value>false</value>
      <description>Anonymous user allowed by default</description>
    </property>
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 关闭匿名模式后,需要配置用户名和密码
    cp conf/shiro.ini.template conf/shiro.ini
    vim conf/shiro.ini
    
    • 1
    • 2

    配置 <用户名> = <密码>,<角色>

    更多细节可以查看官方文档:Apache Shiro Configuration

    admin = admin,admin
    
    • 1

    启动 zeppelin

    bash bin/zeppelin-daemon.sh start
    
    • 1

    通过浏览器访问配置的 ip 加端口来访问 zeppelin

  • 相关阅读:
    一文轻松掌握深度学习框架中的einsum
    LQ0212 蚂蚁感冒【序列处理】
    python使用PIL模块加载图像、通过resize函数改变图像的大小、使用save函数保存处理过的图像、并自定义指定保存后的格式
    ELK:开源搜索与分析技术栈(2)
    python笔记--列表、字典、元组和集合
    在Ubuntu 18.04安装Docker
    taichi库记录
    详解大模型是如何理解并使用 tools ?
    AOP的点点滴滴
    python 入门第三天(高级进阶:str、set、dict、slice、推导式、高级变量类型的公共语法)
  • 原文地址:https://blog.csdn.net/u010383467/article/details/125619627