码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • jupyter中安装scala和spark内核详细教程


    jupyter中安装scala和spark内核

    jupyter中安装scala和spark内核

    文章目录

    • jupyter中安装scala和spark内核
      • 一、前期准备
      • 二、安装
        • (一)Anaconda
          • 1、文件上传到Linux系统上
            • 方法一:
          • 方法二:使用wget
          • 2、安装Anaconda
          • 3、激活环境
          • 4、jupyter
        • (二)Scala内核
          • 1、文件上传到Linux系统上
            • 方法一:
            • 方法二:使用wget
          • 2、将文件进行解压
          • 3、安裝scala内核
          • 4、验证内核
        • (三)spark内核
          • 1、安装spark内核
          • 2、安装sparkSQL内核
          • 3、验证内核
          • 补充知识:

    在jupyter中安装scala和spark的内核,主要是通过jupyter来编写scala和spark的代码,安装成功后就可以编写一些scala、SparkSQL、Spark的代码。

    在这里插入图片描述

    一、前期准备

    提前下载:

    • Anaconda3-5.3.1-Linux-x86_64.sh
      • anaconda清华大学开源软件镜像站 ,可以选择自己需要下载版本
    • jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz 这里我准备的是最新scala 内核的文件
      • jupyter-scala其他版本

    提前安装好spark,并且启动

    二、安装

    (一)Anaconda

    使用Anaconda中自带的jupyter,而且Anaconda中集成了众多包

    1、文件上传到Linux系统上
    方法一:

    将提前下载好的Anacoda,通过rz命令上传到centos中,我是使用的是SecureCRT来连接centos

    我一般将文件上传到/opt/software中

    [andy@hadoop1 ~]$ cd /opt/software/
    [andy@hadoop1 software]$ rz
    rz waiting to receive.
    Starting zmodem transfer.  Press Ctrl+C to cancel.
    
    • 1
    • 2
    • 3
    • 4

    选择文件就可以上传

    在这里插入图片描述

    方法二:使用wget

    使用wget在centos中下载Anaconda

    wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh
    
    • 1
    2、安装Anaconda

    执行安装命令

    bash Anaconda3-5.3.1-Linux-x86_64.sh
    
    • 1

    可以一直按Enter,一直到需要输入yes或者no的时候,输入yes

    在这里插入图片描述

    选择Anaconda的安装位置,默认是在执行安装命令的用户家目录下,可以更换位置或者不更换。

    在这里插入图片描述

    然后是Anaconda的初始化,一定要输入yes

    就此安装成功

    3、激活环境

    命令:

    source activate base
    
    • 1
    [andy@hadoop1 software]$ source activate base
    (base) [andy@hadoop1 software]$ 
    
    • 1
    • 2

    激活成功后,会出现(base)

    注意:这点环境一定要激活,后面的安装需要使用到

    4、jupyter

    如果直接执行jupyter notebook,只能在本地运行,但是想过将jupyter在windows上运行,需指定ip地址

    jupyter notebook --ip=0.0.0.0
    
    • 1

    在这里插入图片描述

    在这里插入图片描述

    (二)Scala内核

    安装scala内核,主要是为了练习scala时使用,如果用spark的scala来练习scala,内核需要消耗大量的资源,因此安装scala内核

    1、文件上传到Linux系统上
    方法一:

    将下载好的jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz,通过rz命令上传到centos中

    一般将文件上传到/opt/software中

    cd /opt/software
    rz
    
    • 1
    • 2
    方法二:使用wget
    wget https://oss.sonatype.org/content/repositories/snapshots/com/github/alexarchambault/jupyter/jupyter-scala-cli_2.11.6/0.2.0-SNAPSHOT/jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz
    
    • 1
    2、将文件进行解压

    将文件解压到/opt/module/中

     tar -zxvf jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz -C /opt/module/
    
    • 1

    在这里插入图片描述

    3、安裝scala内核

    执行命令:

    进入到解压路径中

    cd /opt/module/
    jupyter-scala_2.11.6-0.2.0-SNAPSHOT/bin/jupyter-scala
    
    • 1
    • 2

    运行情况:

    (base) [andy@hadoop1 ~]$ cd /opt/module/
    (base) [andy@hadoop1 module]$ jupyter-scala_2.11.6-0.2.0-SNAPSHOT/bin/jupyter-scala
    
    • 1
    • 2

    在这里插入图片描述

    4、验证内核

    查看jupyter中的内核:

    jupyter kernelspec list
    
    • 1

    在这里插入图片描述

    (三)spark内核

    安装spark和sparkSQL

    需要提前安装toree

    pip install toree
    
    • 1
    1、安装spark内核
    jupyter toree install --spark_opts='--master=spark://hadoop1:7077' --user --kernel_name=Spark3.0.2 --spark_home=/opt/module/spark-yarn
    
    • 1
    • spark_opts:是指spark使用的方法,这点是standalone模型(独立部署),这点可以看spark教程

    • kernel_name:是spark的版本

      • 可以通过spark-shell来查看

        在这里插入图片描述

    • spark_home:spark的安装位置

      需要修改成自己的

    2、安装sparkSQL内核
    jupyter toree install --spark_opts='--master=spark://hadoop1:7077' --user --kernel_name=Spark3.0.2 --spark_home=/opt/module/spark-yarn --interpreters=SQL
    
    • 1
    3、验证内核

    查看jupyter中的内核:

    jupyter kernelspec list
    
    • 1

    在这里插入图片描述

    补充知识:
    • 删除内核

      jupyter kernelspec remove 环境名
      
      • 1
    • 命令参考 — conda 22.9.0 文档

  • 相关阅读:
    夯实算法-跳跃游戏
    基于深度学习的表格检测与识别技术的优势
    YOLOv8 改进原创 HFAMPAN 结构,信息高阶特征对齐融合和注入,全局融合多级特征,将全局信息注入更高级别
    Debezium-增量迁移之 Oracle 迁移所需权限
    掌握优先级队列:提升效率的关键技巧
    简单模拟单/双链表实现 LinkedList作业
    nvm管理不同版本nodejs
    Redis分布式锁最牛逼的实现(Java 版,最牛逼的实现方式)
    java链树(含树的详细代码)
    NFT合约部署
  • 原文地址:https://blog.csdn.net/Andy86666/article/details/128046499
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号