码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Ubuntu上安装Anaconda


    7. Anaconda

    前提是要安装好hadoop集群+spark集群,参考地址Ubuntu安装hadoop集群 hive spark scala_ROBOT玲玉的博客-CSDN博客

    7.1安装

      下载Anaconda3-2021.05-Linux-x86_64.sh

    下载地址:https://repo.anaconda.com/archive/index.html

    执行命令:bash Anaconda3-2021.05-Linux-x86_64.sh -b

    设置环境变量  vi /etc/profile,添加如下

    #anaconda3

    export PATH=/home/cyuser/anaconda3/bin:$PATH

    export ANACONDA_PATH=/home/cyuser/anaconda3

    export PYSPARK_DRIVER_PYTHON=$ANACONDA_PATH/bin/ipython

    export PYSPARK_PYTHON=$ANACONDA_PATH/bin/python

    生效环境变量source /etc/profile

    注意:三个节点的服务器均要进行以上设置

    验证设置是否成功

    执行python –version

    注意:有时环境变量设置不成功,也能显示python版本,要进入到如下目录,执行./python --version确定一下,版本是否一致

    7.2测试

      1. 修改默认的web地址,执行jupyter notebook --generate-config命令生成配置文件。

       修改jupyter_notebook_config.py

    添加如下:c.NotebookApp.ip='server1'

    说明:其中server1表示的为服务器的名称

      1. 新建文件夹~/pythonwork/ipynotebook,进入到该文件目录下,运行pyspark命令:

    PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark

    测试:访问地址http://server1:8888/

    新建python文件

    打开python文件,执行如下:

    from pyspark.sql import SparkSession

    spark = SparkSession.builder.master("yarn").enableHiveSupport().appName("Correlation").getOrCreate()

    #日志输出级别

    spark.sparkContext.setLogLevel("Error")

    f=spark.sparkContext.textFile("hdfs://server1:9000/input/test.txt")

    f.count()

    spark.sparkContext.master

    说明:输出local[*]表示此时的spark运行模式

      1. 以yarn模式运行命令

    PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" SPARK_HOME=/home/cyuser/spark-3.0.0-bin-hadoop3.2  HADOOP_CONF_DIR=/home/cyuser/hadoop3.1.0/etc/hadoop MASTER=yarn-client pyspark

    再次执行上面的notebook中的python,内容,其中spark.sparkContext.master输出的为yarn,表示已经成功使用yarn模式执行。

  • 相关阅读:
    AtCoder Beginner Contest 277 G(概率dp+计数)
    制作一个简单HTML传统端午节日网页(HTML+CSS)
    深度学习和图形学渲染的结合和应用
    性能测试之压力测试
    计算机毕业设计Python+djang的药物管理系统
    Linux安装Oracle19c(极简版)
    【虹科新品】 HK-MR430&330绝对式光纤编码器(上)
    137页Python学习笔记,全面总结看这一篇就够了
    【50关于Visual Studio 2019控制台输出中文出现乱码问题及解决办法】
    C语言数组和指针笔试题(三)(一定要看)
  • 原文地址:https://blog.csdn.net/malingyu/article/details/127447058
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号