码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Hadoop提交MR任务


    MR作为Hadoop自带的计算框架所运行的任务,它本身通过hadoop jar提交

    hadoop jar mr任务jar包路径 你要运行的类的全限定名 后面就是你需要传的参数
    

    但是有些时候你需要显示的修改指定这个任务运行时所用的资源数,就可以通过下面的命令指令

    hadoop jar your-hadoop-job.jar com.example.YourJobDriver \
        -D mapreduce.map.memory.mb=2048 \
        -D mapreduce.map.java.opts=-Xmx1638m \
        -D mapreduce.reduce.memory.mb=4096 \
        -D mapreduce.reduce.java.opts=-Xmx3276m \
        -D mapreduce.job.inputdir=/path/to/input/data \
        -D mapreduce.job.outputdir=/path/to/output/directory \
        arg1 arg2 arg3
    

    your-hadoop-job.jar 是你的Hadoop作业的JAR文件。
    com.example.YourJobDriver 是你的作业驱动程序的完全限定类名。
    -D 选项用于设置Hadoop配置参数。
    mapreduce.map.memory.mb=2048 设置每个Map任务的内存为2048MB。
    mapreduce.map.java.opts=-Xmx1638m 这个是设置Map任务暂用JVM堆内存大小为1638MB(留一些内存给JVM进程本身)。
    mapreduce.reduce.memory.mb=4096 设置每个Reduce任务的内存为4096MB。
    mapreduce.reduce.java.opts=-Xmx3276m 设置Reduce任务的JVM堆内存大小为3276MB。
    -D mapreduce.job.inputdir=/path/to/input/data 设置输入目录。
    -D mapreduce.job.outputdir=/path/to/output/directory 设置输出目录。注意,这个目录在作业运行前应该不存在,因为Hadoop会尝试创建它。
    arg1 arg2 arg3 是传递给main方法的参数。

    注意,上面通过-d来指定参数的方式,只能指定作业的通用配置,而那些详细的,比如你要用多少个map?在你的MapReduce作业代码中,你可以通过调用job.setNumMapTasks(int num)来设置Map任务的个数。这个num参数就是你想要的Map任务的数量。reduce个数也是一样的通过job.setNumReduceTasks(5)修改。以及如果你想要大概的控制任务所用到的总资源,那还要配和集群的配置文件完成。所以,在控制资源上MR任务本身就比较麻烦,不像其他的框架提交yarn那样可以直接指定运行资源

  • 相关阅读:
    Spring 中有哪些感知接口
    企业工程项目管理系统源码(三控:进度组织、质量安全、预算资金成本、二平台:招采、设计管理)
    什么是Linux的Overcommit和OOM
    SD-WAN NFV uCPE VNF
    【VScode】VScode+如何从git上面拉取代码?
    Node.js的基本概念&&node -v 和npm -v 这两个命令的作用
    如何压缩jpg图片的大小
    Android查看签名信息系列 · 使用Android Studio获取签名
    【C++】编程题遇到行数不固定的字符串(以逗号或空格分割)
    基于粒子群算法的线性规划问题求解matlab程序
  • 原文地址:https://blog.csdn.net/dudadudadd/article/details/139680317
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号