码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • dantax参数调优


    dantax参数调优

    1.speed调优

    在这里插入图片描述
    可能会导致数据倾斜
    处理的速度不同,可能会导致job非常慢

    举例子,比如总限速是每秒100条record,其中第一个channel速度是每秒99条record,第二个channel是每秒1条record,加起来是每条100条record,假设每个channel需要处理的数据都是1万条数据,那么第一个channel很早就处理完了,第二个channel会消耗比较长的时候,类似hadoop中的数据倾斜,为了避免这个问题,我们需要配置单个channel的限速
    在这里插入图片描述
    在这里插入图片描述

    内存优化

    当提升Datax Job内Channel并发数时,内存的占用会显著增加,因为datax作为数据交换通道,在内存中会缓存较多的数据。例如Channel中会有一个Buffer,作为临时的数据交换的缓冲区,而在部分Reader和Writer中,也会存在一些Buffer,为了防止OOM等错误,需要调大JVM的堆内存

    1. 建议将内存设置为4G或者8G
    2. 建议在启动的时候,加上对应的参数:python datax/bin/datax.py --jvm=“-Xms8G -Xmx8G” /path/to/your/job.json
  • 相关阅读:
    CentOS7二进制安装和YUM安装mongodb,服务器无法安装5.0以上的 mongodb 数据库报错 Illegal instruction
    淘宝商品sku信息抓取接口api
    基于matlab的三维点云数据ICP拼接算法实现
    WebDAV之π-Disk派盘 + 书藏家
    第73期:图论-2022/7/19学习报告
    MongoDB聚合运算符:$shift
    多线程之Thread
    我的测试开发十年之路
    Linux软件使用及基础知识
    LQ0014 求和【思维】
  • 原文地址:https://blog.csdn.net/m0_37759590/article/details/132710141
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号