spark的资源调整参数

–基础资源

set spark.driver.memory=15g;
set spark.driver.cores=3;
set spark.driver.memoryOverhead=4096;
set spark.executor.memory=5G;
set spark.executor.memoryOverhead=1024;
set spark.executor.cores=2;
set spark.vcore.boost.ratio=2;
1
2
3
4
5
6
7

–动态executor申请

set spark.dynamicAllocation.minExecutors=10;
set spark.dynamicAllocation.maxExecutors=300;
1
2

–ae，shuffle partition并行度

set spark.sql.adaptive.minNumPostShufflePartitions=10;
set spark.sql.adaptive.maxNumPostShufflePartitions=1000;
1
2

–268435456;

set spark.sql.adaptive.shuffle.targetPostShuffleInputSize=536870912;
1

–开启parquet切分

set spark.sql.parquet.adaptiveFileSplit=true;
1

–初始task调节，合并小文件

set spark.sql.files.maxPartitionBytes=536870912;
1

中型任务
目前测试：在不手动添加任何参数、平均时长在90min以内、单个shuffle 量在2T以下的任务可以使用该模版，但实际任务情况还需跟踪观察。
spark.executor.memoryOverhead 每个executor的堆外内存大小，堆外内存主要用于数据IO，对于报堆外OOM的任务要适当调大，单位Mb，与之配合要调大executor JVM参数，例如：set spark.executor.memoryOverhead=3072
set spark.executor.extraJavaOptions=-XX:MaxDirectMemorySize=2560m

–基础资源

set spark.driver.memory=25g;
set spark.driver.cores=4;
set spark.driver.memoryOverhead=5120;
set spark.executor.memory=10G;
set spark.executor.memoryOverhead=4096;
set spark.executor.cores=3;
set spark.vcore.boost.ratio=1;
1
2
3
4
5
6
7

–动态executor申请

set spark.dynamicAllocation.minExecutors=10;
set spark.dynamicAllocation.maxExecutors=600;
1
2

–AQE

set spark.sql.adaptive.minNumPostShufflePartitions=10;
set spark.sql.adaptive.maxNumPostShufflePartitions=1000;
set spark.sql.adaptive.shuffle.targetPostShuffleInputSize= 536870912;
1
2
3

–开启parquet切分，初始task调节，合并小文件

set spark.sql.parquet.adaptiveFileSplit=true;
set spark.sql.files.maxPartitionBytes=536870912;
1
2

–推测

set spark.speculation.multiplier=2.5;
set spark.speculation.quantile=0.8;
1
2

–shuffle 落地hdfs

set spark.shuffle.hdfs.enabled=true;
set spark.shuffle.io.maxRetries=1;
set spark.shuffle.io.retryWait=0s;
1
2
3

大型任务
目前测试：在不手动添加任何参数、平均时长在120min以内、单个shuffle 量在10T以下的任务可以使用该模版，但实际任务情况还需跟踪观察。

–基础资源

set spark.driver.memory=25g;
set spark.driver.cores=4;
set spark.driver.memoryOverhead=5120;
set spark.executor.memory=15G;
set spark.executor.memoryOverhead=3072;
set spark.executor.cores=3;
set spark.vcore.boost.ratio=1;
1
2
3
4
5
6
7

–动态executor申请

set spark.dynamicAllocation.minExecutors=10;
set spark.dynamicAllocation.maxExecutors=900;
1
2

–ae

set spark.sql.adaptive.minNumPostShufflePartitions=10;
set spark.sql.adaptive.maxNumPostShufflePartitions=3000;
set spark.sql.adaptive.shuffle.targetPostShuffleInputSize= 536870912;
1
2
3

–shuffle 落地hdfs

set spark.shuffle.hdfs.enabled=true;
set spark.shuffle.io.maxRetries=1;
set spark.shuffle.io.retryWait=0s;
1
2
3

–开启parquet切分，合并小文件

set spark.sql.parquet.adaptiveFileSplit=true;
set spark.sql.files.maxPartitionBytes=536870912;
1
2

–推测

set spark.speculation.multiplier=2.5;
set spark.speculation.quantile=0.9;
1
2

超大型任务
目前测试：在不手动添加任何参数、平均时长大于120min、单个shuffle 量在10T以上的任务可以使用该模版，但实际任务情况还需跟踪观察。

–基础资源

set spark.driver.memory=30g;
set spark.driver.cores=4;
set spark.driver.memoryOverhead=5120;
set spark.executor.memory=20G;
set spark.executor.memoryOverhead= 5120;
set spark.executor.cores=5;
set spark.vcore.boost.ratio=1;
1
2
3
4
5
6
7

–动态executor申请

set spark.dynamicAllocation.minExecutors=10;
set spark.dynamicAllocation.maxExecutors=1500;
1
2

–ae

set spark.sql.adaptive.minNumPostShufflePartitions=10;
set spark.sql.adaptive.maxNumPostShufflePartitions=7000;
set spark.sql.adaptive.shuffle.targetPostShuffleInputSize= 536870912;
1
2
3

–开启parquet切分,合并小文件

set spark.sql.parquet.adaptiveFileSplit=true;
set spark.sql.files.maxPartitionBytes=536870912;
1
2

– shuffle 落地 hdfs，shuffle文件上传hdfs

set spark.shuffle.hdfs.enabled=true;
set spark.shuffle.io.maxRetries=1;
set spark.shuffle.io.retryWait=0s;
1
2
3

–推测

set spark.speculation.multiplier=2.5;
set spark.speculation.quantile=0.9;
1
2

其他常用参数
–ae hash join

set spark.sql.adaptive.hashJoin.enabled=true;
set spark.sql.adaptiveHashJoinThreshold=52428800;
1
2

–输出文件合并 byBytes,该功能会生成两个stage，
–第一个stage shuffle的数据量来预估最后生成到hdfs上的文件数据量大小，
–并通过预估的文件数据量大小计算第二个stage的并行度，即最后生成的文件个数。
–该功能只能控制生成的文件大小尽量接近spark.merge.files.byBytes.fileBytes，且有一定的性能损耗，需根据实测情况选择使用。
– 最终文件数量：(totalBytes / fileBytes / compressionRatio).toInt + 1

set spark.merge.files.byBytes.enabled=true;
set spark.merge.files.byBytes.repartitionNumber=100;
1
2

–第一个stage的并行读
set spark.merge.files.byBytes.fileBytes=134217728;
– 预期的文件大小
set spark.merge.files.byBytes.compressionRatio=3;
– 压缩比，shuffle文件和最后生成的文件格式和压缩格式都不相同，因此通过该参数调节
–输出文件合并该功能会在原来job的最后一个stage后面增加1个stage来控制最后生成的文件数量,
–对于动态分区，每个分区生成spark.merge.files.number个文件。

spark.merge.files.enabled=true            
spark.merge.files.number=512
1
2

–skew_join 解析绕过tqs

set tqs.analysis.skip.hint=true;
1

–初始task上限

set spark.sql.files.openCostInBytes=4194304;
set spark.datasource.splits.max=20000;
1
2

–broadcast时间

set spark.sql.broadcastTimeout = 3600;
1

–（防止get json报错）

set spark.sql.mergeGetMapValue.enabled=true;
1

–ae 倾斜处理 HandlingSkewedJoin OptimizeSkewedJoin

set spark.sql.adaptive.allowBroadcastExchange.enabled=true;
set spark.sql.adaptive.hashJoin.enabled=false;
set spark.sql.adaptive.skewedPartitionFactor=3; 
1
2
3

– 某partition数据量大于中位数的3倍，判定为倾斜

set spark.sql.adaptive.skewedPartitionMaxSplits=20; 
1

– 限制某一partition最多拆分多少分，spark3已失效

set spark.sql.adaptive.skewedJoin.enabled=true; 
1

– Normal Join Pattern的优化开关

set spark.sql.adaptive.skewedJoinWithAgg.enabled=true; 
1

– JoinWithAgg Pattern的优化开关，非开源版

set spark.sql.adaptive.multipleSkewedJoin.enabled=true;
1

– MultipleJoin Pattern的优化开关，非开源版

set spark.shuffle.highlyCompressedMapStatusThreshold=20000;
1

– 分区数大于20000时使用HighlyCompressedMapStatus统计每个partition数据量，会降低数据统计进度

–并发读文件

set spark.sql.concurrentFileScan.enabled=true;
1

–filter按比例读取文件
set spark.sql.files.tableSizeFactor={table_name}:{filter 比例};

set spark.sql.files.tableSizeFactor=dm_content.tcs_task_dict:10;
1

–AM failed 时长

set spark.yarn.am.waitTime=200s;
1

–shuffle service 超时设置

set spark.shuffle.registration.timeout=12000;
set spark.shuffle.registration.maxAttempts=5;
1
2

–parquet index 特性生效，in 条件的个数

set spark.sql.parquet.pushdown.inFilterThreshold=30; 
1

–设置engine

set tqs.query.engine.type=sparkcli;
1

–hive metastore 超时

spark.hadoop.hive.metastore.client.socket.timeout=600
1

–manta备用

spark.sql.adaptive.maxNumPostShufflePartitions 5000
spark.executor.memoryOverhead 8000
spark.sql.adaptive.shuffle.targetPostShuffleInputSize 536870912
1
2
3

相关阅读:
C++ 泛型编程-模板
 氨基聚苯乙烯包覆硅胶微球SG-PS-NH2/聚苯乙烯/硫化镉PS/CdS复合材料/聚苯乙烯支载井冈霉素微球制备
 git提交设置忽略指定文件，文件夹
 JavaScript之事件高级（53rd）
【每日一题】636. 函数的独占时间
 音乐推荐与管理系统Python+Django网页界面+协同过滤推荐算法
 MATLAB算法实战应用案例精讲-【集成算法】集成学习模型Bagging（附Python和R语言代码）
C++ 析构函数
 10年测试经验，在35岁的生理年龄面前，一文不值
 读书笔记--未来简史关键金句和阅读感悟
原文地址：https://blog.csdn.net/qq_43688472/article/details/133032352