华为云ModelArts上开启分布式多卡训练(诺亚NEZHA-finetune模型)
本教程以 Swin-Transformer 为例,介绍用ModelArts进行分布式训练。
参考 ModelZoo 的 Swin-Transformer。
obs目录结构

数据集目录结构

【ModelArts系列】华为ModelArts Notebook训练yolov3模型(开发环境)
【ModelArts系列】华为ModelArts训练yolov3模型(训练作业)




单卡训练

4卡训练










错误原因:
未知

错误原因:
Ascend芯片资源不足,无法分配资源
解决办法:
等资源充裕的时候再申请多芯片资源
swin_config 路径错误
错误原因:
`swin_config` 路径错误
解决办法:
修改 `swin_config` 参数
obs://lljyoyo-demo/cswin-transformer/Swin-Transformer_for_MindSpore_1.1_code/src/configs
改为
obs://lljyoyo-demo/cswin-transformer/Swin-Transformer_for_MindSpore_1.1_code/src/configs/swin_tiny_patch4_window7_224.yaml