• 【MindSpore易点通】在开发环境下如何使用MindInsight可视化Dump数据


    1、为什么要使用开发环境中MindInsight离线调试器?

    在开发环境中使用MindInsight离线调试器可以方便地查看Dump数据,具有图码映射、自动格式转换等功能,帮助用户进行精度调优分析。

    2、Dump数据准备

    在训练脚本中写入收集Dump数据的代码,执行训练脚本可获取Dump数据,推荐使用异步Dump。

    注:一般网络的Dump数据都比较大(单卡单step能产生GB级别的数据),且保存时间长,对性能影响比较大,所以不建议在一个训练任务中收集过多step的Dump数据。

    3、创建开发环境并启动MindInsight的离线调试器

    3.1 创建开发环境

    ModelArts控制台,进入“开发环境管理 > DevContainer”页面,创建开发环境实例,创建成功后,单击开发环境实例操作栏右侧的“打开 > 打开Notebook”,在线打开运行中的开发环境。

    打开方式如下图所示:

    3.2 上传Dump数据并启动离线调试器

    在保存Dump数据时,可以直接保存到/home/ma-user/work/xxx/中,也可通过自动回传mox操作放入OBS桶中,由于Dump数据所占磁盘空间较大,故在此推荐使用OBS方式。在开发环境中启动MindInsight时,开发环境会自动挂载OBS目录读取Dump数据,比较方便。

    在对话框中执行如下命令打开Mindinsight的离线调试器。

    1. %reload_ext mindinsight
    2. %mindinsight --port {PORT} --summary-base-dir {SUMMARY_BASE_DIR}

    参数解释:

    • --port {PORT}:指定Web可视化服务端口。可以不设置,默认使用8080端口。如果8080端口被占用了,需要在1~65535任意指定一个端口。
    • --summary-base-dir {SUMMARY_BASE_DIR}:表示数据在开发环境中的存储路径。
    • OBS桶的路径:obs://xxx/
    • 开发环境本地路径:./work/xxx(相对路径)或/home/ma-user/work/xxx(绝对路径)

    注:如需读取桶内数据请务必在路径前添加obs://

    此处路径中的xxx填写要求为:Dump配置中的{path}路径的上一层或上两层,推荐使用上两层。当有多个dump数据包时,可以在UI界面的Summary List列表中看到多个数据列表。

    eg:

    dump数据包路径为summary-base-dir/summary_dir/lenet/rank_0/.dump_metadata,则对应的{path}路径为summary-base-dir/summary_dir/lenet/

    运行成功后如下图所示:

    4、调试完成后关闭MindInsight

    在.ipynb文件框中输入命令,关闭 MindInsight。端口号应与启动MindInsight中设置一致。

    !mindinsight stop --port {port}

    关闭成功后如下图所示:

  • 相关阅读:
    Python学习第2天:入门必备(基础篇)
    软考高级之系统架构师之软件工程
    AD7792/AD7793 备忘
    PyCharm开发工具安装plugins插件
    点亮LED——第一个IAR工程
    用Python下载漫画,每天掌握一个实用知识
    Go语言高级特性解析与实践
    【SQL性能优化】从磁盘I/O的角度理解SQL查询的成本(优)
    名称服务器(Name Server)介绍
    我们要做怎样的测试/开发程序员,怎样提高自己的价值......
  • 原文地址:https://blog.csdn.net/Kenji_Shinji/article/details/127727269