码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习笔记--权重文件、模型参数和预训练模型的使用


    目录

    1--打印权重文件参数

    2--打印模型参数

    3--使用权重文件参数更新模型的参数

    4--将模型部分参数固定(不进行梯度下降)

    5--参考


    1--打印权重文件参数

    1. import torch
    2. weights_files = './test.pt' # 权重文件路径
    3. weights = torch.load(weights_files) # 加载权重文件
    4. for k, v in weights.items(): # key, value
    5. print(k, v) # 打印参数名、参数值

    2--打印模型参数

    1. '''
    2. Class Model(nn.module):
    3. #...
    4. '''
    5. # or
    6. # from .xx.yy import Model
    7. model = Model() # 初始化模型
    8. model_dict = model.state_dict() # 模型参数字典
    9. for k, v in model_dict.items(): # key, value
    10. print(k, v) # 打印参数名、参数值

    3--使用权重文件参数更新模型的参数

    1. model = Model() # 初始化模型
    2. model_dict = model.state_dict() # 模型参数
    3. weights_files = './test.pt' # 权重文件
    4. weights = torch.load(weights_files) # 权重文件参数
    5. # 模型参数和权重参数匹配(可能新模型会作改动)
    6. match_dict = {k: v for k, v in weights.items() if k in model_dict}
    7. # 根据参数匹配,将权重文件的参数加载到模型参数
    8. model_dict.update(match_dict) # 相当于把预训练网络层的参数更新进来
    9. # 更新模型参数
    10. model.load_state_dict(model_dict)

    4--将模型部分参数固定(不进行梯度下降)

    1. model = Model()
    2. for name, param in model.named_parameters():
    3. # print(name)
    4. # print(param)
    5. if name == 'xxx': # 选择参数进行固定
    6. param.requires_grad = False

    或者使用以下方式固定参数:

    1. model = Model()
    2. for i, param in enumerate(model.parameters()):
    3. if i < 5: # 根据已知的参数顺序,选择参数进行固定
    4. # print(param)
    5. param.requires_grad = False

    5--参考

    参考链接1

  • 相关阅读:
    python 2018全国自学考试第5章 第21题 成功!!!左右金字塔建模加平方结果
    基于 QT 实现一个 Ikun 专属桌面宠物
    丝丝入扣,毫不违和,AI一键换脸和微调,基于Rope-Ruby,2024最新整合包
    【SQLServer】max worker threads参数说明
    微软云计算[2]之微软云关系数据库SQL Azure
    13SpringMVC中拦截器的配置(拦截规则)和多个拦截器的preHandle,postHandle执行顺序原理详解
    【python笔记】第十四节 文件操作
    python 斐波那契数列多种方法
    Vue3中插槽<slot>的概念和用法
    数据结构----线性表之栈
  • 原文地址:https://blog.csdn.net/weixin_43863869/article/details/127941925
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号