码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习笔记--权重文件、模型参数和预训练模型的使用


    目录

    1--打印权重文件参数

    2--打印模型参数

    3--使用权重文件参数更新模型的参数

    4--将模型部分参数固定(不进行梯度下降)

    5--参考


    1--打印权重文件参数

    1. import torch
    2. weights_files = './test.pt' # 权重文件路径
    3. weights = torch.load(weights_files) # 加载权重文件
    4. for k, v in weights.items(): # key, value
    5. print(k, v) # 打印参数名、参数值

    2--打印模型参数

    1. '''
    2. Class Model(nn.module):
    3. #...
    4. '''
    5. # or
    6. # from .xx.yy import Model
    7. model = Model() # 初始化模型
    8. model_dict = model.state_dict() # 模型参数字典
    9. for k, v in model_dict.items(): # key, value
    10. print(k, v) # 打印参数名、参数值

    3--使用权重文件参数更新模型的参数

    1. model = Model() # 初始化模型
    2. model_dict = model.state_dict() # 模型参数
    3. weights_files = './test.pt' # 权重文件
    4. weights = torch.load(weights_files) # 权重文件参数
    5. # 模型参数和权重参数匹配(可能新模型会作改动)
    6. match_dict = {k: v for k, v in weights.items() if k in model_dict}
    7. # 根据参数匹配,将权重文件的参数加载到模型参数
    8. model_dict.update(match_dict) # 相当于把预训练网络层的参数更新进来
    9. # 更新模型参数
    10. model.load_state_dict(model_dict)

    4--将模型部分参数固定(不进行梯度下降)

    1. model = Model()
    2. for name, param in model.named_parameters():
    3. # print(name)
    4. # print(param)
    5. if name == 'xxx': # 选择参数进行固定
    6. param.requires_grad = False

    或者使用以下方式固定参数:

    1. model = Model()
    2. for i, param in enumerate(model.parameters()):
    3. if i < 5: # 根据已知的参数顺序,选择参数进行固定
    4. # print(param)
    5. param.requires_grad = False

    5--参考

    参考链接1

  • 相关阅读:
    操作系统:操作系统相关概念博客系统整理
    iPhone NFC 设置教程(门禁卡/公交卡/校园卡等等)
    js获得相对路径文件,并上传到服务器
    Java多线程(6):锁与AQS(下)
    Linux网络编程|TCP编程
    Ubuntu设设置默认外放和麦克风设备
    python闭包与装饰器
    vue报错信息汇总
    Python量化交易
    基于JavaSwing开发通讯录管理系统+开题报告+论文 毕业设计 课程设计 大作业
  • 原文地址:https://blog.csdn.net/weixin_43863869/article/details/127941925
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号