码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Bi-LSTM-Attention概述及torch实现


    Bi-LSTM-Attention概述请看:

    Bi-LSTM-Attention网络概述及实现

    LSTM封装:

    import torch.nn as nn
    import torch.nn.functional as F
    import torch
    
    class LSTM(nn.Module):
    
        def __init__(self, input_size, hidden_size, num_layers, bidirectional, dropout):
            """
            Args: 
                input_size: x 的特征维度
                hidden_size: 隐层的特征维度
                num_layers: LSTM 层数
            """
            super(LSTM, self).__init__()
    
            self.rnn = nn.LSTM(
                input_size=input_size, hidden_size=hidden_size, num_layers=num_layers, bidirectional=bidirectional, dropout=dropout
            )
    
            self.init_params()
    
        def init_params(self):
            for i in range(self.rnn.num_layers):
                nn.init.orthogonal_(getattr(self.rnn, f'weight_hh_l{i}'))
                nn.init.kaiming_normal_(getattr(self.rnn, f'weight_ih_l{i}'))
                nn.init.constant_(getattr(self.rnn, f'bias_hh_l{i}'), val=0)
                nn.init.constant_(getattr(self.rnn, f'bias_ih_l{i}'), val=0)
                getattr(self.rnn, f'bias_hh_l{i}').chunk(4)[1].fill_(1)
    
                if self.rnn.bidirectional:
                    nn.init.orthogonal_(
                        getattr(self.rnn, f'weight_hh_l{i}_reverse'))
                    nn.init.kaiming_normal_(
                        getattr(self.rnn, f'weight_ih_l{i}_reverse'))
                    nn.init.constant_(
                        getattr(self.rnn, f'bias_hh_l{i}_reverse'), val=0)
                    nn.init.constant_(
                        getattr(self.rnn, f'bias_ih_l{i}_reverse'), val=0)
                    getattr(self.rnn, f'bias_hh_l{i}_reverse').chunk(4)[1].fill_(1)
    
        def forward(self, x, lengths):
            # x: [seq_len, batch_size, input_size]
            # lengths: [batch_size]
            packed_x = nn.utils.rnn.pack_padded_sequence(x, lengths)
    
            # packed_x, packed_output: PackedSequence 对象
            # hidden: [num_layers * bidirectional, batch_size, hidden_size]
            # cell: [num_layers * bidirectional, batch_size, hidden_size]
            packed_output, (hidden, cell) = self.rnn(packed_x)
    
            # output: [real_seq_len, batch_size, hidden_size * 2]
            # output_lengths: [batch_size]
            output, output_lengths = nn.utils.rnn.pad_packed_sequence(packed_output)
    
            return hidden, output
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
  • 相关阅读:
    记录python 使用SURF SIRF的问题
    Unraid 使用技巧集合
    [附源码]计算机毕业设计springboot疫情管理系统
    PMP致命三问:考PMP需要报培训班吗?对于没有做过项目管理的人来说,考这个难度大吗?考试具体要准备什么资料?
    c++一级练习题
    NK-RTU980 CAP
    微服务之间的横向关系与微服务与数据层之间的纵向关系
    Unity zSpace开发记录
    金融私有云IAAS领域、云平台领域、架构领域、新技术领域的技术展望
    涨薪跳槽利器,清华大咖总结的 Java 核心突击讲,一应俱全
  • 原文地址:https://blog.csdn.net/qq_42363032/article/details/126726441
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号