双向 LSTM（Bidirectional LSTM）与普通 LSTM 公式过程

双向 LSTM（Bidirectional LSTM）与普通 LSTM 有类似的公式过程，但有一些细微的差别。LSTM 是一种循环神经网络（RNN），用于处理序列数据。它具有一个门控机制，可以捕捉长期依赖关系。

双向 LSTM 结构中有两个 LSTM 层，一个从前向后处理序列，另一个从后向前处理序列。这样，模型可以同时利用前面和后面的上下文信息。在处理序列时，每个时间步的输入会被分别传递给两个 LSTM 层，然后它们的输出会被合并。

具体而言，双向 LSTM 的公式过程如下：

前向 LSTM：
- 输入门（input gate）： $i_t = \sigma(W_{ix}x_t + W_{ih}h_{t-1} + b_i)$
- 遗忘门（forget gate）： $f_t = \sigma(W_{fx}x_t + W_{fh}h_{t-1} + b_f)$
- 细胞状态（cell state）更新： $\tilde{C}_t = \text{tanh}(W_{cx}x_t + W_{ch}h_{t-1} + b_c)$
- 细胞状态（cell state）： $C_t = f_t \odot C_{t-1} + i_t \odot \tilde{C}_t$
- 输出门（output gate）： $o_t = \sigma(W_{ox}x_t + W_{oh}h_{t-1} + b_o)$
- 隐状态（hidden state）： $h_t = o_t \odot \text{tanh}(C_t)$
后向 LSTM：
- 输入门（input gate）： $i'_t = \sigma(W'_{ix}x_t + W'_{ih}h'_{t+1} + b'_i)$
- 遗忘门（forget gate）： $f'_t = \sigma(W'_{fx}x_t + W'_{fh}h'_{t+1} + b'_f)$
- 细胞状态（cell state）更新： $\tilde{C}'_t = \text{tanh}(W'_{cx}x_t + W'_{ch}h'_{t+1} + b'_c)$
- 细胞状态（cell state）： $C'_t = f'_t \odot C'_{t+1} + i'_t \odot \tilde{C}'_t$
- 输出门（output gate）： $o'_t = \sigma(W'_{ox}x_t + W'_{oh}h'_{t+1} + b'_o)$
- 隐状态（hidden state）： $h'_t = o'_t \odot \text{tanh}(C'_t)$

其中， $x_t$ 是输入序列的第 $t$ 个时间步的向量表示， $h_t$ 是前向 LSTM 在第 $t$ 个时间步的隐状态， $h'_{t+1}$ 是后向 LSTM 在第 $t$ 个时间步的隐状态， $C_t$ 是前向 LSTM 在第 $t$ 个时间步的细胞状态， $C'_{t+1}$ 是后向 LSTM 在第 $t$ 个时间步的细胞状态。 $W$ 和 $b$ 是模型的参数， $\sigma$ 是 sigmoid 函数， $\odot$ 表示逐元素相乘。

通过双向 LSTM，我们可以获得更全面的序列信息，有助于提高模型在序列任务中的性能。

相关阅读:
使用 k3sup 一分钟快速搭建 K3s 集群
15个小技巧，助你源码阅读事半功倍
web监听器解析
100000开发的系统，执意重构钱多执念？
通关GO语言20 协作开发：模块化管理为什么能够提升研发效能？
【Prometheus】Alertmanager告警全方位讲解
驱动程序开发：I2C设备驱动
Flink Yarn Per Job - 提交应用
等级保护定级之备案！
CF1703G Good Key, Bad Key

原文地址：https://blog.csdn.net/weixin_44790306/article/details/132612405