先聊聊潜变量自回归模型
使用潜变量h_t总结过去信息
此时的h_t与h_t-1和x_t-1相关,x_t与h_t和x_t-1相关
循环神经网络
Whh存放所有的时序信息
此时h_t与h_t-1和x_t-1相关
使用循环神经网络的语言模型
输入"你",计算生成隐变量,通过隐变量预测输出"好"
预测x_t的时候,是没有看到x_t的,即输出要在当前输入之前
困惑度(perplexity)
梯度剪裁
RNN应用
总结
1.循环神经网络的输出取决于当下输入和前一时间的隐变量
2.应用到语言模型中时,循环神经网络根据当前词预测下一时刻词
3.通常使用困惑度来衡量语言模型的好坏