Zbs(专栏)

这里有我每天学习时的一些感悟

LSTM系列神经网络学习笔记

深度学习

软件开发类

发布日期: 2019-04-30

文章字数: 325

阅读时长: 1 分

阅读次数:

RNN系列学习笔记

LSTM篇

LSTM（长短期记忆网络），是SimpleRNN的扩展，可以方便地替换掉SimpleRNN
LSTM中，由上一时间步的隐藏状态 + 单元的内部记忆共同生成当前时间步地隐藏状态
为了解决梯度消失，引入了输入门i、遗忘门f、输出门o
- sigmoid函数调节这些门的输入使通过这些门后输出在0-1之间
- 不同门的作用：
  - 遗忘门：让前一时间步的部分隐藏状态通过
  - 输入门：让当前时间步的部分输入值通过
  - 输出门：让当前时间步的多少的隐藏状态传到下一时间步中
当前时间步的单元状态Ct = (C(t-1) * f) + (i * g)
当前时间步的隐藏状态ht = tanh(Ct) * o

FC-LSTM篇

GRU篇

GRU（门控循环单元），相比于LSTM，内部结构简单，训练速度快，和LSTM一样，都能够替换SimpleRNN单元
相比于LSTM，引入更新门z、重置门r
- 重置门：将当前时间步的输入与上一时间步的隐藏状态结合
- 更新门：让上一时间步的多少的隐藏状态保留下来
当前时间步的隐藏状态ht = (z * c) + ((1 - z) * h(t-1))

转载规则

《LSTM系列神经网络学习笔记》由 Clement-阿五采用知识共享署名 4.0 国际许可协议进行许可。

上一篇

前端学习笔记

前端学习笔记

这里是我在前端开发中遇到的问题

2019-04-30 软件开发类

前端

下一篇

高效搜索学习笔记

高效搜索学习笔记

这里是搜索引擎的使用方法

2019-04-30 课外学习类

高效搜索