LSTM长短期记忆网络:为什么这个门控机制统治了序列建模二十年

引言:序列建模的至暗时刻 1997年,当Sepp Hochreiter和Jürgen Schmidhuber在《Neural Computation》期刊上发表那篇改变深度学习历史的论文时,他们解决的是一个困扰研究者多年的根本性问题:循环神经网络(RNN)无法学习长期依赖。 ...

17 min · 8093 words