今天学习一篇挺有意思的文章《写下记忆:理解、推导、扩展LSTM》(英文),从 RNN 的原理开始讲起,并讲述 RNN 为什么理论上很美好,实践起来要出问题,以及各种问题是怎么被解决的,从而诞生了 LSTM 。
不过似乎作者隐藏了他的私人信息,不知道是谁,本来还想看看是哪国人,因为感觉不是英语母语。:P
这回应该不会忘记为什么 Basic LSTM 的模型是那样的了,因为都是有原因的,虽然并不能全懂。
Posted by : ()
今天学习一篇挺有意思的文章《写下记忆:理解、推导、扩展LSTM》(英文),从 RNN 的原理开始讲起,并讲述 RNN 为什么理论上很美好,实践起来要出问题,以及各种问题是怎么被解决的,从而诞生了 LSTM 。
不过似乎作者隐藏了他的私人信息,不知道是谁,本来还想看看是哪国人,因为感觉不是英语母语。:P
这回应该不会忘记为什么 Basic LSTM 的模型是那样的了,因为都是有原因的,虽然并不能全懂。