LSTMs 长短期记忆网络系列
RNN的长期依赖问题 什么是长期依赖? 长期依赖是指当前系统的状态, 可能受很长时间之前系统状态的影响 ,是RNN中无法解决的一个问题。 如果从 (1) “ 这块冰糖味道真?” 来预测下一个词,是很容易得出“ 甜 ”结果的。但是如果有这么一句话, (2) “ 他吃了一口菜,被辣的流出了眼泪,满脸通红。旁边的人赶紧给他倒了一杯凉水,他咕咚咕咚喝了两口,才逐渐恢复正常。他气愤地说道:这个菜味道真? ” ,让你从这句话来预测下一个词,确实很难预测的。因为出现了长期依赖, 预测结果要依赖于很长时间之前的信息。 RNN的长期依赖问题 RNN 是包含循环的网络,允许信息的持久化。 预测问题(1): 相关的信息和预测的词位置之间的间隔是非常小时,RNN 可以学会使用先前的信息。 预测问题(2): 在这个间隔不断增大时,RNN 会丧失学习到连接如此远的信息的能力。 Why? 理论上,通过调整参数,RNN是可以学习到时间久远的信息的。 Bengio, et al. (1994) 但是,实践中的结论是,RNN很难学习到这种信息的。 RNN 会丧失学习时间价格较大的信息的能力, 导致长期记忆失效。 RNN中,考虑每个连接的权重,如果abs(W)<1,逐层迭代,将写成含权重的表达式,那么前面的系数会 连乘多个权重 。当层与层之间距离非常远时, 较前层传递到当前层是非常小的一个数 ,可以认为对几乎不产生影响