【王树森】RNN模型与NLP应用(9/9)：Self-Attention（个人向笔记）

40 阅读 0 评论 0 点赞

前言

上节课讲到的attention用到了Seq2Seq模型上，而Attention并不局限与Seq2Seq模型，而是可以用在所有RNN模型上。Self-attention在原论文中用到了LSTM上，而本节课做了简单的替换：换成了 Simple RNN。

SimpleRNN + Self-Attention

下面的 $h_0$ 为初始状态，是一个全0向量

无 Self-Attention 的更新状态：
有 Self-Attention 的更新状态：把 $h_0$ 换成了 $c_0$
接下来需要计算 $c_1$ ，上节课提到 $c$ 需要根据 $h$ 来计算，而此时 $h_0$ 为全 0 向量，所以 $c_1$ 就等于 $h_1$ ：
$h_2$ 同理：
相关性与 $c_2$ 的计算需要同时包含 $h_2$ ：后面的过程类似

在这里插入图片描述

Summary

Self-Attention能很大程度上解决RNN遗忘的问题
Self-Attenion和Attention的原理是一样的，但是Self-Attention不局限于Seq2Seq模型上，而是可以应用到所有RNN上
除了避免遗忘，Self-Attention还能帮助关注相关的信息

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

转载请注明出处：免费源码网-免费的源码资源网站 » 【王树森】RNN模型与NLP应用(9/9)：Self-Attention（个人向笔记）

点赞(0) 打赏

本文分类：文章资讯
本文标签：【王树森】RNN模型与NLP应用(9/9)：Self-Attention（个人向笔记）
浏览次数：40 次浏览
本文链接：https://freeymw.com/article/25108.html

上一篇 > Pycharm module ‘serial‘ has no attribute ‘Serial‘
下一篇 > C#语言实现最小二乘法算法

评论列表共有 0 条评论

暂无评论

发表评论取消回复

微信公众账号

微信扫一扫加关注

发表
评论返回
顶部