various Sequence to Sequence Model - 润新知

various Sequence to Sequence Model

1. A basic LSTM encoder-decoder.

Encoder:

X 是 input sentence. C 是encoder 产生的最后一次的hidden state, 记作 Context Vector.

[C=LSTM(X).]

Decoder:

每次的输出值就是下一次的输入值, 第一次的输入值就是 encoder 产生的 Context Vector. Encoder最后输出的 hidden state 通常用来初始化 Decoder的 $y_{0}$.

基本公式:

[y_{0} = LSTM(s_{0}, C);]

$C$ 就是encoder 产生的 context vector.
[y_t = LSTM(s_{t-1}, y_{t-1});]

$s$ 是LSTM的 hidden state 状态 LSTM ($h$ and $c$).

[s_t=[h_t,c_t]]

2. A basic LSTM encoder-decoder with peek.

Encoder部分与上面相同。Decoder部分，每次的输入值为${s_{t-1},y_{t-1},C}$. 这边的peek value就是每次迭代的时候都将 Context Vector作为输入。

初始化： [y(0) = LSTM(s0, C, C)]
每次的迭代公式: [y(t) = LSTM(s(t-1), y(t-1), C)]
相关阅读:
C#_获取汉字拼音
 C#中汉字轻松得到拼音全文类
 Mvc利用淘宝Kissy uploader实现图片批量上传附带瀑布流的照片墙
 ASP.NET的用户控件
 js获取url参数值
 常用编程软件下载地址
 Asp.net 程序优化js，css合并与压缩
 做BS开发，你应该知道的一些东西
 c#.net常用函数和方法集
 C# Lambda Expressions 简介
原文地址：https://www.cnblogs.com/ZJUT-jiangnan/p/5414732.html

Copyright © 2020-2023 润新知