位置编码（PE）是如何在Transformers中发挥作用的

位置编码（PE）是如何在Transformers中发挥作用的

在人类的语言中，单词的顺序和它们在句子中的位置是非常重要的。如果单词被重新排序后整个句子的意思就会改变，甚至可能变得毫无意义。

Transformers不像LSTM具有处理序列排序的内置机制，它将序列中的每个单词视为彼此独立。所以使用位置编码来保留有关句子中单词顺序的信息。

什么是位置编码？

位置编码（Positional encoding）可以告诉Transformers模型一个实体/单词在序列中的位置或位置，这样就为每个位置分配一个唯一的表示。虽然最简单的方法是使用索引值来表示位置，但这对于长序列来说，索引值会变得很大，这样就会产生很多的问题。

位置编码将每个位置/索引都映射到一个向量。所以位置编码层的输出是一个矩阵，其中矩阵中的每一行是序列中的编码字与其位置信息的和。

如下图所示为仅对位置信息进行编码的矩阵示例。

Transformers 中的位置编码层

假设我们有一个长度为 L 的输入序列，并且我们需要对象在该序列中的位置。位置编码由不同频率的正弦和余弦函数给出：

d：输出嵌入空间的维度

pos：输入序列中的单词位置，0≤pos≤L/2

i：用于映射到列索引其中0≤i<d/2，并且I 的单个值还会映射到正弦和余弦函数

在上面的表达式中，我们可以看到偶数位置对使用正弦函数，奇数位置使用余弦函数。

从头编写位置编码矩阵

下面是一小段使用NumPy实现位置编码的Python代码。代码经过简化，便于理解位置编码。

完整文章：

https://avoid.overfit.cn/post/dc84ff7287e540b48da2eadfabd306bc
相关阅读:
jQuery---三组基本动画 show hide
jQuery---表格全选案例
 jQuery---prop方法和表格全选案例
 jQuery---美女相册案例
 jQuery---属性操作
 jQuery---tab栏切换
 jQuery---Class操作
 jQuery---CSS操作
 jQuery---第一部分复习
 DirBuste 使用
原文地址：https://www.cnblogs.com/deephub/p/16399965.html

位置编码（PE）是如何在Transformers中发挥作用的

什么是位置编码？

Transformers 中的位置编码层

从头编写位置编码矩阵