Contextualized Word EmbeddingELMO/BERT/GPT

Contextualized Word EmbeddingELMO/BERT/GPT

参考这篇文章：

https://www.cnblogs.com/dogecheng/p/11615750.html

我们期望每一个 word token 都有一个 embedding。每个 word token 的 embedding 依赖于它的上下文。这种方法叫做 Contextualized Word Embedding。

BERT 是 Transformer 的 Encoder，GPT则是 Transformer 的 Decoder。GPT 输入一些词汇，预测接下来的词汇。其计算过程如下图所示。

先记到这里吧，其他好像也没有特别需要记录的。
相关阅读:
sina sae搭建wordpress数据库配置
 Daper返回DataTable
第4章 jQuery中的事件和动画
 第3章 ,jQuery中的DOM操作
 第2章 jQuery选择器
 第1章认识jQuery
MyBatis基本查询、条件查询、查询排序
 《Head First Servlets & JSP》-13-过滤器和包装器
 《Head First Servlets & JSP》-12-Web应用安全
 《Head First Servlets & JSP》-11-Web应用部署
原文地址：https://www.cnblogs.com/charlesblc/p/15902438.html