分析步骤:
第一步:将one-hot形式分词结果作为输入([0,1,0....,0]的列向量的V*1维词向量),与投影矩阵C(D*V维度)相乘,得到D*1维的向量
第2步:将第一步的输出结果做拼接,作为隐藏层的输入。
第3步:经过一个全连接的神经网络,经过激励层,再softmax,得到该词出现的概率矩阵和互熵损失。不断训练输出结果,改善权重矩阵C(可以发现C的列向量就是该词的词向量表现形式)
分析步骤:
第一步:将one-hot形式分词结果作为输入([0,1,0....,0]的列向量的V*1维词向量),与投影矩阵C(D*V维度)相乘,得到D*1维的向量
第2步:将第一步的输出结果做拼接,作为隐藏层的输入。
第3步:经过一个全连接的神经网络,经过激励层,再softmax,得到该词出现的概率矩阵和互熵损失。不断训练输出结果,改善权重矩阵C(可以发现C的列向量就是该词的词向量表现形式)