在自然语言中,我们会把每个单词转换成一个向量。
如果有一个句子,每个句子由80个单词,每个单词编码为一个长度为5的向量的话,那么整个句子
的形状为[1,80,5]。
举个例子:
In:(X_trian.Y_train),X_test,y_test)=keras.datasets.imdb.load_data(num_words=10000) In:x_train=keras.preprocessing.sequence.pad_sequences(X_train,maxlen=80) In:print(x_train.shape) Out:TensorShape([25000,80])
#25000条评论,每个评论最大长度为80个单词
In:emd=embedding(x_train)#将训练样本做embedding,每个单词对应一个100维的向量
In:emb.shape
Out:TensorShape([25000,80,100])
In:out=rnn(emb[:4])#使用rnn
In:out.shape
Out:TensorShape([4,256])