最近在分析知乎的‘问题’文本所属的话题,用python提取,实现了LSTM和LDA模型在这个方面的应用,但是效果不是很理想,一个是这些文本属于短文本,另外用来分析的文本本身包含多个领域的问题,并且数量较少,很有可能只有几条。所以最后得到的话题模型即使分了很多主题仍然在同一个主题会出现多种词汇。
尝试寻找短文本分析话题模型有优势的算法。。。。。。。。。。未完待续
最近在分析知乎的‘问题’文本所属的话题,用python提取,实现了LSTM和LDA模型在这个方面的应用,但是效果不是很理想,一个是这些文本属于短文本,另外用来分析的文本本身包含多个领域的问题,并且数量较少,很有可能只有几条。所以最后得到的话题模型即使分了很多主题仍然在同一个主题会出现多种词汇。
尝试寻找短文本分析话题模型有优势的算法。。。。。。。。。。未完待续