经过今天和昨天的构思后,大致的构想的排序算法如下:
首先对新闻文本进行分词、去除停用词处理,然后与数据库中的新闻文本进行匹配,
如果匹配度较高,则可以认为是一个事件不同发展过程,
然后将这些新闻文本用时间的先后进行排序,最后输出到界面上