这几天小伙伴们都在努力,研究出不少改进方案并加以设计和实施了,分词算法的优化进度可观,而其他的任务在改进的过程中产生了些问题,对于之前代码的设计感到疑惑,我们找到了上届的学长们咨询,他们也给出了不少建议。
目前产生了一些新的问题与阻碍:
1.许多实用的算法源代码并不公开,获取方式有限,可远观不可亵玩。
2.在上届代码的细节方面产生了一些问题和疑惑,需要和学长们交流。
Member |
Today’s task |
Next task |
林豪森 |
确认各实现方案的正确性,辅助设计 |
确保设计的实现不改变整体架构 |
宋天舒 |
设计优化的分词算法 |
实现优化后的分词算法 |
张迎春 |
设计优化的分词算法 |
实现优化后的分词算法 |
黄漠源 |
设计优化的提关键词算法 |
实现优化的提关键词算法 |
黄敬博 |
设计优化的提关键词算法 |
实现优化的提关键词算法 |
刘翔宇 |
从文档中提取数据的处理 |
提取文档数据的实现 |
叶露婷 |
文档数据分析 |
提取文档数据的实现 |
旦增晋美 |
实现数据保存表 |
数据库完善更新 |
进入了设计开发阶段,估计这是比较漫长的一段路程。希望能在apec的假期中完成开发,这样能及早测试发现问题并作出修改。
燃尽图如下: