• Daily Scrum (2015/10/29)


      今天晚上我们学霸项目的三个小组在一起开会,讨论如何能在后期使我们三个项目更好地结合在一起。为了三个小组的能够同时工作,不出现某一小组因需要其他小组成果而停滞的情况,我们决定围绕lucene,solr,nutch,hadoop进行开发。

      这并不等于我们之前的工作白费了,相反地,我们前期的工作恰好给后续的开发工作提供了基础。前两个星期的时间,我们组的成员查询了相关资料并对上一届团队的代码进行了修改,对爬虫的认识大大加深,这对我们的接下来的开发都是有利的。

      这一周剩下的时间就是让我们的组员尽快的熟悉这几个开发工具,以下给出了一些简单的介绍:

      apache lucene是apache下一个著名的开源搜索引擎内核,基于Java技术,处理索引,拼写检查,点击高亮和其他分析,分词等技术。

      nutch和solr原来都是lucene下的子项目。但后来nutch独立成为独立项目。nutch是2004年由俄勒冈州立大学开源实验室模仿google搜索引擎创立的开源搜索引擎,后归于apache旗下。nutch主要完成抓取,提取内容等工作。

      solr则是基于lucene的搜索界面。提供XML/HTTP 和 JSON/Python/Ruby API,提供搜索入口,点击高亮,缓存,备份和管理界面。

      hadoop原来是nutch下的分布式任务子项目,现在也成为apache下的顶级项目。nutch可以利用hadoop进行分布式多任务抓取和分析存储工作。

    所以,lucene,nutch,solr,hadoop一起工作,是能完成一个中型的搜索引擎工作的。

    成员 今明两日任务
    全体成员 熟悉lucene,solr,nutch,hadoop工具开发

      我们的PM会尽快在TFS上更新工作,以下是我们今日的燃尽图:

      

  • 相关阅读:
    Visual Studio Error C4335 检测到Mac文件格式:请将源文件转换为DOS格式或UNIX格式
    Visual Studio 2017在编译时出现错误E2512:功能测试宏的参数必须是简单标识符
    PCL 注意事项
    Realsense D435i Winodws和Linux开发环境配置
    Hybrid Astar
    Git 分支管理
    Visula Studio 安装 Visual Assist
    Typora 设置字体颜色
    Mac上使用Charles+Chrome
    linux Kill 命令
  • 原文地址:https://www.cnblogs.com/cnmxfd/p/4922237.html
Copyright © 2020-2023  润新知