1:lucene的介绍
全文检索引擎工具包。作用:使用lucene进行全文检索 。可以直接运行。
什么是全文检索。全文检索的场景,搜索引擎,搜索商品。
站内搜索,只会搜索自己站内的资源
全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索的文档的目的
这种先建立索引,在对索引进行搜索的过程就叫全文检索。
索引就类似于书籍的目录,目标文档就相当于书籍中的内容
搜索书籍中的内容,如果不通过目录,很费劲
其实,全文检索就是相当于给书籍编写目录。
2:Lucene实现全文检索的流程
采集数据---》创建索引----》用户查询---》搜索索引---》展示显示
全文检索的流程:索引流程和搜索流程
3:入门程序
a :索引
b :搜索
4:field域
搜索流程
为啥要采集数据。如何采集数据,使用http协议,使用网络爬虫采集。数据库中的数据使用jdbc采集。文件系统中的数据,使用IO流读取文件中的内容。
数据的分类:01非结构化数据02结构化数据
对结构化数据的搜索使用mysql搜索
对非结构化数据的搜索使用
爬虫技术
5:索引维护 入门程序之创建索引。
6:搜索
7:相关度排序
8:中文分词器