- 从Lucene到Elasticsearch:全文检索实战
- 姚攀
- 229字
- 2020-11-28 14:50:07
3.2 架构设计
文件检索系统的架构设计如图3-2所示,简单概括如下:文件存储系统中存放了不同类型的文件,后台通过程序提取出文件名和文档内容,使用Lucene对文件名和文档内容进行索引,前端对用户提供查询接口,用户提交关键词之后检索索引库,返回匹配文档至前端页面。
![](https://epubservercos.yuewen.com/5DAECD/15367243604185606/epubprivate/OEBPS/Images/Figure-0074-0066.jpg?sign=1739592440-Qe5pSz9GZ31Wgrq0Fgbz8bViw5TlNwjv-0-5ca634d523e0bf7378b310610f9099b4)
图3-2 文件检索系统的架构设计图
按照图3-2所示的系统架构图,准备一些测试文档作为要检索的文件系统,使用开源工具Tika完成信息抽取,使用Lucene构建索引,使用JSP页面给用户提供查询接口,使用Servlet完成搜索,构建类百度文库的小型文件检索系统。