从Lucene到Elasticsearch:全文检索实战在线阅读
会员

从Lucene到Elasticsearch:全文检索实战

姚攀
开会员,本书免费读 >

计算机网络数据库10.7万字

更新时间:2020-11-28 14:50:25 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书循序渐进介绍了信息检索、布尔检索、向量空间模型、tf-idf、BM25排序算法、Lucene架构、Lucene创建索引、Lucene查询、Lucene项目实战、Elasticsearch安装与配置、Elasticsearch插件安装、RESTAPI数据操作、映射与模板、索引别名、Elasticsearch基本和高级搜索、Elasticsearch同步数据库、Elasticsearch集群管理、项目实战等内容。阅读本书,读者能够掌握信息检索的核心概念,应用Lucene库处理全文检索业务,掌握Elasticsearch分布式搜索引擎的使用方法与技巧。本书基于Lucene6.0和Elasticsearch5.4.0进行讲解,技术先进,示例丰富,适合想学习信息检索技术的初学者和相关专业的大学生、研究生学习,也很适合大数据及云计算平台构建人员以及有一定基础的IT开发人员使用。
品牌:清华大学
上架时间:2017-12-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

姚攀
主页

同类热门书

最新上架

  • 会员
    本书基于我国深入实施网络强国和国家大数据战略的大背景,将“大语言模型”“知识图谱”“数据治理”相结合,阐述了大模型、知识图谱在智能数据治理中的应用实践,并以医疗、政务及降碳等行业为例,详细介绍了其数据治理流程及平台构建方法。书中首先阐述了大模型时代知识图谱和智能数据治理之间的协同关系,以儿童孤独症为例介绍了基于CiteSpace软件的医疗知识图谱的构建流程;其次详细阐述了基于神经网络模型的个人健康
    沈睿芳 时希杰 易成岐计算机13.1万字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等
    谢萍 周蓉 苏林萍编著计算机13.8万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新
    上海市静安区国际数据管理协会编计算机12.1万字
  • 会员
    时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。
    郑强 张伟 刘爽计算机7.6万字
  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 会员
    本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。
    白栎旸编著计算机29.9万字

同类书籍最近更新

  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋数据库14万字