Elasticsearch大数据搜索引擎

Elasticsearch大数据搜索引擎

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

《Elasticsearch大数据搜索引擎》深入解析应用与开发。

内容简介

《Elasticsearch大数据搜索引擎》一书介绍了Elasticsearch大数据搜索引擎的常见应用场景、原理与深入开发,主要包括支持中英文文本分析的自然语言处理搜索、问答式搜索和Elastic栈日志分析。

章节目录

封面

版权页

前言

目录

第1章 使用Elasticsearch

1.1 基本概念

1.2 安装

1.3 搜索集群

1.4 创建索引

1.5 使用Java客户端接口

1.5.1 创建索引

1.5.2 增加、删除与修改数据

1.5.3 分析器

1.5.4 数据导入

1.5.5 通过摄取快速导入数据

1.5.6 索引库结构

1.5.7 查询

1.5.8 区间查询

1.5.9 排序

1.5.10 分布式搜索

1.5.11 过滤器

1.5.12 高亮显示

1.5.13 分页

1.5.14 通过聚合实现分组查询

1.5.15 文本列的聚合

1.5.16 遍历数据

1.5.17 索引文档

1.5.18 Percolate

1.6 RESTClient

1.6.1 使用摄取

1.6.2 代码实现摄取

1.7 使用Jest

1.8 Python客户端

1.9 Scala客户端

1.10 PHP客户端

1.11 SQL支持

1.12 本章小结

第2章 开发插件

2.1 搜索中文

2.1.1 中文分词原理

2.1.2 中文分词插件原理

2.1.3 开发中文分词插件

2.1.4 中文AnalyzerProvider

2.1.5 字词混合索引

2.2 搜索英文

2.2.1 句子切分

2.2.2 标注词性

2.3 使用测试套件

2.4 本章小结

第3章 管理搜索集群

3.1 节点类型

3.2 管理集群

3.3 写入权限控制

3.4 使用X-Pack

3.5 快照

3.6 Zen发现机制

3.7 联合搜索

3.8 缓存

3.9 本章小结

第4章 源码分析

4.1 Lucene源码分析

4.1.1 Ivy管理依赖项

4.1.2 源码结构介绍

4.2 Gradle

4.3 Guice

4.4 Joda-Time

4.5 Transport

4.6 线程池

4.7 模块

4.8 Netty

4.9 分布式

4.10 本章小结

第5章 搜索相关性

5.1 BM25检索模型

5.1.1 使用BM25检索模型

5.1.2 参数调优

5.2 学习评分

5.2.1 基本原理

5.2.2 准备数据

5.2.3 Elasticsearch学习排名

5.3 本章小结

第6章 搜索引擎用户界面

6.1 JSP实现搜索界面

6.1.1 用于显示搜索结果的自定义标签

6.1.2 使用Listlib

6.1.3 实现翻页

6.2 使用Spring实现的搜索界面

6.2.1 实现REST搜索界面

6.2.2 REST API中的HTTP PUT

6.2.3 Spring-data-elasticsearch

6.2.4 Spring HATEOAS

6.3 实现搜索接口

6.3.1 编码识别

6.3.2 布尔搜索

6.3.3 搜索结果排序

6.4 实现相似文档搜索

6.5 实现AJAX搜索联想词

6.5.1 估计查询词的文档频率

6.5.2 搜索联想词总体结构

6.5.3 服务器端处理

6.5.4 浏览器端处理

6.5.5 拼音提示

6.5.6 部署总结

6.5.7 Suggester

6.6 推荐搜索词

6.6.1 挖掘相关搜索词

6.6.2 使用多线程计算相关搜索词

6.7 查询意图理解

6.7.1 拼音搜索

6.7.2 无结果处理

6.8 集成其他功能

6.8.1 拼写检查

6.8.2 分类统计

6.8.3 相关搜索

6.8.4 再次查找

6.8.5 搜索日志

6.9 查询分析

6.9.1 历史搜索词记录

6.9.2 日志信息过滤

6.9.3 信息统计

6.9.4 挖掘日志信息

6.9.5 查询词意图分析

6.10 部署网站

6.10.1 部署到Web服务器

6.10.2 防止攻击

6.11 本章小结

第7章 OCR文字识别

7.1 Tesseract

7.2 使用TensorFlow识别文字

7.3 OpenCV

7.3.1 预处理

7.3.2 文字区域提取

7.3.3 纠正偏斜

7.3.4 Linux环境支持

7.4 JavaCV

7.5 本章小结

第8章 问答式搜索

8.1 生成表示语义的代码

8.2 信息整合

8.2.1 实体对齐

8.2.2 编辑距离

8.2.3 Jaro-Winkler距离

8.2.4 比较器

8.2.5 Cleaner

8.2.6 运行过程

8.2.7 遗传算法调整参数

8.3 自动问答

8.3.1 问句处理器

8.3.2 自动发现答案

8.4 本章小结

第9章 Elastic系统监控

9.1 Logstash

9.1.1 使用Logstash

9.1.2 插件

9.1.3 数据库输入插件

9.2 Filebeat

9.3 消息过期

9.4 Kibana

9.5 Flume

9.6 Kafka

9.7 Graylog

9.8 物联网数据

9.9 本章小结

反侵权盗版声明

Elasticsearch大数据搜索引擎是2018年由电子工业出版社出版,作者罗刚。

得书感谢您对《Elasticsearch大数据搜索引擎》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
图解数据科学 电子书
解码数据科学的奥秘,驱动业务决策和创新。
大数据存储技术 电子书
本书由浅入深,层层深入,从基本原理着手,逐步过渡到大数据存储的新技术的发展。
数据化运营管理 电子书
网店数据化运营与营销。
趣学数据结构 电子书
适读人群 :本书可作为程序员的学习用书,也适合没有太多编程经验但又对数据结构有强烈兴趣的初学者使用,同时也可作为高等院校计算机、数学及相关专业的师生用书,或学科竞赛的辅导用书和培训学校的教材。   (1)完美图解 丰富实例,复杂问题简单化   为基本操作配以图解,用数据结构解决生活中的实际问题,学习过程更加轻松有趣。   (2)原理分析 实战演练,真正地学以致用   通俗化讲解基础知识,在实战中体会数据结构的设计和操作,锻炼独立思考的能力。   (3)配套代码 在线答疑,为学习保驾护航   提供书中的范例程序源代码、练习题以及答案解析,并在博客和QQ群中答疑解惑。
云计算与大数据 电子书
本书抽丝剥茧地讲述了云计算简史、大数据的前世今生,纠正了一些时下被“误导”的观点,分析了大数据与Hadoop的关系、云计算与大数据的关系,从开源vs.闭源的角度阐释了整个业界的软件定义趋势、商用硬件趋势并预言了硬件回归的必然趋势,最后用案例讲解了云计算或大数据系统体系架构的设计与实现。