概率数据结构与算法:面向大数据应用

概率数据结构与算法:面向大数据应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书重点介绍大数据概率数据结构与算法的核心思想和重要应用领域。

内容简介

本书共6章。每章都专门针对大数据应用中的一个特定问题,首先对该问题进行深入的解释,然后介绍可用于有效解决该问题的数据结构和算法。

第1章简要概述了概率数据结构中广泛使用的散列函数和散列表;第2章专门介绍近似成员查询,这是概率数据结构最著名的用例之一;第3章讨论了用来辅助估算元素基数的概率数据结构;第4章和第5章讨论流式场景下与频数和排序相关的重要指标的计算;第6章包含用于解决相似性问题的数据结构和算法,尤其是近邻搜索问题。

作者简介

作者安德烈·加霍夫,数学家和软件工程师,拥有数学建模和数值方法方向的博士学位。他曾在乌克兰的哈尔科夫国立大学计算机科学学院任教多年,目前是Ferret go GmbH的一名软件从业人员。后入职德国领先的社区审核、自动化和分析公司。他的研究兴趣包括机器学习、流数据挖掘和数据分析。

章节目录

版权信息

作者简介

译者简介

译者序

前言

第1章 散列

1.1 加密散列函数

1.2 非加密散列函数

1.3 散列表

1.4 总结

本章参考文献

第2章 成员查询

2.1 布隆过滤器

2.2 计数布隆过滤器

2.3 商数过滤器

2.4 布谷过滤器

2.5 总结

本章参考文献

第3章 基数

3.1 线性计数

3.2 概率计数

3.3 LogLog和HyperLogLog

3.4 总结

本章参考文献

第4章 频数

4.1 多数投票算法

4.2 频繁算法

4.3 Count Sketch

4.4 Count-Min Sketch

4.5 总结

本章参考文献

第5章 排序

5.1 随机采样

5.2 q-摘要

5.3 t-摘要

5.4 总结

本章参考文献

第6章 相似性

6.1 局部敏感散列

6.2 MinHash

6.3 SimHash

6.4 总结

本章参考文献

概率数据结构与算法:面向大数据应用是2022年由机械工业出版社华章分社出版,作者[乌克兰] 安德烈·加霍夫。

得书感谢您对《概率数据结构与算法:面向大数据应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
数据结构(Java语言描述) 电子书
提供大量应用案例、有针对性的实训任务和综合项目实训,既方便教学又方便自学。
数据结构习题解析与实验指导 电子书
本书主要内容包括上下两篇,上篇为习题及习题解析,下篇为实验指导。每篇又分为几章内容,分别为:第1章 绪论、第2章 线性表、第3章栈和队列、第4章串、数组和广义表、第5章 树和二叉树、第6章图、第7章查找、第8章 排序。
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
大数据技术与应用基础 电子书
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读
数据结构(C语言版)(第2版) 电子书
适读人群 :普通高校电子信息大类本科生学习、考研,同时也适合零售和培训。   采用“案例驱动”的编写模式。书中结合实际应用,将各章按照“案例引入——数据结构及其操作——案例分析与实现”的案例驱动思路来展开。每章使用一个有趣的“问题案例”开头,由该案例逐步引入新的数据结构,然后给出该数据结构的存储表示及各种基本操作的实现,之后进一步分析此案例,最终利用该数据结构来实现此案例。   算法讲解更加细致。新版教材中对每个算法思想进行详细阐述,将用文字描述的算法步骤与用类C语言表述的算法描述一一对应。   优化教材内容。参考计算机专业全新的全国统考考研大纲,增加了大纲近两年新增的考点内容,如分块查找、外部排序等,有助于考研学生复习备考使用。