得书 - 好书推荐、正版图书免费阅读
首页
书库
排行榜
VIP会员
新书
快讯
注册 | 登录
100 条"Hadoop海量数据处理:技术详解与项目实战"搜索结果
电子书
Hadoop海量数据处理:技术详解与项目实战
范东来
电子书
Hadoop海量数据处理:技术详解与项目实战(第2版)
范东来
本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运维和调优;应用篇则包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望。
电子书
Spark海量数据处理:技术详解与平台实战
范东来
在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架ApacheSpark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了StructuredStreaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
电子书
大数据处理技术基础与应用(Hadoop+Spark)
主编
本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
电子书
Hadoop大数据处理技术基础与实践(第2版)(微课版)
安俊秀 靳宇倡 郭英
本书共有12章,从Hadoop概述开始,介绍了Hadoop的安装和配置管理,并对Hadoop的生态体系架构进行了介绍,包括HDFS技术、YARN技术、MapReduce技术、海量数据库技术HBase、ZooKeeper技术等,最后对大数据实时处理技术作了简单介绍,旨在让读者了解当前其它的大数据处理技术。
电子书
Hadoop大数据开发案例教程与项目实战(在线实验+在线自测)
西普教育研究院 时允田 林雪纲
本书是一本Hadoop学习入门参考书,全书共11章,分为基础篇和提高篇两部分。基础篇包括第1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平
电子书
Hadoop大数据处理与分析教程(慕课版)
王秀友 丁小娜 刘运 主编
本书系统全面地介绍了有关Hadoop的各类知识。全书共分11章,内容包括绪论、Linux操作系统的安装、Hadoop的伪分布式安装、Hadoop集群的搭建及配置、HadoopHDFS命令、MapReduce编程入门、Hive、Sqoop、HBase、Spark的介绍与安装、综合案例——网络爬虫大数据分析。
电子书
Python核心技术实战详解
张洪朋
1.内容讲解深入。本书对Python的核心知识进行了深入剖析,循序渐进地讲解了核心功能模块的开发技术,帮助读者快速步入Python开发高手之列。2.提供更为广泛的解决方案。本书深入讲解了10个不同的主题模块,每一个主题涵盖了特定应用开发领域。在书中不仅给出了案例讲解,还包含了更多的拓展知识,能够帮助读者使用Python开发各种类型的应用程序。3.通过网站论坛形成互帮互学的朋友圈。为了方便给读者答疑,特提供了网站论坛等支持,并且随时在线与读者互动,让大家在互学互帮中形成一个良好的学习编程的氛围。
电子书
HADOOP大数据开发实战
杨力
Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
电子书
Hadoop3实战指南
孙志伟
基于全新的Hadoop3.x,主要分析Hadoop3.2.0的新特性和新功能,以企业级真实案例详细解读,带你全方位掌握大数据处理分析、分布式计算等。
电子书
Hadoop数据仓库实战
肖睿 兰伟 廖春琼
本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
电子书
基于Hadoop与Spark的大数据开发实战
肖睿 丁科 吴刚山
大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
电子书
Hadoop应用开发与案例实战(慕课版)
王建
Hadoop是目前比较流行的大数据框架之一,可使用简单的高级编程模型实现大型数据集的分布式存储和处理。本书以Hadoop的概念、集群搭建、核心组件、实战案例等为主线,较为全面地介绍了Hadoop大数据存储及处理技术的相关知识。全书共10章,前9章主要讲解Hadoop基础,内容包括初识Hadoop、Hadoop的安装与配置、高可用与联邦、分布式文件系统HDFS、集群资源管理系统YARN、分布式计算框
电子书
大数据技术基础——基于Hadoop与Spark
李瑶
将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
电子书
Java编程技术与项目实战(第2版)
王诚 梅霆 李琴 王峰 朱书眉
本书从Java语言的基本特点入手,全面介绍了Java语言的基本概念和编程方法,并扼要介绍了Java的高特。全书内容涉及Java基本语法、数据类型、异常、界面设计、小应用程序、I/O数据流、线程等内容,这些内容基本覆盖了Java的实用技术,是进一步使用Java进行技术开发的基础。
电子书
递归算法与项目实战
阿尔·斯维加特(Al
本书凝聚了作者多年的Python教学经验,内容通俗易懂,旨在剖析递归及其本质。本书不仅结合Python程序和JavaScript程序讲述编程的基础知识,还讲述如何利用递归算法计算阶乘,计算斐波那契数列,遍历树,求解迷宫问题,实现二分搜索,完成快速排序和归并排序,计算大整数乘法,计算排列和组合,解决八皇后问题等。本书不仅适合开发人员阅读,还可供计算机相关专业的师生参考。
电子书
Hadoop+Spark大数据技术
曾国荪 曹洁 编著
本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
电子书
市场导向的绿色技术创新体系研究
中国社会科学院数量经济与技术经济研究所项目组
“十四五”时期国家重点出版物出版专项规划项目。
电子书
Python深度学习与项目实战
著
本书基于Python以及两个深度学习框架Keras与TensorFlow,讲述深度学习在实际项目中的应用。本书共10章,首先介绍线性回归模型、逻辑回归模型、Softmax多分类器,然后讲述全连接神经网络、神经网络模型的优化、卷积神经网络、循环神经网络,最后讨论自编码模型、对抗生成网络、深度强化学习。
电子书
颠覆性技术创新生态路径研究
中国社会科学院和数量经济与技术经济研究所项目组
本书从创新生态的视角研究颠覆性技术的演化路径,通过颠覆性技术在科学突破、技术分叉和产业锁定的不同发展阶段,对创新主体、创新资源、创新政策、创新机制的分析,来总结不同阶段颠覆性技术创新生态的演化特点和演化规律。
电子书
Hadoop大数据开发实战(慕课版)
千锋教育高教产品研发部
本书共分11章,第1章对大数据及Hadoop进行总体介绍;第2章讲解了如何搭建Hadoop集群;第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务;第6章讲解Hadoop2.0的新特性;第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBase分布式存储系统、Flume、Saoop;第11章讲解了综合项目:电商精准营
文章导航
1
2
3
4
5
>
推荐书籍
电子书
写给大家看的Midjourney设计书
范东来
这是一本人人都能读的Midjourney设计书。全书分为4章:第1章介绍Midjourney及其社区、交互方式和按钮的作用;第2章围绕Midjourney的以文生图这一核心功能...
电子书
Hadoop海量数据处理:技术详解与项目实战(第2版)
范东来
本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HD...
电子书
Spark海量数据处理:技术详解与平台实战
范东来
在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,...
相关词语
大数据
深度学习
计算机
数据处理
Scala
spark
hadoop
海量数据
技术实战
数据分析
程序设计
数据库
开发
林子雨
机器学习
数据挖掘
大数据时代
中国经济
人工智能
意见反馈
我的书架
公众号
关注微信公众号