得书 - 好书推荐、正版图书免费阅读
首页
书库
排行榜
VIP会员
新书
快讯
注册 | 登录
100 条"Hadoop与大数据挖掘(第2版)"搜索结果
Hadoop与大数据挖掘(第2版)
王哲
本书详解了Hadoop全栈技术及其大数据挖掘方法。
电子书
医疗大数据挖掘与可视化
赵杰
普及医疗大数据挖掘与可视化技术,对提升医疗行业数据的质量与处理效率、实现数据价值的优化、推动精准医疗深入应用有着重要的作用。本书内容立足于医疗大数据的挖掘与可视化,分为总体篇、数据挖掘篇、可视化篇、应用篇等5部分,共10章,包含医疗大数据及其平台的发展概况,医疗大数据的采集、清洗、融合,医疗大数据挖掘概述、工具与方法,医疗大数据可视化概述、工具与方法,以及用实例展示医疗大数据分析平台的设计与使用方
电子书
Hadoop大数据处理技术基础与实践(第2版)(微课版)
安俊秀 靳宇倡 郭英
本书共有12章,从Hadoop概述开始,介绍了Hadoop的安装和配置管理,并对Hadoop的生态体系架构进行了介绍,包括HDFS技术、YARN技术、MapReduce技术、海量数据库技术HBase、ZooKeeper技术等,最后对大数据实时处理技术作了简单介绍,旨在让读者了解当前其它的大数据处理技术。
电子书
大数据:挖掘数据背后的真相
[日] 松本健太郎
无须数学、统计学基础,轻松掌握大数据。
电子书
Hadoop大数据处理与分析教程(慕课版)
王秀友 丁小娜 刘运 主编
本书系统全面地介绍了有关Hadoop的各类知识。全书共分11章,内容包括绪论、Linux操作系统的安装、Hadoop的伪分布式安装、Hadoop集群的搭建及配置、HadoopHDFS命令、MapReduce编程入门、Hive、Sqoop、HBase、Spark的介绍与安装、综合案例——网络爬虫大数据分析。
电子书
大数据处理技术基础与应用(Hadoop+Spark)
主编
本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
电子书
Hadoop大数据开发实战(慕课版)
千锋教育高教产品研发部
本书共分11章,第1章对大数据及Hadoop进行总体介绍;第2章讲解了如何搭建Hadoop集群;第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务;第6章讲解Hadoop2.0的新特性;第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBase分布式存储系统、Flume、Saoop;第11章讲解了综合项目:电商精准营
电子书
R语言数据分析与挖掘(微课版)
谢佳标 编著
本书由浅入深,内容丰富。全书共11章,主要内容包括第1章R语言数据分析概述、第2章R语言数据操作基础、第3章数据读写、第4章数据预处理、第5章数据的描述统计分析、第6章数据相关性分析、第7章R语言可视化基础、第8章高级可视化工具、第9章聚类分析、第10章关联规则、第11章分类及预测。
电子书
文本数据挖掘——基于R语言
黄天元
文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应
电子书
数据挖掘——基于R语言的实战
张俊妮
本书以深入浅出的语言系统地讲解了数据挖掘的框架和基本方法,主要内容包括:数据挖掘与R语言概述、数据理解、数据准备、关联规则挖掘、聚类分析、线性模型与广义线性模型、神经网络的基本方法、决策树、基于决策树的模型组合、模型评估与比较。本书使用基于R语言的数据挖掘案例贯穿全书,并辅以上机实验和习题,帮助读者熟练使用R语言进行数据挖掘。
电子书
Python数据挖掘实战(微课版)
王磊
数据挖掘旨在发现蕴含在数据中的有价值的数据模式、知识或规律,是目前非常热门的研究领域。理解数据挖掘模型的原理、方法并熟练掌握其实现技术是数据挖掘从业者必备的能力。本书从理论模型和技术实战两个角度,全面讲述数据挖掘的基本流程、模型方法、实现技术及案例应用,帮助读者系统地掌握数据挖掘的核心技术,培养读者从事数据挖掘工作的基本能力。全书共12章,主要内容包括数据探索、数据预处理、特征选择、基础分类模型及
电子书
Hadoop平台搭建与应用
米洪 张鸰
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。
电子书
Python大数据分析与挖掘实战(微课版)
黄恒秋 莫洁安 谢东津 张良均 苏颖
本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何将其应用到具体领域的方法。本书分3篇:基础篇、案例篇和提高篇。基础篇(第1章-第6章)主要介绍Python基础知识及应用于科学计算、数据处理、数据可视化、机器学习、深度学习等方面的基础知识;案例篇(第7章-第11章)主要介绍利用Python进行金融、地理信息、交通、文本分析、图像识别等领域
电子书
IBM SPSS Modeler 18.0数据挖掘权威指南
张浩彬
联袂推荐暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌本书特色内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容;讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容;突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。
电子书
Hadoop大数据开发案例教程与项目实战(在线实验+在线自测)
西普教育研究院 时允田 林雪纲
本书是一本Hadoop学习入门参考书,全书共11章,分为基础篇和提高篇两部分。基础篇包括第1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平
电子书
Python数据分析、挖掘与可视化(慕课版)
董付国
1.Python零基础,轻松学会数据分析与挖掘2.编码、分析、挖掘,数据分析全流程一次搞定3.微课视频,扫码即可观看,重点难点逐个击破本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。
电子书
掘金大数据:电信数据金矿详解、挖掘及应用
程新洲
本书带你了解电信运营商数据的全貌,详解资源特征、分析体系,涵盖交通金融旅游广告气象餐饮娱乐政务等案例。
电子书
基于数据挖掘的软件缺陷预测技术
马樱
本专著主要基于软件领域数据的特性和预测模型的不同应用场景,对软件缺陷预测前言的若干关键技术进行了研究和总结。主要内容包括迁移学习环境下的缺陷预测技术,半监督环境下的缺陷预测技术,主动学习环境下的缺陷预测技术,基于核理论的缺陷预测技术,所应用的理论、算法及应用成果的介绍和展示。
电子书
大数据Hadoop 3.X分布式处理实战
吴章勇 杨强
本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
电子书
地球科学中的大数据分析与挖掘算法手册
李国庆 刘莹 庞禄申 等
本书以数据分析与挖掘思想为主线,深入剖析关联、分类、回归、聚类、顺序模式挖掘、深度学习以及异常检测等算法的原理、实现、相似算法、改进思路以及地学案例,具有很强的系统性、完整性以及落地性,可以作为各行业特别是地球科学领域中希望驾驭大数据并发掘其价值的科研人员和工程人员的参考书,读者既可以通过本书系统掌握大数据分析挖掘的思想方法,也可以将其作为算法工具书查阅。
电子书
基于大数据挖掘的主动式运营监测体系研究与应用
等
本书是对国网浙江省电力有限公司基于大数据挖掘技术的主动式运营监测体系建设研究与实践工作的总结,包括大数据应用与运营监测业务发展趋势与现状、基于大数据挖掘技术的主动式运营监测体系的介绍、运营监测业务主题框架与指标关联库等内容。本书可作为电网企业运营管理人员的工作参考书。
文章导航
<
1
2
3
4
5
>
推荐书籍
电子书
肿瘤病理知识问答
步宏
本书的目的主要是提供给公众一些肿瘤病理的科普知识,用问答的形式解释一些患者常常提出的疑问。包括了总论和各论部分,总论主要介绍肿瘤病理的共性问题,例如:解释肿瘤的性质、如何解读病...
电子书
从前哪,后来呀--漫话医史
王哲
王哲(笔名京虎子)作品,带你梳理医学发展的历程。
相关词语
大数据
数据库
科技关键词
计算机
科技
计算机科学
数据分析
数据挖掘
建模
SPSS
Modeler
运营商
干货满满
打开新世界的大门
案例丰富
值得阅读
实用宝典
院士推荐
意见反馈
我的书架
公众号
关注微信公众号